AlphaGo之父:下個(gè)版本會(huì)讓電腦從零開始學(xué)圍棋
- 來(lái)源:互聯(lián)網(wǎng)
- 作者:newtype2001
- 編輯:newtype2001
問(wèn):這些或許是唾手可得的果實(shí)。你是否會(huì)將人工智能的技術(shù)進(jìn)步應(yīng)用在今天的游戲中?
哈薩比斯:我認(rèn)為將會(huì)很有趣。實(shí)際上,近期EA也有人聯(lián)系我,我們應(yīng)該去做這件事。但現(xiàn)在的情況是,我們有很多事情可做!這些技術(shù)通用性很強(qiáng),我愿意去做這件事,但問(wèn)題是人的精力有限。目前,我們的關(guān)注重點(diǎn)是醫(yī)療和推薦系統(tǒng),以及諸如此類的應(yīng)用。但或許未來(lái)我們會(huì)去做游戲,這對(duì)我來(lái)說(shuō)這形成一個(gè)閉環(huán)。實(shí)際上,在游戲中設(shè)計(jì)自適應(yīng)的人工智能對(duì)手將創(chuàng)造一個(gè)巨大的市場(chǎng)。我認(rèn)為,相對(duì)于為每款游戲開發(fā)新的人工智能技術(shù),開發(fā)者會(huì)更喜歡這種模式?;蛟S他們只需要針對(duì)每款游戲去訓(xùn)練通用的人工智能即可。
問(wèn):我可以想象,當(dāng)你在家里打電子游戲時(shí),相對(duì)于我,游戲中虛擬人物的表現(xiàn)會(huì)更讓你失望。
哈薩比斯:是的,大型多人游戲和其他類似游戲總是令我感覺失望。我從來(lái)都無(wú)法真正融入游戲,因?yàn)樘摂M人物看起來(lái)傻傻的。他們沒有記憶,不會(huì)改變,也與環(huán)境無(wú)關(guān)。如果有學(xué)習(xí)型人工智能,那么游戲質(zhì)量將提升至新的水平。
關(guān)于醫(yī)療
問(wèn):本周你談到,人工智能未來(lái)的主要用途將是醫(yī)療、智能助理和機(jī)器人。能否詳細(xì)談?wù)?。例如關(guān)于醫(yī)療,IBM“沃森”已經(jīng)在癌癥診斷領(lǐng)域有過(guò)一些嘗試。那么,DeepMind能帶來(lái)些什么?
哈薩比斯:目前還處于起步階段。幾周前,我們宣布了與NHS(英國(guó)國(guó)民醫(yī)療系統(tǒng))的合作,但我們最開始將建設(shè)支持機(jī)器學(xué)習(xí)的平臺(tái)。根據(jù)我的理解,沃森與我們所做的工作有很大不同,更像是一個(gè)專家系統(tǒng)。因此,這是一種類型完全不同的人工智能。這類人工智能所做的是基于醫(yī)療圖像的診斷,或是追蹤生命指標(biāo),以及長(zhǎng)期的“量化自我”,幫助人們養(yǎng)成健康的生活習(xí)慣。我認(rèn)為,強(qiáng)化學(xué)習(xí)非常適合這一領(lǐng)域。
問(wèn):關(guān)于與NHS的合作,你們宣布了一款應(yīng)用,但這款應(yīng)用似乎沒有用到太多的人工智能和機(jī)器學(xué)習(xí)技術(shù)。背后的考量是什么?NHS為何要用你們的應(yīng)用,而不是其他公司的軟件?
哈薩比斯:據(jù)我所知,NHS的軟件相當(dāng)糟糕,因此我們要做的第一步就是讓軟件具備21世紀(jì)的設(shè)計(jì)。這些軟件并不存在于移動(dòng)端,與用戶目前習(xí)以為常的產(chǎn)品也很不相同。我認(rèn)為,這令醫(yī)生和護(hù)士們感到失望,也妨礙了他們的工作進(jìn)度。因此,第一步是幫他們獲得更實(shí)用的工具,例如可視化和基本的數(shù)據(jù)統(tǒng)計(jì)。我們將開發(fā)這樣的工具,看看我們的狀況,隨后再引入更復(fù)雜的機(jī)器學(xué)習(xí)技術(shù)。
問(wèn):銷售難度會(huì)有多大?很明顯,在英國(guó),醫(yī)療資金是一個(gè)持續(xù)討論的話題。
哈薩比斯:我們目前是免費(fèi)去做,因此推廣難度不大。這與大部分軟件公司都有所不同。目前,開發(fā)這類軟件的大多是跨國(guó)公司,因此它們并不是非常關(guān)心用戶。我們的開發(fā)方式更類似于創(chuàng)業(yè)公司,你會(huì)去傾聽用戶的反饋,并與他們共同設(shè)計(jì)。
關(guān)于智能手機(jī)助手
問(wèn):讓我們來(lái)談?wù)勚悄苁謾C(jī)助手。我看到你在演講幻燈片中貼出了一張來(lái)自電影《她》的劇照。這代表了最終目標(biāo)?
哈薩比斯:不是這樣。我的意思是,電影《她》是主流人群看待智能助手的一種簡(jiǎn)單方式。我們需要智能手機(jī)助手變得更智能,更好地理解環(huán)境,并對(duì)你正在從事的工作有更深的理解。目前,大部分這類系統(tǒng)還很簡(jiǎn)單:一旦你脫開預(yù)設(shè)的模板,它們就變得毫無(wú)用處。因此關(guān)鍵在于讓這樣的助手具有更好的適應(yīng)性、靈活性,同時(shí)更強(qiáng)大。
問(wèn):這方面的發(fā)展需要什么樣的突破?我們?yōu)楹尾荒芰⒓粗秩プ鲞@件事?
哈薩比斯:實(shí)際上我們可以,你所需的只是不同的方法。這里再次出現(xiàn)了預(yù)編程和后天學(xué)習(xí)的不同。目前,許多智能手機(jī)助手針對(duì)專門的應(yīng)用場(chǎng)景進(jìn)行預(yù)編程,因此只能處理預(yù)編程范圍內(nèi)的邏輯?,F(xiàn)實(shí)世界非常復(fù)雜,用戶會(huì)從事各種各樣難以預(yù)料的事,你不可能提前預(yù)測(cè)。DeepMind認(rèn)為,實(shí)現(xiàn)智能的唯一方法在于從頭開始學(xué)習(xí),并確保通用性。這也是我們生存的基本法則。
問(wèn):在起步之初,AlphaGo被教給了許多棋型模式??紤]到用戶的輸入信息多種多樣,這種技術(shù)將如何應(yīng)用至智能手機(jī)?
哈薩比斯:是的,數(shù)據(jù)量很大,你可以利用數(shù)據(jù)去學(xué)習(xí)。但就AlphaGo的算法而言,我們認(rèn)為可以不再規(guī)定受控的學(xué)習(xí)起點(diǎn),完全放手讓其自學(xué),從零起步。我們將在未來(lái)幾個(gè)月進(jìn)行這樣的嘗試。這會(huì)花更長(zhǎng)的時(shí)間,可能是幾個(gè)月,因?yàn)椴话雌遄V隨機(jī)下棋意味著更多的嘗試和試錯(cuò)。但我們認(rèn)為,這種純粹依靠自學(xué)的模式是可行的。
問(wèn):出現(xiàn)這樣的可能性是否是由于算法已發(fā)展到目前的程度?
哈薩比斯:不是的。我們之前也可以這樣做。這樣做不會(huì)讓程序更強(qiáng)大,這只是為了嘗試純粹的自學(xué),擺脫人為控制的部分。我們認(rèn)為,這一算法可以在不受控的情況下運(yùn)轉(zhuǎn)。我們?nèi)ツ曜屓斯ぶ悄苋ネ鍭tari的游戲,人工智能從像素點(diǎn)的研究起步,這其中沒有摻雜任何人類知識(shí)。人工智能從屏幕上的隨機(jī)像素開始。
問(wèn):讓人工智能玩游戲更簡(jiǎn)單,這是否因?yàn)橛螒蛑械氖l件很明顯?
哈薩比斯:玩游戲更簡(jiǎn)單是因?yàn)榉謹(jǐn)?shù)更有規(guī)律。在圍棋比賽中,你只能得到一個(gè)分?jǐn)?shù),這就是結(jié)束時(shí)勝負(fù)。這被稱作“信度分配問(wèn)題”。在圍棋比賽中,你做出數(shù)百次行為,但卻不知道哪一次會(huì)帶來(lái)勝利或失敗,因此信號(hào)強(qiáng)度很弱。在Atari的游戲中,你所做的大部分操作都會(huì)帶來(lái)得分,因此你會(huì)有更多的信息反饋,幫你知道如何去做。
問(wèn):能否給一個(gè)時(shí)間表,即人工智能何時(shí)能給普通人使用的手機(jī)帶來(lái)明顯不同?
哈薩比斯:在未來(lái)2到3年里,你就會(huì)看到這些。不過(guò),起步之初的情況可能會(huì)比較微妙,某些方面還需要改進(jìn)。而在4年、5年,或是5年之后,你將看到性能的大幅提升。
關(guān)于谷歌
問(wèn):在你提到的未來(lái)所有可能性中,智能手機(jī)助手與谷歌整體的關(guān)聯(lián)度最大?
哈薩比斯:是的。
問(wèn):谷歌是否暗示過(guò)你們,期望你們的技術(shù)如何融入谷歌的產(chǎn)品路線圖,或是整體商業(yè)模式?
哈薩比斯:不,我們有很高的自由度,可以按照我們自己的意愿去優(yōu)化研究進(jìn)展。這是我們的使命,也是我們加入谷歌的原因。加入谷歌使我們得到加速,過(guò)去幾年的情況已然如此。當(dāng)然,我們會(huì)開發(fā)谷歌的許多內(nèi)部產(chǎn)品,但這些產(chǎn)品都處于極早期的階段,因此還沒有到討論的時(shí)機(jī)。我認(rèn)為,智能手機(jī)助手將是非常核心的產(chǎn)品,而谷歌CEO桑達(dá)爾·皮查伊(Sundar Pichai)也說(shuō)過(guò),這將是谷歌未來(lái)的最核心。
問(wèn):谷歌也有Google Brain等其他項(xiàng)目,同時(shí)也推出了諸如Google Photos搜索等面向用戶的機(jī)器學(xué)習(xí)功能。
哈薩比斯:這類技術(shù)無(wú)處不在。
問(wèn):你們是否與Google Brain有過(guò)互動(dòng),雙方的關(guān)注點(diǎn)有沒有重合之處?
哈薩比斯:我們的互補(bǔ)性很強(qiáng),每周都會(huì)溝通。Google Brain專注于深度學(xué)習(xí),而他們有杰出的工程師,例如杰夫·迪恩(Jeff Dean),因此他們將技術(shù)傳播至公司的每個(gè)角落。這也是為何我們看到Google Photos搜索等強(qiáng)大產(chǎn)品的原因。他們的工作成果是現(xiàn)象級(jí)的。他們常駐加州山景城,因此與產(chǎn)品集團(tuán)的聯(lián)系更多,并采用12至18個(gè)月的研發(fā)周期,而我們更多地關(guān)注算法開發(fā),周期通常為2到3年,且我們?cè)谄鸩街醪⒉恢苯雨P(guān)注產(chǎn)品。
問(wèn):谷歌對(duì)AlphaGo的支持有多重要?如果沒有谷歌,你們還能不能取得這一成就?
哈薩比斯:非常重要。AlphaGo在比賽中并沒有使用龐大的硬件,但我們需要大量的硬件資源去訓(xùn)練它,并制造多個(gè)版本,讓它們?cè)谠朴?jì)算平臺(tái)上對(duì)弈。只有獲得龐大的硬件資源才能高效地做到這一點(diǎn)。因此如果沒有谷歌的資源,我們不可能在當(dāng)前這個(gè)時(shí)間段就取得這樣的成果。
關(guān)于機(jī)器人
問(wèn):關(guān)于機(jī)器人。我常駐日本,而日本自認(rèn)為是機(jī)器人的精神家園。在日本,我看到機(jī)器人的用途有兩方面。一方面,發(fā)那科制造了工業(yè)機(jī)器人,被用于多種場(chǎng)合。另一方面,我們也看到了類似軟銀Pepper的禮賓機(jī)器人,這些機(jī)器人有著遠(yuǎn)大的目標(biāo),但使用場(chǎng)景很有限。對(duì)于這一領(lǐng)域,你的看法是什么?
哈薩比斯:正如你所說(shuō),發(fā)那科的機(jī)器人在“肢體”上非常強(qiáng)大,所欠缺的是“智力”。禮賓機(jī)器人則有點(diǎn)類似智能助手。不過(guò)我所見到的這些機(jī)器人都經(jīng)過(guò)預(yù)編程,只是按照模板做出響應(yīng)。如果超出模板,那么機(jī)器人就不知所措。
問(wèn):我感覺,最顯而易見的問(wèn)題就是,機(jī)器學(xué)習(xí)之類的技術(shù)將如何提高機(jī)器人的能力。
哈薩比斯:這將是一種完全不同的方式。你需要從頭開發(fā),讓機(jī)器人學(xué)習(xí)新東西,處理不可預(yù)期的事件。我認(rèn)為,這才是在現(xiàn)實(shí)世界中機(jī)器人和軟件與真實(shí)用戶互動(dòng)的方式。它們需要這類能力,從而發(fā)揮用處。因此,應(yīng)當(dāng)為機(jī)器人制定適當(dāng)?shù)膶W(xué)習(xí)路線。
問(wèn):你認(rèn)為,學(xué)習(xí)型機(jī)器人短期內(nèi)會(huì)有什么樣的使用場(chǎng)景?
哈薩比斯:我們還沒有太多地思考這一問(wèn)題。很明顯,無(wú)人駕駛汽車就是一種機(jī)器人,但目前這基本是一種狹義人工智能。不過(guò),計(jì)算機(jī)視覺利用了學(xué)習(xí)型人工智能的某些方面,例如特斯拉就采用了基于深度學(xué)習(xí)的標(biāo)準(zhǔn)計(jì)算機(jī)視覺技術(shù)。我可以肯定,日本已經(jīng)在思考諸如老人看護(hù)機(jī)器人,或家政機(jī)器人之類的產(chǎn)品,這對(duì)社會(huì),尤其是老齡化社會(huì)來(lái)說(shuō)很有意義。
問(wèn):對(duì)于這些使用場(chǎng)景,基于學(xué)習(xí)的方式為何更適合?
哈薩比斯:你只要想想這些問(wèn)題:為什么我們還沒有這樣的技術(shù)?為什么我們還不能讓機(jī)器人來(lái)幫你打掃衛(wèi)生?問(wèn)題在于,每個(gè)人的家中布局和家具都不相同。而即使是同一所屋子,每天的狀態(tài)也在改變。某些時(shí)候亂糟糟,某些時(shí)候又很整潔。因此沒有任何一種方式可以對(duì)機(jī)器人進(jìn)行預(yù)先編程,針對(duì)你的屋子提供解決方案。你甚至還希望加入自己的偏好,例如你希望衣服怎么疊放。這是一個(gè)非常復(fù)雜的問(wèn)題。這些事對(duì)人來(lái)說(shuō)很簡(jiǎn)單,但實(shí)際上這些任務(wù)相當(dāng)復(fù)雜。
問(wèn):?jiǎn)杺€(gè)個(gè)人問(wèn)題,你用掃地機(jī)器人嗎?
哈薩比斯:我們有一個(gè),但用處不是太大。
問(wèn):我自己有一個(gè),確實(shí)不是非常有用。我會(huì)去看看它掃的不干凈的地方,并再去打掃。因此我很好奇,我們何時(shí)會(huì)看到更先進(jìn)的機(jī)器人,所謂“足夠好”的轉(zhuǎn)折點(diǎn)將于何時(shí)出現(xiàn)?
哈薩比斯:是的,我是說(shuō)有可能。我認(rèn)為,所有人都會(huì)以合理價(jià)格買一臺(tái)機(jī)器人,幫他們收拾盤子洗碗。這種簡(jiǎn)單的掃地機(jī)器人很流行。實(shí)際上它們并沒有任何智能性。我認(rèn)為,在這一發(fā)展道路上的每一步都是有用的。
問(wèn):未來(lái),對(duì)于人類、機(jī)器人和人工智能之間的互動(dòng),你有什么樣的預(yù)期?很明顯,人們會(huì)想到科幻小說(shuō)中的場(chǎng)景。
哈薩比斯:我個(gè)人不是很關(guān)注機(jī)器人。我關(guān)心的是將這樣的人工智能應(yīng)用至科學(xué),推動(dòng)科學(xué)更快地進(jìn)步。我想看看由人工智能輔助的科學(xué)研究。屆時(shí)人工智能將成為研究助手,去完成大量冗繁的工作,找出有趣的文章,在海量數(shù)據(jù)中找到數(shù)據(jù)結(jié)構(gòu),將這些信息呈現(xiàn)給人類專家和科學(xué)家,幫助他們更快地取得突破。幾個(gè)月前,我曾向歐洲粒子物理研究所(CERN)做過(guò)一次演講:相對(duì)于地球上的其他人,他們制造出了更多數(shù)據(jù)。我們都知道,在這些海量數(shù)據(jù)中可能會(huì)蘊(yùn)藏新粒子的信息,但由于數(shù)據(jù)量太大,沒有人能完成分析。因此我認(rèn)為,如果某天人工智能可以參與尋找新粒子,那么將會(huì)很酷。


-
傾國(guó)之怒
-
原始傳奇
-
斗羅大陸(我唐三認(rèn)可0.1折)
-
太閣立志2
-
奇門(0.1折仙俠不用閃)
-
深淵契約
-
貓狩紀(jì)0.1折
-
靈劍仙師(斗破蒼穹)
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論