AlphaGo之父:下個(gè)版本會(huì)讓電腦從零開(kāi)始學(xué)圍棋
- 來(lái)源:互聯(lián)網(wǎng)
- 作者:newtype2001
- 編輯:newtype2001
DeepMind創(chuàng)始人哈撒比斯
3月9日,谷歌人工智能AlphaGo戰(zhàn)勝韓國(guó)棋手李世石引起巨大轟動(dòng),美國(guó)科技媒體“The Verge”在比賽結(jié)束后對(duì)AlphaGo背后的DeepMind公司聯(lián)合創(chuàng)始人德米斯·哈薩比斯進(jìn)行了長(zhǎng)篇訪(fǎng)談,哈薩比斯談到了他對(duì)人工智能未來(lái)的看法。
以下是文章全文:
DeepMind的AlphaGo戰(zhàn)勝韓國(guó)傳奇棋手李世石,點(diǎn)燃了空前的對(duì)人工智能問(wèn)題的熱情。但是,這家谷歌子公司的AlphaGo計(jì)劃卻遠(yuǎn)遠(yuǎn)超出了它自身 - 甚至可以說(shuō)它本身都不是重點(diǎn)。作為DeepMind的聯(lián)合創(chuàng)始人,德米斯·哈薩比斯(Demis Hassabis)在本周早些時(shí)候表示,DeepMind要做出“智慧解決方案”,對(duì)此他有一些想法。
哈薩比斯自己走了個(gè)不尋常的路去達(dá)到人生目標(biāo),現(xiàn)在回想起來(lái)這卻是一個(gè)完美的道路。哈薩比斯是一個(gè)在智力奧林匹克競(jìng)賽中5次獲得冠軍的國(guó)際象棋神童。他聲名鵲起則是年輕時(shí)在英國(guó)Bullfrog和Lionhead游戲開(kāi)發(fā)公司工作,在那里他致力于開(kāi)發(fā)一款類(lèi)似于“主題公園”、“黑與白”的人工智能游戲,后來(lái)他成立了自己的工作室。哈薩比斯在00年代中期離開(kāi)了游戲行業(yè)去讀完神經(jīng)科學(xué)的博士學(xué)位,2010年他與別人聯(lián)合創(chuàng)立了DeepMind公司。
在A(yíng)lphaGo首次戰(zhàn)勝李世石后的清晨,哈薩比斯坐下來(lái)接受The Verge的訪(fǎng)談。他在進(jìn)屋時(shí)評(píng)論著首爾四季酒店(注:比賽地點(diǎn))的燈光布景,給人的感覺(jué)十分溫馨友好。當(dāng)一個(gè)谷歌代表告訴他,昨夜有3300篇韓國(guó)媒體文章報(bào)道了他,他明顯看起來(lái)非常吃驚。 “這令人難以置信,對(duì)吧?”他說(shuō), “看到一個(gè)深?yuàn)W難懂的事物開(kāi)始流行起來(lái),這很有趣。”
除了AlphaGo,我們的談話(huà)觸及視頻游戲、下一代智能手機(jī)助手、DeepMind在谷歌公司中的角色、機(jī)器人、AI如何幫助科研等等。
注:本次采訪(fǎng)內(nèi)容已被輕度編輯,以便于閱讀。
問(wèn):The Verge 記者薩姆·貝福德(Sam Byford):對(duì)于那些不了解人工智能或圍棋的人,你會(huì)如何描述昨天所發(fā)生的文化共鳴?
哈薩比斯:對(duì)于這些我要說(shuō)幾點(diǎn)。圍棋一直是完全信息博弈的巔峰。它在可能性方面比國(guó)際象棋更復(fù)雜,所以它一直是人工智能研究領(lǐng)域努力尋求突破的重大挑戰(zhàn),尤其是在“深藍(lán)”之后。你知道,即使付出了很多的努力,我們還是沒(méi)有走出太遠(yuǎn)。蒙特卡洛樹(shù)搜索是十年前一個(gè)很大的創(chuàng)新,但我認(rèn)為我們成功地用AlphaGo給神經(jīng)網(wǎng)絡(luò)引入了“直覺(jué)”——如果你想這么叫的話(huà),而正是這些直覺(jué)讓某些人成為頂尖棋手。我很驚訝,即使是現(xiàn)場(chǎng)解說(shuō)邁克爾·雷德蒙德(Michael Redmond)也很難算出結(jié)局,他可是一個(gè)職業(yè)9段棋手?。《@表明了你是有多么難寫(xiě)出圍棋的“評(píng)價(jià)函數(shù)”(valuation function)。
問(wèn):當(dāng)你看到AlphaGo的特殊舉動(dòng),你會(huì)感到驚訝嗎?
哈薩比斯:是啊。我們相當(dāng)震驚,我認(rèn)為李世石也是,從他的面部表情就能看出來(lái)。AlphaGo的那步棋深深地打入了李世石的領(lǐng)地。我認(rèn)為這是一個(gè)相當(dāng)意外的舉動(dòng)。
問(wèn):是因?yàn)?這步棋的)侵略性嗎?
哈薩比斯:嗯,是因?yàn)榍致院痛竽?!此外,它在比賽中戲耍了李世石。李世石以好?zhàn)而聞名,這就是他所傳達(dá)出的,我們期待的那種東西。本場(chǎng)比賽一開(kāi)始,他就在整個(gè)棋盤(pán)上求戰(zhàn),但是沒(méi)有一處是真的。傳統(tǒng)的圍棋程序在處理這種情況時(shí)非常無(wú)力。他們?cè)诰钟蛴?jì)算中并不差,但是在需要通盤(pán)視野的時(shí)候會(huì)很無(wú)力。
問(wèn):舉行這次比賽的一大原因就是評(píng)估AlphaGo的能力,無(wú)論輸贏(yíng)。你從昨晚學(xué)到什么?
哈薩比斯:好吧,我想我們了解到:我們已經(jīng)沿著這條線(xiàn)走出了很遠(yuǎn) ——沒(méi)有超出我們的預(yù)期,但達(dá)到了我們的期望。我們要告訴大眾,我們認(rèn)為比賽是五五開(kāi)。我認(rèn)為這仍然可能是正確的,這兒任何事都有可能發(fā)生,我知道李世石今天回來(lái)后會(huì)采取不同的策略。所以,我認(rèn)為尋找出對(duì)手策略將是非常有趣的。
剛才談到了AI的意義,回答了你的第一個(gè)問(wèn)題。另一個(gè)我要告訴你的事情是,我們和深藍(lán)是不同的。深藍(lán)是一個(gè)“手工”程序——程序員從國(guó)際象棋的規(guī)則中提煉出信息和獲得啟發(fā)。而我們的AlphaGo擁有學(xué)習(xí)能力,它通過(guò)實(shí)踐和學(xué)習(xí)獲得知識(shí),這更像人。
問(wèn):如果在系列賽中AlphaGo繼續(xù)以這種方式取勝,接下來(lái)會(huì)發(fā)生什么?未來(lái)會(huì)有一個(gè)人工智能的游戲?qū)Q嗎?
哈薩比斯:我認(rèn)為作為圍棋是完全信息博弈的巔峰。當(dāng)然,我們還有其他頂尖棋手要比賽。此外,其他的游戲 ——像無(wú)限押注的德州撲克就非常困難。多人比賽會(huì)有其他的挑戰(zhàn),因?yàn)樗且粋€(gè)不完全信息博弈。再有明顯的就是,人類(lèi)在玩《星際爭(zhēng)霸》這類(lèi)游戲時(shí)比電腦更好。戰(zhàn)略游戲需要在一個(gè)不完全信息的世界里擁有高層次的戰(zhàn)略能力。而圍棋的事情是很明顯的,你可以在棋盤(pán)上看到一切,因此,這對(duì)于電腦來(lái)說(shuō)更容易一些。
問(wèn):(人工智能)打《星際爭(zhēng)霸》這些游戲你個(gè)人會(huì)感興趣嗎?
哈薩比斯:也許吧。我們只對(duì)研究項(xiàng)目主線(xiàn)范圍內(nèi)的事情感興趣。所以DeepMind的目的不只是打游戲,盡管那非常有趣而且令人興奮。你知道,我喜歡玩游戲,我以前編寫(xiě)過(guò)電腦游戲。但是那僅限于作為測(cè)試平臺(tái),用于嘗試寫(xiě)出我們的算法思想和測(cè)試出它能到多高等級(jí)、能玩得多好,這是一個(gè)非常有效的方式。最終,我們希望能應(yīng)用到現(xiàn)實(shí)世界中的重大問(wèn)題。
問(wèn):90年代末,我在英國(guó)長(zhǎng)大,當(dāng)時(shí)我在電腦雜志上看過(guò)你的名字,你的名字常常和游戲聯(lián)系在一起。當(dāng)我第一次聽(tīng)說(shuō)DeepMind,看到你名字時(shí),我在想:“真是絕配。”之前你在游戲行業(yè)的職業(yè)經(jīng)歷對(duì)于現(xiàn)在所做的工作有何影響?
哈薩比斯:類(lèi)似DeepMind的東西一直是我的終極目標(biāo)。從某種意義上來(lái)說(shuō),我在這方面的計(jì)劃已有20多年時(shí)間。如果你從這種角度來(lái)看,即我所做的一切都是為了最終進(jìn)軍人工智能領(lǐng)域,那么可以發(fā)現(xiàn)我的選擇是合理的。如果熟悉我在Bullfrog等公司的工作,那么你會(huì)知道,人工智能是我所做一切的核心。很明顯,(Bullfrog創(chuàng)始人之一)皮特·莫里諾克斯(Peter Molyneux)的游戲也都是人工智能游戲。
16至17歲時(shí),通過(guò)開(kāi)發(fā)《主題公園》,我意識(shí)到如果繼續(xù)發(fā)展人工智能,那么人工智能將發(fā)揮巨大的力量。我們賣(mài)出了數(shù)百萬(wàn)個(gè)拷貝,而許多人都喜歡這款游戲。正是由于人工智能的存在,這款游戲才可以適應(yīng)玩家。我們隨后繼續(xù)進(jìn)行開(kāi)發(fā),而我也在游戲行業(yè)的職業(yè)生涯中試圖繼續(xù)發(fā)展這一技術(shù)。
隨后,我退出了游戲行業(yè),回到了學(xué)術(shù)界,從事神經(jīng)科學(xué)的研究。因?yàn)樵?1世紀(jì)00年代中期,我感覺(jué)通過(guò)游戲這扇“后門(mén)”去展開(kāi)人工智能研究已經(jīng)非常困難,因?yàn)橛螒虬l(fā)行商只想要游戲。
問(wèn):當(dāng)時(shí),游戲是否是人工智能唯一顯而易見(jiàn)的應(yīng)用?
哈薩比斯:是的,我認(rèn)為是這樣。實(shí)際上我認(rèn)為,當(dāng)時(shí)我們正在開(kāi)發(fā)技術(shù)極其領(lǐng)先的人工智能。我想說(shuō)的是,那時(shí)學(xué)術(shù)界還停留在90年代,而所有新技術(shù)都尚未普及,也沒(méi)有得到大規(guī)模應(yīng)用,例如神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。因此,最優(yōu)秀的人工智能技術(shù)存在于游戲之中。
當(dāng)時(shí)的技術(shù)不同于我們目前開(kāi)發(fā)的學(xué)習(xí)型人工智能,而更多的像是有限狀態(tài)機(jī)。但這些系統(tǒng)很復(fù)雜,并且具有自適應(yīng)性。類(lèi)似《Black & White》的游戲采用了強(qiáng)化學(xué)習(xí)技術(shù)。我認(rèn)為這是到目前為止游戲中最復(fù)雜的人工智能應(yīng)用案例。不過(guò)到2004至2005年,很明顯游戲行業(yè)走上了與90年代不同的發(fā)展方向。90年代的游戲很有趣,具有創(chuàng)新性。當(dāng)你想到一個(gè)點(diǎn)子時(shí),就可以將其開(kāi)發(fā)出來(lái)。而到00年代,游戲更強(qiáng)調(diào)圖像、內(nèi)容IP,類(lèi)似FIFA的游戲大行其道。因此,游戲行業(yè)不再有趣。
在游戲行業(yè),我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。這就是神經(jīng)科學(xué)。我希望從大腦解決問(wèn)題的方式中獲得靈感。因此,沒(méi)有什么其他方式比攻讀神經(jīng)科學(xué)的博士學(xué)位更好。

玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門(mén)評(píng)論
全部評(píng)論