人工智能的崛起:智商測試得分已經(jīng)超過四歲兒童
- 來源:互聯(lián)網(wǎng)
- 作者:newtype2001
- 編輯:newtype2001
研究人員最近對一個名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評。在一項為檢測兒童智商而設(shè)計的測中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞匯有關(guān)的測驗,ConceptNet的總得分為69分,與之進(jìn)行對比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為,該系統(tǒng)的智能程度還會進(jìn)一步加強(qiáng)。
在測試過程中,試題會通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言,如“我們?yōu)槭裁匆帐郑?rdquo;、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。
如果你本來就擔(dān)心自己的工作有一天會被機(jī)器人取而代之,那么下面這則來自麻省理工學(xué)院的最新消息可能會讓你更加惶恐。
研究人員最近對一個名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評。在一項為檢測兒童智商而設(shè)計的測試中,ConceptNet的得分超過了一名智商正常的四歲兒童。
該測試共包含五項與詞語推理和詞匯有關(guān)的測驗,ConceptNet的總得分為69分,與之進(jìn)行對比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為,該系統(tǒng)的智能程度還會進(jìn)一步加強(qiáng)。
ConceptNet是一項由麻省理工學(xué)院常識計算計劃團(tuán)隊(MIT Common Sense Computing Initiative)管理的開源項目。該團(tuán)隊研發(fā)的ConceptNet 4運用了所謂的“關(guān)系”這一概念。例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時,它會明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動物的概念,以及“小鹿”和“鹿”這兩個詞匯和概念之間的關(guān)系。同時,該系統(tǒng)還可以使用所謂的“對立標(biāo)記”表示負(fù)相關(guān)關(guān)系,比如“企鵝不會飛”等。
研究人員讓ConceptNet 4參與了“韋克斯勒學(xué)齡前兒童智力量表”測試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項測驗項目,以及一份針對操作智商和言語智商的完整評估表。
在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴(yán)格計分”,后者稱為“放松計分”。圖中左側(cè)為ConceptNet得分,右側(cè)為受測兒童得分。
操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務(wù)。言語智商測驗則會考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進(jìn)行測試。
在測試過程中,試題會通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言,如“我們?yōu)槭裁匆帐?”、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。
該研究由芝加哥大學(xué)的斯特蘭?奧爾森(Stellan Ohlsson)帶領(lǐng)。在對單項測試計分時,研究人員先使用每道題目得分最高的答案計分,然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴(yán)格計分”,后者稱為“放松計分”。
在“信息”測試中,ConceptNet得到了20分,而同時參加測試的四歲兒童通過轉(zhuǎn)換后的得分為10分。這名兒童在詞語推理和理解上得分更高,均為7分,而ConceptNet在這兩項上的得分分別為2和3分。此外,ConceptNet表現(xiàn)出了更豐富的詞匯量,詞匯得分為20分,而兒童得分為13分。

玩家點評 (0人參與,0條評論)
熱門評論
全部評論