您的位置：首頁 > 新聞 > 高新技術(shù) > 新聞詳情

人工智能的崛起：智商測試得分已經(jīng)超過四歲兒童

時間：2015-11-01 09:10:14

來源：互聯(lián)網(wǎng)
作者：newtype2001
編輯：newtype2001

研究人員最近對一個名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評。在一項為檢測兒童智商而設(shè)計的測中，ConceptNet的得分超過了一名智商正常的四歲兒童。該測試共包含五項與詞語推理和詞匯有關(guān)的測驗，ConceptNet的總得分為69分，與之進(jìn)行對比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為，該系統(tǒng)的智能程度還會進(jìn)一步加強(qiáng)。

在測試過程中，試題會通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言，如“我們?yōu)槭裁匆帐郑?rdquo;、“我們?yōu)槭裁匆谙奶齑魈栫R？”和“為什么將刀子放入嘴中是不好的行為？”等等。

如果你本來就擔(dān)心自己的工作有一天會被機(jī)器人取而代之，那么下面這則來自麻省理工學(xué)院的最新消息可能會讓你更加惶恐。

研究人員最近對一個名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測評。在一項為檢測兒童智商而設(shè)計的測試中，ConceptNet的得分超過了一名智商正常的四歲兒童。

該測試共包含五項與詞語推理和詞匯有關(guān)的測驗，ConceptNet的總得分為69分，與之進(jìn)行對比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為，該系統(tǒng)的智能程度還會進(jìn)一步加強(qiáng)。

ConceptNet是一項由麻省理工學(xué)院常識計算計劃團(tuán)隊(MIT Common Sense Computing Initiative)管理的開源項目。該團(tuán)隊研發(fā)的ConceptNet 4運用了所謂的“關(guān)系”這一概念。例如，當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時，它會明白“小鹿是一種鹿”，而不是”鹿是一種小鹿“。也就是說，它能夠理解這種動物的概念，以及“小鹿”和“鹿”這兩個詞匯和概念之間的關(guān)系。同時，該系統(tǒng)還可以使用所謂的“對立標(biāo)記”表示負(fù)相關(guān)關(guān)系，比如“企鵝不會飛”等。

研究人員讓ConceptNet 4參與了“韋克斯勒學(xué)齡前兒童智力量表”測試(WPPSI-III)，并將研究結(jié)果發(fā)表在論文《Measuring an Artificial Intelligence System's Performance on a Verbal IQ Test For Young Children》上。WPPSI-III測試包含14項測驗項目，以及一份針對操作智商和言語智商的完整評估表。

在對單項測試計分時，研究人員先使用每道題目得分最高的答案計分，然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴(yán)格計分”，后者稱為“放松計分”。圖中左側(cè)為ConceptNet得分，右側(cè)為受測兒童得分。

操作智商測驗通常會要求受測人完成繪畫、解謎、記憶等任務(wù)。言語智商測驗則會考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對言語智商進(jìn)行測試。

在測試過程中，試題會通過語言處理工具轉(zhuǎn)換成ConceptNet 4能夠理解的語言，如“我們?yōu)槭裁匆帐?”、“我們?yōu)槭裁匆谙奶齑魈栫R?”和“為什么將刀子放入嘴中是不好的行為?”等等。

該研究由芝加哥大學(xué)的斯特蘭?奧爾森(Stellan Ohlsson)帶領(lǐng)。在對單項測試計分時，研究人員先使用每道題目得分最高的答案計分，然后再使用每道題目得分最高的前五個答案中最好的答案計分。他們將前者稱為“嚴(yán)格計分”，后者稱為“放松計分”。

在“信息”測試中，ConceptNet得到了20分，而同時參加測試的四歲兒童通過轉(zhuǎn)換后的得分為10分。這名兒童在詞語推理和理解上得分更高，均為7分，而ConceptNet在這兩項上的得分分別為2和3分。此外，ConceptNet表現(xiàn)出了更豐富的詞匯量，詞匯得分為20分，而兒童得分為13分。