分析:人工智能的崛起_第1頁(yè)
分析:人工智能的崛起_第2頁(yè)
分析:人工智能的崛起_第3頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分析:人工智能的崛起

研究人員最近對(duì)一個(gè)名叫ConceptNet的人工智能系統(tǒng)進(jìn)行了測(cè)評(píng)。在一項(xiàng)為檢測(cè)兒童智商而設(shè)計(jì)的測(cè)試中,ConceptNet的得分超過了一名智商正常的四歲兒童。該測(cè)試共包含五項(xiàng)與詞語推理和詞匯有關(guān)的測(cè)驗(yàn),ConceptNet的總得分為69分,與之進(jìn)行對(duì)比的學(xué)齡前兒童得分則為50分。并且專家認(rèn)為,該系統(tǒng)的智能程度還會(huì)進(jìn)一步加強(qiáng)。ConceptNet是一項(xiàng)由麻省理工學(xué)院常識(shí)計(jì)算計(jì)劃團(tuán)隊(duì)(MITCommonSenseComputingInitiative)管理的開源項(xiàng)目。該團(tuán)隊(duì)研發(fā)的ConceptNet4運(yùn)用了所謂的“關(guān)系”這一概念。例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時(shí),它會(huì)明白“小鹿是一種鹿”,而不是”鹿是一種小鹿“。也就是說,它能夠理解這種動(dòng)物的概念,以及“小鹿”和“鹿”這兩個(gè)詞匯和概念之間的關(guān)系。同時(shí),該系統(tǒng)還可以使用所謂的“對(duì)立標(biāo)記”表示負(fù)相關(guān)關(guān)系,比如“企鵝不會(huì)飛”等。研究人員讓ConceptNet4參與了“韋克斯勒學(xué)齡前兒童智力量表”測(cè)試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《MeasuringanArtificialIntelligenceSystem'sPerformanceonaVerbalIQTestForYoungChildren》上。WPPSI-III測(cè)試包含14項(xiàng)測(cè)驗(yàn)項(xiàng)目,以及一份針對(duì)操作智商和言語智商的完整評(píng)估表。操作智商測(cè)驗(yàn)通常會(huì)要求受測(cè)人完成繪畫、解謎、記憶等任務(wù)。言語智商測(cè)驗(yàn)則會(huì)考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對(duì)言語智商進(jìn)行測(cè)試。在測(cè)試過程中,試題會(huì)通過語言處理工具轉(zhuǎn)換成ConceptNet4能夠理解的語言,如“我們?yōu)槭裁匆帐??”、“我們?yōu)槭裁匆谙奶齑魈?yáng)鏡?”和“為什么將刀子放入嘴中是不好的行為?”等等。該研究由芝加哥大學(xué)的斯特蘭?奧爾森(StellanOhlsson)帶領(lǐng)。在對(duì)單項(xiàng)測(cè)試計(jì)分時(shí),研究人員先使用每道題目得分最高的答案計(jì)分,然后再使用每道題目得分最高的前五個(gè)答案中最好的答案計(jì)分。他們將前者稱為“嚴(yán)格計(jì)分”,后者稱為“放松計(jì)分”。在“信息”測(cè)試中,ConceptNet得到了20分,而同時(shí)參加測(cè)試的四歲兒童通過轉(zhuǎn)換后的得分為10分。這名兒童在詞語推理和理解上得分更高,均為7分,而ConceptNet在這兩項(xiàng)上的得分分別為2和3分。此外,ConceptNet表現(xiàn)出了更豐富的詞匯量,詞匯得分為20分,而兒童得分為13分。“ConceptNet系統(tǒng)的得分與四歲兒童相仿,但低于五至七歲兒童的平均得分,”研究人員解釋道,“該系統(tǒng)在每個(gè)單項(xiàng)中得分差異很大,說明還有改進(jìn)的空間。在所有測(cè)試中,‘理解’是最關(guān)乎人類常識(shí)的測(cè)試項(xiàng)目。得分差異大、常識(shí)方面表現(xiàn)一般,這說明ConceptNet尚不具有四歲兒童的語言能力。但本次研究說明,兒童智商測(cè)試可以為人工智能系統(tǒng)的評(píng)估和比較提供一種客觀的度量手段。”“此外,許多由ConceptNet給出的錯(cuò)誤答案和兒童給出的錯(cuò)誤答案不僅相去甚遠(yuǎn),而且違反常識(shí)。”例如,在關(guān)于“獅子”的詞語推理測(cè)驗(yàn)中,該AI系統(tǒng)和首測(cè)兒童被給予三條線索——“雄性長(zhǎng)著鬃毛”,“該動(dòng)物生活在非洲”,以及“它是一種體型很大的棕黃色貓科動(dòng)物”。由ConceptNet給出的排名前五的答案按順序排列為:狗,農(nóng)場(chǎng),生物,家庭,貓。研究團(tuán)隊(duì)解釋道,“生物”和“貓”尚且還能與“獅子”沾邊,但其它的答案就明顯有悖于常識(shí)了。“按照常識(shí),受測(cè)者應(yīng)該至少能將答案限制在動(dòng)物的范圍內(nèi),同時(shí)能做出簡(jiǎn)單的推理:“既然線索說它是貓科動(dòng)物,那只有貓科動(dòng)物能夠被列入考慮范圍?!痹撜撐谋话l(fā)表在期刊《arXiv》上,共同作者包括羅伯特?斯隆(RobertSloan)、捷爾吉?圖蘭(Gy?rgyTurán)和阿隆?尤拉斯基(AaronUrasky)。測(cè)試方法研究人員讓ConceptNet4參與了“韋克斯勒學(xué)齡前兒童智力量表”測(cè)試(WPPSI-III),并將研究結(jié)果發(fā)表在論文《MeasuringanArtificialIntelligenceSystem'sPerformanceonaVerbalIQTestForYoungChildren》上。WPPSI-III測(cè)試包含14項(xiàng)測(cè)驗(yàn)項(xiàng)目,以及一份針對(duì)操作智商和言語智商的完整評(píng)估表。操作智商測(cè)驗(yàn)通常會(huì)要求受測(cè)人完成繪畫、解謎、記憶等任務(wù)。言語智商測(cè)驗(yàn)則會(huì)考察兒童的詞語推理、詞匯及理解能力。每種智商得分的平均分都為100分。本次研究則主要針對(duì)言語智商進(jìn)行測(cè)試。在測(cè)試過程中,試題會(huì)通過語言處理工具轉(zhuǎn)換成ConceptNet4能夠理解的語言,如“我們?yōu)槭裁匆帐郑俊?、“我們?yōu)槭裁匆谙奶齑魈?yáng)鏡?”和“為什么將刀子放入嘴中是不好的行為?”等等。該研究由芝加哥大學(xué)的斯特蘭?奧爾森(StellanOhlsson)帶領(lǐng)。在對(duì)單項(xiàng)測(cè)試計(jì)分時(shí),研究人員先使用每道題目得分最高的答案計(jì)分,然后再使用每道題目得分最高的前五個(gè)答案中最好的答案計(jì)分。他們將前者稱為“嚴(yán)格計(jì)分”,后者稱為“放松計(jì)分”。什么是ConceptNetConceptNet是一項(xiàng)由麻省理工學(xué)院常識(shí)計(jì)算計(jì)劃團(tuán)隊(duì)(MITCommonSenseComputingInitiative)管理的開源項(xiàng)目。該團(tuán)隊(duì)研發(fā)的ConceptNet4運(yùn)用了所謂的“關(guān)系”這一概念。例如,當(dāng)讓該系統(tǒng)解釋什么是“小鹿”時(shí),它會(huì)明白“小鹿是一種鹿”,而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論