CAMBRIDGE, MA 在過(guò)去的幾年里,語(yǔ)言的人工智能模型已經(jīng)變得非常擅長(zhǎng)某些任務(wù)。最值得注意的是,它們擅長(zhǎng)預(yù)測(cè)文本字符串中的下一個(gè)單詞;這項(xiàng)技術(shù)可幫助搜索引擎和短信應(yīng)用程序預(yù)測(cè)您要輸入的下一個(gè)單詞。
最新一代的預(yù)測(cè)語(yǔ)言模型似乎也了解了語(yǔ)言的潛在含義。這些模型不僅可以預(yù)測(cè)接下來(lái)出現(xiàn)的單詞,還可以執(zhí)行似乎需要一定程度真正理解的任務(wù),例如問(wèn)答、文檔摘要和故事完成。
此類(lèi)模型旨在優(yōu)化預(yù)測(cè)文本的特定功能的性能,而不會(huì)試圖模仿人類(lèi)大腦如何執(zhí)行此任務(wù)或理解語(yǔ)言的任何內(nèi)容。但麻省理工學(xué)院神經(jīng)科學(xué)家的一項(xiàng)新研究表明,這些模型的潛在功能類(lèi)似于人腦中語(yǔ)言處理中心的功能。
在其他類(lèi)型的語(yǔ)言任務(wù)上表現(xiàn)良好的計(jì)算機(jī)模型并沒(méi)有表現(xiàn)出與人腦的這種相似性,這提供了人腦可能使用下一個(gè)詞預(yù)測(cè)來(lái)驅(qū)動(dòng)語(yǔ)言處理的證據(jù)。
“模型在預(yù)測(cè)下一個(gè)單詞方面做得越好,它就越接近人類(lèi)大腦,”麻省理工學(xué)院麥戈文大腦研究所和大腦中心成員、認(rèn)知神經(jīng)科學(xué)沃爾特 A.羅森布利斯教授 Nancy Kanwisher 說(shuō), Minds, and Machines (CBMM),以及這項(xiàng)新研究的作者。“令人驚訝的是,這些模型的擬合如此之好,它非常間接地表明,人類(lèi)語(yǔ)言系統(tǒng)正在做的事情可能正在預(yù)測(cè)接下來(lái)會(huì)發(fā)生什么。”
Joshua Tenenbaum,麻省理工學(xué)院計(jì)算認(rèn)知科學(xué)教授,CBMM 和麻省理工學(xué)院人工智能實(shí)驗(yàn)室(CSAIL)成員;和 Evelina Fedorenko,神經(jīng)科學(xué)領(lǐng)域的 Frederick A. 和 Carole J. Middleton 職業(yè)發(fā)展副教授以及麥戈文研究所的成員,是該研究的資深作者,該研究本周發(fā)表在美國(guó)國(guó)家科學(xué)院院刊上。在 CBMM 工作的麻省理工學(xué)院研究生 Martin Schrimpf 是該論文的第一作者。
做出預(yù)測(cè)
新的、高性能的下一個(gè)詞預(yù)測(cè)模型屬于一類(lèi)稱(chēng)為深度神經(jīng)網(wǎng)絡(luò)的模型。這些網(wǎng)絡(luò)包含形成不同強(qiáng)度連接的計(jì)算“節(jié)點(diǎn)”,以及以規(guī)定方式在彼此之間傳遞信息的層。
在過(guò)去的十年里,科學(xué)家們使用深度神經(jīng)網(wǎng)絡(luò)來(lái)創(chuàng)建視覺(jué)模型,可以像靈長(zhǎng)類(lèi)動(dòng)物的大腦一樣識(shí)別物體。麻省理工學(xué)院的研究還表明,視覺(jué)對(duì)象識(shí)別模型的潛在功能與靈長(zhǎng)類(lèi)動(dòng)物視覺(jué)皮層的組織相匹配,即使這些計(jì)算機(jī)模型并不是專(zhuān)門(mén)為模仿大腦而設(shè)計(jì)的。
標(biāo)簽:
免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!