機(jī)器學(xué)習(xí)模型有助于解釋大腦如何識(shí)別交流聲音的含義,例如動(dòng)物叫聲或口語(yǔ)。研究中描述的算法模擬了社會(huì)性動(dòng)物(包括狨猴和豚鼠)如何使用大腦中的聲音處理網(wǎng)絡(luò)來(lái)區(qū)分聲音類(lèi)別(例如求偶、食物或危險(xiǎn)的呼喚)并對(duì)其采取行動(dòng)。
這項(xiàng)研究是理解聲音識(shí)別背后的神經(jīng)元處理的復(fù)雜性的重要一步。這項(xiàng)工作的見(jiàn)解為理解并最終治療影響語(yǔ)音識(shí)別的疾病和改善助聽(tīng)器鋪平了道路。
這項(xiàng)工作發(fā)表在《通訊生物學(xué)》的論文中,“自適應(yīng)機(jī)制促進(jìn)聽(tīng)覺(jué)分類(lèi)模型中噪聲和混響的魯棒性能。”
“我們認(rèn)識(shí)的每個(gè)人或多或少都會(huì)在生命中的某個(gè)時(shí)刻失去部分聽(tīng)力,要么是由于衰老,要么是暴露在噪音中。了解聲音識(shí)別的生物學(xué)原理并找到改進(jìn)方法非常重要。”匹茲堡大學(xué)神經(jīng)生物學(xué)助理教授SrivatsunSadagopan博士說(shuō)。“但是聲音交流的過(guò)程本身就很有趣。我們的大腦相互交互、接受想法并通過(guò)聲音傳達(dá)它們的方式簡(jiǎn)直就是神奇。”
該團(tuán)隊(duì)的直覺(jué)是,人腦識(shí)別和捕捉交流聲音含義的方式可能類(lèi)似于識(shí)別面部和其他物體的方式。面孔高度多樣化,但也有一些共同特征。
我們的大腦不會(huì)將我們遇到的每張臉與某個(gè)完美的“模板”臉進(jìn)行匹配,而是會(huì)拾取有用的特征,例如眼睛、鼻子和嘴巴以及它們的相對(duì)位置,并創(chuàng)建這些小特征的心理地圖,這些特征定義了一張臉。
在一系列研究中,研究小組表明,交流聲音也可能是由這樣的小特征組成的。研究人員首先建立了聲音處理的機(jī)器學(xué)習(xí)模型,以識(shí)別社會(huì)性動(dòng)物發(fā)出的不同聲音。為了測(cè)試大腦反應(yīng)是否與模型相符,他們記錄了豚鼠聽(tīng)其親屬的交流聲音時(shí)的大腦活動(dòng)。當(dāng)大腦中負(fù)責(zé)處理聲音的神經(jīng)元聽(tīng)到具有特定類(lèi)型聲音特征的噪音時(shí),它們會(huì)發(fā)出一陣電活動(dòng),類(lèi)似于機(jī)器學(xué)習(xí)模型。
然后他們想根據(jù)動(dòng)物的現(xiàn)實(shí)行為來(lái)檢查模型的性能。豚鼠接觸到不同類(lèi)別的聲音——吱吱聲和咕嚕聲被歸類(lèi)為不同的聲音信號(hào)。研究人員訓(xùn)練豚鼠走到圍欄的不同角落,并根據(jù)播放的聲音類(lèi)別獲得水果獎(jiǎng)勵(lì)。
然后,他們讓任務(wù)變得更加困難:為了模仿人類(lèi)識(shí)別不同口音的人所說(shuō)的單詞含義的方式,研究人員通過(guò)聲音改變軟件運(yùn)行豚鼠的叫聲,加快或減慢它們的速度,提高或降低它們的音調(diào),或添加噪音和回聲。
這些動(dòng)物不僅能夠始終如一地執(zhí)行任務(wù),就好像它們聽(tīng)到的叫聲沒(méi)有改變一樣,而且盡管有人工回聲或噪音,它們?nèi)匀槐憩F(xiàn)良好。更好的是,機(jī)器學(xué)習(xí)模型描述了他們的行為(以及大腦中聲音處理神經(jīng)元的潛在激活)。
下一步,研究人員正在將該模型的動(dòng)物語(yǔ)言準(zhǔn)確性轉(zhuǎn)化為人類(lèi)語(yǔ)言。
“從工程角度來(lái)看,有更好的語(yǔ)音識(shí)別模型。我們的模型的獨(dú)特之處在于,我們與行為和大腦活動(dòng)有密切的對(duì)應(yīng)關(guān)系,這讓我們對(duì)生物學(xué)有更深入的了解。”皮特大學(xué)神經(jīng)生物學(xué)系博士后薩蒂亞布拉塔·帕里達(dá)(SatyabrataParida)博士說(shuō)。“將來(lái),這些見(jiàn)解可用于幫助患有神經(jīng)發(fā)育疾病的人或幫助設(shè)計(jì)更好的助聽(tīng)器。”
標(biāo)簽:
免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!