機器學(xué)習(xí)模型有助于解釋大腦如何識別交流聲音的含義,例如動物叫聲或口語。研究中描述的算法模擬了社會性動物(包括狨猴和豚鼠)如何使用大腦中的聲音處理網(wǎng)絡(luò)來區(qū)分聲音類別(例如求偶、食物或危險的呼喚)并對其采取行動。
這項研究是理解聲音識別背后的神經(jīng)元處理的復(fù)雜性的重要一步。這項工作的見解為理解并最終治療影響語音識別的疾病和改善助聽器鋪平了道路。
這項工作發(fā)表在《通訊生物學(xué)》的論文中,“自適應(yīng)機制促進(jìn)聽覺分類模型中噪聲和混響的魯棒性能。”
“我們認(rèn)識的每個人或多或少都會在生命中的某個時刻失去部分聽力,要么是由于衰老,要么是暴露在噪音中。了解聲音識別的生物學(xué)原理并找到改進(jìn)方法非常重要。”匹茲堡大學(xué)神經(jīng)生物學(xué)助理教授SrivatsunSadagopan博士說。“但是聲音交流的過程本身就很有趣。我們的大腦相互交互、接受想法并通過聲音傳達(dá)它們的方式簡直就是神奇。”
該團隊的直覺是,人腦識別和捕捉交流聲音含義的方式可能類似于識別面部和其他物體的方式。面孔高度多樣化,但也有一些共同特征。
我們的大腦不會將我們遇到的每張臉與某個完美的“模板”臉進(jìn)行匹配,而是會拾取有用的特征,例如眼睛、鼻子和嘴巴以及它們的相對位置,并創(chuàng)建這些小特征的心理地圖,這些特征定義了一張臉。
在一系列研究中,研究小組表明,交流聲音也可能是由這樣的小特征組成的。研究人員首先建立了聲音處理的機器學(xué)習(xí)模型,以識別社會性動物發(fā)出的不同聲音。為了測試大腦反應(yīng)是否與模型相符,他們記錄了豚鼠聽其親屬的交流聲音時的大腦活動。當(dāng)大腦中負(fù)責(zé)處理聲音的神經(jīng)元聽到具有特定類型聲音特征的噪音時,它們會發(fā)出一陣電活動,類似于機器學(xué)習(xí)模型。
然后他們想根據(jù)動物的現(xiàn)實行為來檢查模型的性能。豚鼠接觸到不同類別的聲音——吱吱聲和咕嚕聲被歸類為不同的聲音信號。研究人員訓(xùn)練豚鼠走到圍欄的不同角落,并根據(jù)播放的聲音類別獲得水果獎勵。
然后,他們讓任務(wù)變得更加困難:為了模仿人類識別不同口音的人所說的單詞含義的方式,研究人員通過聲音改變軟件運行豚鼠的叫聲,加快或減慢它們的速度,提高或降低它們的音調(diào),或添加噪音和回聲。
這些動物不僅能夠始終如一地執(zhí)行任務(wù),就好像它們聽到的叫聲沒有改變一樣,而且盡管有人工回聲或噪音,它們?nèi)匀槐憩F(xiàn)良好。更好的是,機器學(xué)習(xí)模型描述了他們的行為(以及大腦中聲音處理神經(jīng)元的潛在激活)。
下一步,研究人員正在將該模型的動物語言準(zhǔn)確性轉(zhuǎn)化為人類語言。
“從工程角度來看,有更好的語音識別模型。我們的模型的獨特之處在于,我們與行為和大腦活動有密切的對應(yīng)關(guān)系,這讓我們對生物學(xué)有更深入的了解。”皮特大學(xué)神經(jīng)生物學(xué)系博士后薩蒂亞布拉塔·帕里達(dá)(SatyabrataParida)博士說。“將來,這些見解可用于幫助患有神經(jīng)發(fā)育疾病的人或幫助設(shè)計更好的助聽器。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!