特別適合發(fā)聲。已經(jīng)進行了幾項研究來定位和理解大腦語音的特定部分,但是由于同一大腦區(qū)域的大部分對所有聲音都是活躍的,所以不清楚大腦是否有獨特的語音處理過程以及如何處理它。它執(zhí)行這些過程。其中一個主要挑戰(zhàn)是描述當高度可變的聲音信號和語言表達之間沒有一一對應時,大腦如何將它們匹配起來,例如,大腦如何識別說話者和方言使用的相同單詞,它們是相同的。
在這項最新的研究中,由Riitta Salmelin教授領導的研究人員根據(jù)16名健康芬蘭志愿者的毫秒大腦記錄解碼并重建了語音。他們采用了一種新穎的方法,即利用各種聲音(不同說話者說出的單詞、來自多個類別的環(huán)境聲音)的自然聲學可,并使用受生理學啟發(fā)的機器學習模型將它們映射到腦磁圖(MEG)數(shù)據(jù)。這些類型的模型具有聲音的時間分辨和時間平均表示,并且之前已經(jīng)用于大腦研究。合著者阿里費薩爾(Ali Faisal)提出的新穎且可擴展的公式允許將這種模型應用于全腦錄音,并且本研究首次將同一模型的聲音與其他聲音進行比較。
阿爾托研究人員和主要作者安妮諾拉說:“我們發(fā)現(xiàn)皮層激活器的時間鎖定和擴展的語音輸入之間的聯(lián)系對于語音編碼非常重要。當我們聽到一個詞(如“貓”)時,我們的大腦必須及時準確地跟隨它來理解它的意思。
相比之下,時間鎖定在非言語環(huán)境聲音的皮層加工中并不突出,非言語環(huán)境聲音傳達的意義與口語相同,如音樂或笑聲。相反,時間平均分析足以實現(xiàn)其意義。這意味著當你聽到貓的叫聲時,大腦也會獲得同樣的表征(貓的外表、貓的行為、感覺等)。),但聲音本身會作為一個整體來分析,沒有諾拉的解釋。
對于無意義的新詞,也觀察到時間鎖定編碼。然而,即使是對笑聲等人工非語音聲音的響應,動態(tài)時間鎖定機制也不能表現(xiàn)出更好的解碼效果,但可以利用時間平均模型進行更好的重構,這表明時間鎖定編碼對識別出的聲音是特殊的。作為演講。
結果表明,大腦反應在講話后具有特別高的時間保真度。
目前的結果表明,在人類中,一種特殊的時間鎖定編碼機制可能已經(jīng)進化成了語音。根據(jù)其他研究,在早期發(fā)展過程中,這種加工機制似乎已經(jīng)針對母語進行了調整,并廣泛暴露于語言環(huán)境中。
當前對時間鎖定編碼的發(fā)現(xiàn),尤其是對語音的發(fā)現(xiàn),加深了對聲學和語言表示(從聲音到單詞)之間映射所需的計算的理解。目前對的發(fā)現(xiàn)提出了一個問題,即聲音的哪些特定方面對于促使大腦使用這種特殊的編碼模式至關重要。為了進一步的研究,研究人員的下一個目標是利用現(xiàn)實生活中如聽覺的環(huán)境,如重疊的環(huán)境聲音和聲音。諾拉說:“未來的研究還應該確定我們是否可以通過經(jīng)驗來處理類似的時間鎖定,并專門處理經(jīng)驗,比如處理音樂家的樂器聲音。"
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!