123,123

關(guān)于語音識(shí)別系統(tǒng)是什么應(yīng)用，語音識(shí)別系統(tǒng)是什么原理這個(gè)問題很多朋友還不知道，今天小六來為大家解答以上的問題，現(xiàn)在讓我們一起來看看吧！

1、我們可以設(shè)想，在不久的將來坐在辦公司里的經(jīng)理會(huì)對(duì)電腦說：“嗨!伙計(jì)，幫我通知一下公司所有員工，今天下午3：00準(zhǔn)時(shí)開會(huì)。

2、”這是科學(xué)家在幾十年前的設(shè)想，語音識(shí)別長久以來一直是人們的美好愿望，讓計(jì)算機(jī)領(lǐng)會(huì)人所說的話，實(shí)現(xiàn)人機(jī)對(duì)話是發(fā)展人機(jī)通信的主要目標(biāo)。

3、進(jìn)入2l世紀(jì)，隨著計(jì)算機(jī)的日益普及，怎樣給不熟悉計(jì)算機(jī)的人提供一個(gè)友好而又簡易的操作平臺(tái)，是我們非常感興趣的問題，而語音識(shí)別技術(shù)就是其中最直接的方法之一。

4、　　20世紀(jì)80年代中期以來，新技術(shù)的逐漸成熟和發(fā)展使語音識(shí)別技術(shù)有了實(shí)質(zhì)性的進(jìn)展，尤其是隱馬爾可夫模型(HMM)的研究和廣泛應(yīng)用，推動(dòng)了語音識(shí)別的迅速發(fā)展，同時(shí)，語音識(shí)別領(lǐng)域也正處在一個(gè)黃金開發(fā)的關(guān)鍵時(shí)期，各國的開發(fā)人員正在向特定人到非特定人，孤立詞匯向連接詞，小詞匯量向大詞匯量來擴(kuò)展研究領(lǐng)域，可以毫不猶豫地說，語音識(shí)別會(huì)讓計(jì)算機(jī)變得“善解人意”，許多事情將不再是“對(duì)牛彈琴”，最終用戶的口述會(huì)取代鼠標(biāo)，鍵盤這些傳統(tǒng)輸入設(shè)備，只需要用戶的嘴和麥克風(fēng)就能實(shí)現(xiàn)對(duì)計(jì)算機(jī)的絕對(duì)控制。

5、　　隱馬爾可夫模型HMM的引入　　現(xiàn)在假定HMM是一個(gè)輸出符號(hào)序列的統(tǒng)計(jì)模型，具有N個(gè)狀態(tài)S1，S2?Sn，在一個(gè)周期內(nèi)從一個(gè)狀態(tài)轉(zhuǎn)到另一個(gè)狀態(tài)，每次轉(zhuǎn)移時(shí)輸出一個(gè)符號(hào)，轉(zhuǎn)移到了哪個(gè)狀態(tài)以及輸出什么符號(hào)，分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時(shí)的輸出概率來決定，由于只能觀測到輸出符號(hào)序列，不能觀測到狀態(tài)轉(zhuǎn)移序列，因此成為隱藏的馬爾可夫模型。

6、　　2、語音識(shí)別的特點(diǎn)　　語音識(shí)別的意思是將人說話的內(nèi)容和意思轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入，例如按鍵、二進(jìn)制編碼或者字符序列等。

7、與說話人的識(shí)別不同，后者主要是識(shí)別和確認(rèn)發(fā)出語音的人而非其中所包含的內(nèi)容。

8、語音識(shí)別的目的就是讓機(jī)器聽懂人類口述的語言，包括了兩方面的含義：第一是逐字逐句聽懂而不是轉(zhuǎn)化成書面的語言文字；第二是對(duì)作者簡介：賈聰，中國地質(zhì)大學(xué)機(jī)械與電子信息學(xué)院。

9、口述語言中所包含的命令或請(qǐng)求加以領(lǐng)會(huì)，做出正確回應(yīng)，而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

10、　　3、語音識(shí)別系統(tǒng)的工作流程　　一般來說，一套完整的語音識(shí)別系統(tǒng)其工作過程分為7步：①對(duì)語音信號(hào)進(jìn)行分析和處理，除去冗余信息。

11、②提取影響語音識(shí)別的關(guān)鍵信息和表達(dá)語言含義的特征信息。

12、③緊扣特征信息，用最小單元識(shí)別字詞。

13、④按照不同語言的各自語法，依照先后次序識(shí)別字詞。

14、⑤把前后意思當(dāng)作輔助識(shí)別條件，有利于分析和識(shí)別。

15、⑥按照語義分析，給關(guān)鍵信息劃分段落，取出所識(shí)別出的字詞并連接起來，同時(shí)根據(jù)語句意思調(diào)整句子構(gòu)成。

16、⑦結(jié)合語義，仔細(xì)分析上下文的相互聯(lián)系，對(duì)當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正。

17、　　4、音識(shí)別系統(tǒng)基本原理框圖及原理　　語音識(shí)別系統(tǒng)基本原理結(jié)構(gòu)如圖1所示。

18、語音識(shí)別原理有三點(diǎn)：①對(duì)語音信號(hào)中的語言信息編碼是按照幅度譜的時(shí)間變化來進(jìn)行；②由于語音是可以閱讀的，也就是說聲學(xué)信號(hào)可以在不考慮說話人說話傳達(dá)的信息內(nèi)容的前提下用多個(gè)具有區(qū)別性的、離散的符號(hào)來表示；③語音的交互是一個(gè)認(rèn)知過程，所以絕對(duì)不能與語法、語義和用語規(guī)范等方面分裂開來。

19、　　預(yù)處理，其中就包括對(duì)語音信號(hào)進(jìn)行采樣、克服混疊濾波、去除部分由個(gè)體發(fā)音的差異和環(huán)境引起的噪聲影響，此外還會(huì)考慮到語音識(shí)別基本單元的選取和端點(diǎn)檢測問題。

20、反復(fù)訓(xùn)練是在識(shí)別之前通過讓說話人多次重復(fù)語音，從原始語音信號(hào)樣本中去除冗余信息，保留關(guān)鍵信息，再按照一定規(guī)則對(duì)數(shù)據(jù)加以整理，構(gòu)成模式庫。

21、再者是模式匹配，它是整個(gè)語音識(shí)別系統(tǒng)的核心部分，是根據(jù)一定規(guī)則以及計(jì)算輸入特征與庫存模式之間的相似度，進(jìn)而判斷出輸入語音的意思。

22、　　前端處理，先對(duì)原始語音信號(hào)進(jìn)行處理，再進(jìn)行特征提取，消除噪聲和不同說話人的發(fā)音差異帶來的影響，使處理后的信號(hào)能夠更完整地反映語音的本質(zhì)特征提取，消除噪聲和不同說話人的發(fā)音差異帶來的影響，使處理后的信號(hào)能夠更完整地反映語音的本質(zhì)特征。

23、　　5、當(dāng)前亟待解決的問題　　語音識(shí)別系統(tǒng)的性能受到許多因素的影響，包括不同說話人的發(fā)音方式、說話方式、環(huán)境噪音、傳輸信道衰落等等。

24、具體要解決的問題有四點(diǎn)：①增強(qiáng)系統(tǒng)的魯棒性，也就是說如果條件狀況變得與訓(xùn)練時(shí)很不相同，系統(tǒng)的性能下降不能是突變的。

25、②增加系統(tǒng)的適應(yīng)能力，系統(tǒng)要能穩(wěn)定連續(xù)的適應(yīng)條件的變化，因?yàn)檎f話人存在著年齡、性別、口音、語速、語音強(qiáng)度、發(fā)音習(xí)慣等方面的差異。

26、所以，系統(tǒng)應(yīng)該有能力排除掉這些差異。

27、達(dá)到對(duì)語音的穩(wěn)定識(shí)別。

28、③尋求更好的語言模型，系統(tǒng)應(yīng)該在語言模型中得到盡可能多的約束，從而解決由于詞匯量增長所帶來的影響。

29、④進(jìn)行動(dòng)力學(xué)建模，語音識(shí)別系統(tǒng)提前假定片段和單詞是相互獨(dú)立的，但實(shí)際上詞匯和音素的線索要求對(duì)反映了發(fā)聲器官運(yùn)動(dòng)模型特點(diǎn)的整合。

30、所以，應(yīng)該進(jìn)行動(dòng)力學(xué)建模，從而將這些信息整合到語音識(shí)別系統(tǒng)中去。

31、　　6、統(tǒng)的組成和分類　　根據(jù)識(shí)別的對(duì)象不同語音識(shí)別大致上可分為3類：對(duì)孤立詞識(shí)別，對(duì)關(guān)鍵詞識(shí)別和對(duì)連續(xù)語音識(shí)別。

32、其中，孤立詞識(shí)別的任務(wù)是識(shí)別事先已知的孤立的詞；連續(xù)語音識(shí)別的任務(wù)則是識(shí)別任意的連續(xù)語音；連續(xù)語音流中的關(guān)鍵詞檢測針對(duì)的是連續(xù)語音，但它并不識(shí)別全③部文字，而只是檢測已知的若干關(guān)鍵詞在何處出現(xiàn)，根據(jù)針對(duì)的發(fā)音人，可以把語音識(shí)別技術(shù)分為特定人語音識(shí)別和非特定人語音識(shí)別，前者只能識(shí)別一個(gè)或幾個(gè)人的語音，而后者則可以被任何人使用。

33、　　7、語音識(shí)別技術(shù)應(yīng)用領(lǐng)域及前景展望　　語音識(shí)別技術(shù)借助飛速發(fā)展的高速信息網(wǎng)，可實(shí)現(xiàn)計(jì)算機(jī)的全球聯(lián)網(wǎng)和信息資源共享，因此被廣泛應(yīng)用的系統(tǒng)有：語音輸入和控制系統(tǒng)，語音撥號(hào)系統(tǒng)、智能家電及玩具，智能電話查詢系統(tǒng)，數(shù)據(jù)庫檢索等方面，在咨詢服務(wù)、教育等行業(yè)，正潛移默化地改變和便利著我們的生活。

34、此外，語音識(shí)別系統(tǒng)還在多媒體手機(jī)、個(gè)人掌上電腦、車載導(dǎo)航器GPS等方面有著巨大的應(yīng)用和市場前景。

35、　　8、結(jié)語　　語音識(shí)別是非常有發(fā)展?jié)摿Φ囊婚T學(xué)科，你可以設(shè)想。

36、我們平時(shí)生活中很多地方都可以用到它，可以大大便利我們的生活和工作，比如智能手機(jī)，智能空調(diào)及冰箱，電動(dòng)門，汽車導(dǎo)航，機(jī)器人控制，醫(yī)療設(shè)施，軍事設(shè)備等。

37、可以毫不夸張的說，21世紀(jì)將會(huì)是語音識(shí)別廣泛流行和普及的時(shí)代，而語音識(shí)別產(chǎn)品和設(shè)備也會(huì)以其獨(dú)特的魅力引領(lǐng)時(shí)代潮流，成為時(shí)代追逐的寵兒和焦點(diǎn)。

本文分享完畢，希望對(duì)大家有所幫助。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請(qǐng)聯(lián)系刪除！

語音識(shí)別系統(tǒng)是什么應(yīng)用（語音識(shí)別系統(tǒng)是什么原理）

猜你喜歡

最新文章