神武抓魚怎么玩(神武抓魚怎么玩視頻) 絕對優(yōu)勢理論和比較優(yōu)勢理論異同(絕對優(yōu)勢理論和比較優(yōu)勢理論的區(qū)別) 如何在魅族的應(yīng)用中心發(fā)布應(yīng)用或者主題(如何在魅族的應(yīng)用中心發(fā)布應(yīng)用或者主題軟件) 微信如何清理僵尸粉(微信如何清理僵尸粉又不被別人發(fā)現(xiàn)) 空中疊墅是什么意思(疊墅是什么意思) 社保滯納金怎么算(單位補(bǔ)繳社保滯納金怎么算) 手動搬運(yùn)車怎么使用(手動搬運(yùn)車怎么使用的) 專管員為什么討厭代賬會計(專管員) 百度百科博物館計劃十周年紀(jì)念微章怎么領(lǐng)取(100周紀(jì)念章) 小蘇打能治好腫瘤是真的嗎(自制蘇打水的危害) 守護(hù)光明頂1.6攻略(守護(hù)光明頂1.6通關(guān)攻略) 重癥疾病險該不該買(重癥疾病有哪些) 拼裝積木游戲怎么玩(拼裝積木游戲怎么玩的) 電熱水器使用說明書(美的電熱水器使用說明書) LED發(fā)光二極管(led發(fā)光二極管電壓是多少) 豐胸的最快方法3+3動作加瑜伽讓你擁有傲人胸器(最有效瑜伽的運(yùn)動豐胸方法) 少年歌行名劍譜排名(劍譜排名) gif動圖怎么壓縮?如何在線壓縮gif大小?(在線壓縮gif圖片大小) 楊玉環(huán)怎么玩連招(楊玉環(huán)怎么玩連招視頻) 乳糜血(乳糜) 怎么學(xué)高中歷史的竅門(怎么學(xué)高中歷史的竅門和技巧) 梨樹的作用與功效(梨樹的作用與功效圖片) 藍(lán)芩口服液的功效與作用和蒲地藍(lán)口服液的區(qū)別(藍(lán)芩口服液的功效與作用) js 隨機(jī)數(shù)整數(shù)(js隨機(jī)數(shù)整數(shù)) 湖州火車站附近酒店(湖州火車站) QQ飛車城邦守護(hù)獸怎么進(jìn)化(QQ飛車城邦守護(hù)獸) 韓式盤發(fā)簡單教程(韓式盤發(fā)簡單教程圖解) 地下城assertion failed錯誤怎么辦(assertion failed怎么解決) 向量相乘坐標(biāo)公式怎么推算出來的(向量相乘坐標(biāo)公式) 拉丁舞裙服裝怎么畫(拉丁舞裙服裝怎么畫簡筆畫) 裁決之鐮怎么解除(裁決之鐮怎么辦) 10178什么意思(1017代表什么意思) 如何選擇進(jìn)口嬰兒奶粉(如何選擇進(jìn)口嬰兒奶粉牌子) EVIDENT與深圳灣實(shí)驗(yàn)室舉辦首屆EVIDENT Discovery Center生物成像主題研討 合肥歡樂島旅游攻略(合肥歡樂島旅游攻略路線) 侏儒癥的癥狀及病因(侏儒癥的癥狀) 漂白 護(hù)理牙齒如何變白?(漂白牙齒怎么漂白) 波爾多液怎么配制?(波爾多液怎么配制用來防治西瓜枯萎病) tam是什么意思?。═AM是什么意思) 手把手教你如何用百度網(wǎng)盤下載BT種子文件(百度網(wǎng)盤如何使用種子文件下載) 采訪問題怎么寫(采訪問題) 英雄聯(lián)盟如何參與MSI半決賽活動(英雄聯(lián)盟msi比賽賽程) 架立筋圖片示意圖(架立筋圖片) 最右如何添加交友卡(最右怎么看交友卡) 鵝口瘡該如何治療(鵝口瘡該如何治療才能好) 海賊王克比頭像(海賊王克比) 怎么在機(jī)蜜租一輛特斯拉汽車?(如何租特斯拉) IE瀏覽器出錯崩潰怎么辦?(電腦提示ie瀏覽器崩潰是什么意思) 情人節(jié)送男朋友禮物嗎(情人節(jié)送男朋友禮物) AutoCAD中制作等高線地形圖(cad中怎么畫等高線地形圖)
您的位置:首頁 >百科精選 >

語音識別系統(tǒng)是什么應(yīng)用(語音識別系統(tǒng)是什么原理)

導(dǎo)讀 關(guān)于語音識別系統(tǒng)是什么應(yīng)用,語音識別系統(tǒng)是什么原理這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧

關(guān)于語音識別系統(tǒng)是什么應(yīng)用,語音識別系統(tǒng)是什么原理這個問題很多朋友還不知道,今天小六來為大家解答以上的問題,現(xiàn)在讓我們一起來看看吧!

1、我們可以設(shè)想,在不久的將來坐在辦公司里的經(jīng)理會對電腦說:“嗨!伙計,幫我通知一下公司所有員工,今天下午3:00準(zhǔn)時開會。

2、”這是科學(xué)家在幾十年前的設(shè)想,語音識別長久以來一直是人們的美好愿望,讓計算機(jī)領(lǐng)會人所說的話,實(shí)現(xiàn)人機(jī)對話是發(fā)展人機(jī)通信的主要目標(biāo)。

3、進(jìn)入2l世紀(jì),隨著計算機(jī)的日益普及,怎樣給不熟悉計算機(jī)的人提供一個友好而又簡易的操作平臺,是我們非常感興趣的問題,而語音識別技術(shù)就是其中最直接的方法之一。

4、  20世紀(jì)80年代中期以來,新技術(shù)的逐漸成熟和發(fā)展使語音識別技術(shù)有了實(shí)質(zhì)性的進(jìn)展,尤其是隱馬爾可夫模型(HMM)的研究和廣泛應(yīng)用,推動了語音識別的迅速發(fā)展,同時,語音識別領(lǐng)域也正處在一個黃金開發(fā)的關(guān)鍵時期,各國的開發(fā)人員正在向特定人到非特定人,孤立詞匯向連接詞,小詞匯量向大詞匯量來擴(kuò)展研究領(lǐng)域,可以毫不猶豫地說,語音識別會讓計算機(jī)變得“善解人意”,許多事情將不再是“對牛彈琴”,最終用戶的口述會取代鼠標(biāo),鍵盤這些傳統(tǒng)輸入設(shè)備,只需要用戶的嘴和麥克風(fēng)就能實(shí)現(xiàn)對計算機(jī)的絕對控制。

5、  隱馬爾可夫模型HMM的引入  現(xiàn)在假定HMM是一個輸出符號序列的統(tǒng)計模型,具有N個狀態(tài)S1,S2?Sn,在一個周期內(nèi)從一個狀態(tài)轉(zhuǎn)到另一個狀態(tài),每次轉(zhuǎn)移時輸出一個符號,轉(zhuǎn)移到了哪個狀態(tài)以及輸出什么符號,分別由狀態(tài)轉(zhuǎn)移概率和轉(zhuǎn)移時的輸出概率來決定,由于只能觀測到輸出符號序列,不能觀測到狀態(tài)轉(zhuǎn)移序列,因此成為隱藏的馬爾可夫模型。

6、  2、語音識別的特點(diǎn)  語音識別的意思是將人說話的內(nèi)容和意思轉(zhuǎn)換為計算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列等。

7、與說話人的識別不同,后者主要是識別和確認(rèn)發(fā)出語音的人而非其中所包含的內(nèi)容。

8、語音識別的目的就是讓機(jī)器聽懂人類口述的語言,包括了兩方面的含義:第一是逐字逐句聽懂而不是轉(zhuǎn)化成書面的語言文字;第二是對作者簡介:賈聰,中國地質(zhì)大學(xué)機(jī)械與電子信息學(xué)院。

9、口述語言中所包含的命令或請求加以領(lǐng)會,做出正確回應(yīng),而不僅僅只是拘泥于所有詞匯的正確轉(zhuǎn)換。

10、  3、語音識別系統(tǒng)的工作流程  一般來說,一套完整的語音識別系統(tǒng)其工作過程分為7步:①對語音信號進(jìn)行分析和處理,除去冗余信息。

11、②提取影響語音識別的關(guān)鍵信息和表達(dá)語言含義的特征信息。

12、③緊扣特征信息,用最小單元識別字詞。

13、④按照不同語言的各自語法,依照先后次序識別字詞。

14、⑤把前后意思當(dāng)作輔助識別條件,有利于分析和識別。

15、⑥按照語義分析,給關(guān)鍵信息劃分段落,取出所識別出的字詞并連接起來,同時根據(jù)語句意思調(diào)整句子構(gòu)成。

16、⑦結(jié)合語義,仔細(xì)分析上下文的相互聯(lián)系,對當(dāng)前正在處理的語句進(jìn)行適當(dāng)修正。

17、  4、音識別系統(tǒng)基本原理框圖及原理  語音識別系統(tǒng)基本原理結(jié)構(gòu)如圖1所示。

18、語音識別原理有三點(diǎn):①對語音信號中的語言信息編碼是按照幅度譜的時間變化來進(jìn)行;②由于語音是可以閱讀的,也就是說聲學(xué)信號可以在不考慮說話人說話傳達(dá)的信息內(nèi)容的前提下用多個具有區(qū)別性的、離散的符號來表示;③語音的交互是一個認(rèn)知過程,所以絕對不能與語法、語義和用語規(guī)范等方面分裂開來。

19、  預(yù)處理,其中就包括對語音信號進(jìn)行采樣、克服混疊濾波、去除部分由個體發(fā)音的差異和環(huán)境引起的噪聲影響,此外還會考慮到語音識別基本單元的選取和端點(diǎn)檢測問題。

20、反復(fù)訓(xùn)練是在識別之前通過讓說話人多次重復(fù)語音,從原始語音信號樣本中去除冗余信息,保留關(guān)鍵信息,再按照一定規(guī)則對數(shù)據(jù)加以整理,構(gòu)成模式庫。

21、再者是模式匹配,它是整個語音識別系統(tǒng)的核心部分,是根據(jù)一定規(guī)則以及計算輸入特征與庫存模式之間的相似度,進(jìn)而判斷出輸入語音的意思。

22、  前端處理,先對原始語音信號進(jìn)行處理,再進(jìn)行特征提取,消除噪聲和不同說話人的發(fā)音差異帶來的影響,使處理后的信號能夠更完整地反映語音的本質(zhì)特征提取,消除噪聲和不同說話人的發(fā)音差異帶來的影響,使處理后的信號能夠更完整地反映語音的本質(zhì)特征。

23、  5、當(dāng)前亟待解決的問題  語音識別系統(tǒng)的性能受到許多因素的影響,包括不同說話人的發(fā)音方式、說話方式、環(huán)境噪音、傳輸信道衰落等等。

24、具體要解決的問題有四點(diǎn):①增強(qiáng)系統(tǒng)的魯棒性,也就是說如果條件狀況變得與訓(xùn)練時很不相同,系統(tǒng)的性能下降不能是突變的。

25、②增加系統(tǒng)的適應(yīng)能力,系統(tǒng)要能穩(wěn)定連續(xù)的適應(yīng)條件的變化,因?yàn)檎f話人存在著年齡、性別、口音、語速、語音強(qiáng)度、發(fā)音習(xí)慣等方面的差異。

26、所以,系統(tǒng)應(yīng)該有能力排除掉這些差異。

27、達(dá)到對語音的穩(wěn)定識別。

28、③尋求更好的語言模型,系統(tǒng)應(yīng)該在語言模型中得到盡可能多的約束,從而解決由于詞匯量增長所帶來的影響。

29、④進(jìn)行動力學(xué)建模,語音識別系統(tǒng)提前假定片段和單詞是相互獨(dú)立的,但實(shí)際上詞匯和音素的線索要求對反映了發(fā)聲器官運(yùn)動模型特點(diǎn)的整合。

30、所以,應(yīng)該進(jìn)行動力學(xué)建模,從而將這些信息整合到語音識別系統(tǒng)中去。

31、  6、統(tǒng)的組成和分類  根據(jù)識別的對象不同語音識別大致上可分為3類:對孤立詞識別,對關(guān)鍵詞識別和對連續(xù)語音識別。

32、其中,孤立詞識別的任務(wù)是識別事先已知的孤立的詞;連續(xù)語音識別的任務(wù)則是識別任意的連續(xù)語音;連續(xù)語音流中的關(guān)鍵詞檢測針對的是連續(xù)語音,但它并不識別全③部文字,而只是檢測已知的若干關(guān)鍵詞在何處出現(xiàn),根據(jù)針對的發(fā)音人,可以把語音識別技術(shù)分為特定人語音識別和非特定人語音識別,前者只能識別一個或幾個人的語音,而后者則可以被任何人使用。

33、  7、語音識別技術(shù)應(yīng)用領(lǐng)域及前景展望  語音識別技術(shù)借助飛速發(fā)展的高速信息網(wǎng),可實(shí)現(xiàn)計算機(jī)的全球聯(lián)網(wǎng)和信息資源共享,因此被廣泛應(yīng)用的系統(tǒng)有:語音輸入和控制系統(tǒng),語音撥號系統(tǒng)、智能家電及玩具,智能電話查詢系統(tǒng),數(shù)據(jù)庫檢索等方面,在咨詢服務(wù)、教育等行業(yè),正潛移默化地改變和便利著我們的生活。

34、此外,語音識別系統(tǒng)還在多媒體手機(jī)、個人掌上電腦、車載導(dǎo)航器GPS等方面有著巨大的應(yīng)用和市場前景。

35、  8、結(jié)語  語音識別是非常有發(fā)展?jié)摿Φ囊婚T學(xué)科,你可以設(shè)想。

36、我們平時生活中很多地方都可以用到它,可以大大便利我們的生活和工作,比如智能手機(jī),智能空調(diào)及冰箱,電動門,汽車導(dǎo)航,機(jī)器人控制,醫(yī)療設(shè)施,軍事設(shè)備等。

37、可以毫不夸張的說,21世紀(jì)將會是語音識別廣泛流行和普及的時代,而語音識別產(chǎn)品和設(shè)備也會以其獨(dú)特的魅力引領(lǐng)時代潮流,成為時代追逐的寵兒和焦點(diǎn)。

本文分享完畢,希望對大家有所幫助。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章