基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究

ID：37375380

大?。?.65 MB

頁數(shù)：58頁

時間：2019-05-22

資源描述：

《基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究摘要語音是人類進行相互通信和交流的最便捷的手段。在當今數(shù)字化的信息時代，用數(shù)字化的技術(shù)進行語音的增強、傳送、識別、合成、存儲己成為語音信號處理技術(shù)的學(xué)科前沿。蒙古語是世界范圍內(nèi)有影響的語言，因此蒙古語語音技術(shù)是這前沿中重要的部分且用途很廣，蒙古語語音識別的研究也日益受到重視。本文就是在這種情況下對蒙古語語音識別技術(shù)做了一些研究。本文基于語音產(chǎn)主的模型，從時域、頻域，特別是從倒譜出發(fā)，對語音信號進行分析，并結(jié)合模式識別的理論，論述

2、語音識別的基本理論。HTK是劍橋大學(xué)語音組開發(fā)的一個極方便的、使用連續(xù)密度函數(shù)隱Markov模型來創(chuàng)建語音識別系統(tǒng)的軟件工具包。因此，本文以HTK為框架，創(chuàng)建了國內(nèi)第一個蒙古語語音識別系統(tǒng)。本系統(tǒng)運用了5個狀態(tài)的混和高斯密度的隱Markov模型，分別用Baum-Welch重估算法和基于TokenPassing的N-Best算法作為模型的訓(xùn)練和識別算法。本系統(tǒng)分別采用音素、三音子和音節(jié)作為識別單元，訓(xùn)練出了三套不同的HMM模型，并在基于特定人、非特定人、環(huán)境噪音較大等情況下分別測試識別系統(tǒng)的性能。在每種條件下

3、，用相同的測試數(shù)據(jù)對三套模型進行識別測試，記錄并比較三種識別單元選取方法所訓(xùn)練得到的模型的識別率。關(guān)掛詞:語音識別，隱Markov模型，蒙古語，HTK,Mel倒譜系數(shù)內(nèi)蒙古大學(xué)碩士論文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso

4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear

5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki

6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa

7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous

8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise，MFCCKEYWORD:speechhiddenmodel,recognize,V內(nèi)蒙古大學(xué)碩士論文其中較為典型的是美國Sensory公司的語音識別芯片RSC-X64系列;各種電子產(chǎn)品上也加入了語音識別的功能，如Philip和三星的手機即加入了特定人人名識別的功能。我國語音識別研究工作一直緊跟國際水平，

當前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 58



此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究

基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究

相關(guān)文章

相關(guān)標簽