基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究

基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究

ID:37375380

大?。?.65 MB

頁數(shù):58頁

時間:2019-05-22

基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究_第1頁
基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究_第2頁
基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究_第3頁
基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究_第4頁
基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究_第5頁
資源描述:

《基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究摘要語音是人類進行相互通信和交流的最便捷的手段。在當今數(shù)字化的信息時代,用數(shù)字化的技術(shù)進行語音的增強、傳送、識別、合成、存儲己成為語音信號處理技術(shù)的學(xué)科前沿。蒙古語是世界范圍內(nèi)有影響的語言,因此蒙古語語音技術(shù)是這前沿中重要的部分且用途很廣,蒙古語語音識別的研究也日益受到重視。本文就是在這種情況下對蒙古語語音識別技術(shù)做了一些研究。本文基于語音產(chǎn)主的模型,從時域、頻域,特別是從倒譜出發(fā),對語音信號進行分析,并結(jié)合模式識別的理論,論述

2、語音識別的基本理論。HTK是劍橋大學(xué)語音組開發(fā)的一個極方便的、使用連續(xù)密度函數(shù)隱Markov模型來創(chuàng)建語音識別系統(tǒng)的軟件工具包。因此,本文以HTK為框架,創(chuàng)建了國內(nèi)第一個蒙古語語音識別系統(tǒng)。本系統(tǒng)運用了5個狀態(tài)的混和高斯密度的隱Markov模型,分別用Baum-Welch重估算法和基于TokenPassing的N-Best算法作為模型的訓(xùn)練和識別算法。本系統(tǒng)分別采用音素、三音子和音節(jié)作為識別單元,訓(xùn)練出了三套不同的HMM模型,并在基于特定人、非特定人、環(huán)境噪音較大等情況下分別測試識別系統(tǒng)的性能。在每種條件下

3、,用相同的測試數(shù)據(jù)對三套模型進行識別測試,記錄并比較三種識別單元選取方法所訓(xùn)練得到的模型的識別率。關(guān)掛詞:語音識別,隱Markov模型,蒙古語,HTK,Mel倒譜系數(shù)內(nèi)蒙古大學(xué)碩士論文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso

4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear

5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki

6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa

7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous

8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise,MFCCKEYWORD:speechhiddenmodel,recognize,V內(nèi)蒙古大學(xué)碩士論文其中較為典型的是美國Sensory公司的語音識別芯片RSC-X64系列;各種電子產(chǎn)品上也加入了語音識別的功能,如Philip和三星的手機即加入了特定人人名識別的功能。我國語音識別研究工作一直緊跟國際水平,

當前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。