資源描述:
《基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究基于HTK的連續(xù)蒙古語語音識別系統(tǒng)的研究摘要語音是人類進行相互通信和交流的最便捷的手段。在當今數(shù)字化的信息時代,用數(shù)字化的技術(shù)進行語音的增強、傳送、識別、合成、存儲己成為語音信號處理技術(shù)的學(xué)科前沿。蒙古語是世界范圍內(nèi)有影響的語言,因此蒙古語語音技術(shù)是這前沿中重要的部分且用途很廣,蒙古語語音識別的研究也日益受到重視。本文就是在這種情況下對蒙古語語音識別技術(shù)做了一些研究。本文基于語音產(chǎn)主的模型,從時域、頻域,特別是從倒譜出發(fā),對語音信號進行分析,并結(jié)合模式識別的理論,論述
2、語音識別的基本理論。HTK是劍橋大學(xué)語音組開發(fā)的一個極方便的、使用連續(xù)密度函數(shù)隱Markov模型來創(chuàng)建語音識別系統(tǒng)的軟件工具包。因此,本文以HTK為框架,創(chuàng)建了國內(nèi)第一個蒙古語語音識別系統(tǒng)。本系統(tǒng)運用了5個狀態(tài)的混和高斯密度的隱Markov模型,分別用Baum-Welch重估算法和基于TokenPassing的N-Best算法作為模型的訓(xùn)練和識別算法。本系統(tǒng)分別采用音素、三音子和音節(jié)作為識別單元,訓(xùn)練出了三套不同的HMM模型,并在基于特定人、非特定人、環(huán)境噪音較大等情況下分別測試識別系統(tǒng)的性能。在每種條件下
3、,用相同的測試數(shù)據(jù)對三套模型進行識別測試,記錄并比較三種識別單元選取方法所訓(xùn)練得到的模型的識別率。關(guān)掛詞:語音識別,隱Markov模型,蒙古語,HTK,Mel倒譜系數(shù)內(nèi)蒙古大學(xué)碩士論文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso
4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear
5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki
6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa
7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous
8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise,MFCCKEYWORD:speechhiddenmodel,recognize,V內(nèi)蒙古大學(xué)碩士論文其中較為典型的是美國Sensory公司的語音識別芯片RSC-X64系列;各種電子產(chǎn)品上也加入了語音識別的功能,如Philip和三星的手機即加入了特定人人名識別的功能。我國語音識別研究工作一直緊跟國際水平,