資源描述:
《基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究摘要語(yǔ)音是人類(lèi)進(jìn)行相互通信和交流的最便捷的手段。在當(dāng)今數(shù)字化的信息時(shí)代,用數(shù)字化的技術(shù)進(jìn)行語(yǔ)音的增強(qiáng)、傳送、識(shí)別、合成、存儲(chǔ)己成為語(yǔ)音信號(hào)處理技術(shù)的學(xué)科前沿。蒙古語(yǔ)是世界范圍內(nèi)有影響的語(yǔ)言,因此蒙古語(yǔ)語(yǔ)音技術(shù)是這前沿中重要的部分且用途很廣,蒙古語(yǔ)語(yǔ)音識(shí)別的研究也日益受到重視。本文就是在這種情況下對(duì)蒙古語(yǔ)語(yǔ)音識(shí)別技術(shù)做了一些研究。本文基于語(yǔ)音產(chǎn)主的模型,從時(shí)域、頻域,特別是從倒譜出發(fā),對(duì)語(yǔ)音信號(hào)進(jìn)行分析,并結(jié)合模式識(shí)別的理論,論述
2、語(yǔ)音識(shí)別的基本理論。HTK是劍橋大學(xué)語(yǔ)音組開(kāi)發(fā)的一個(gè)極方便的、使用連續(xù)密度函數(shù)隱Markov模型來(lái)創(chuàng)建語(yǔ)音識(shí)別系統(tǒng)的軟件工具包。因此,本文以HTK為框架,創(chuàng)建了國(guó)內(nèi)第一個(gè)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)。本系統(tǒng)運(yùn)用了5個(gè)狀態(tài)的混和高斯密度的隱Markov模型,分別用Baum-Welch重估算法和基于TokenPassing的N-Best算法作為模型的訓(xùn)練和識(shí)別算法。本系統(tǒng)分別采用音素、三音子和音節(jié)作為識(shí)別單元,訓(xùn)練出了三套不同的HMM模型,并在基于特定人、非特定人、環(huán)境噪音較大等情況下分別測(cè)試識(shí)別系統(tǒng)的性能。在每種條件下
3、,用相同的測(cè)試數(shù)據(jù)對(duì)三套模型進(jìn)行識(shí)別測(cè)試,記錄并比較三種識(shí)別單元選取方法所訓(xùn)練得到的模型的識(shí)別率。關(guān)掛詞:語(yǔ)音識(shí)別,隱Markov模型,蒙古語(yǔ),HTK,Mel倒譜系數(shù)內(nèi)蒙古大學(xué)碩士論文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso
4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear
5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki
6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa
7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous
8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise,MFCCKEYWORD:speechhiddenmodel,recognize,V內(nèi)蒙古大學(xué)碩士論文其中較為典型的是美國(guó)Sensory公司的語(yǔ)音識(shí)別芯片RSC-X64系列;各種電子產(chǎn)品上也加入了語(yǔ)音識(shí)別的功能,如Philip和三星的手機(jī)即加入了特定人人名識(shí)別的功能。我國(guó)語(yǔ)音識(shí)別研究工作一直緊跟國(guó)際水平,