基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究

基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究

ID:37375380

大?。?.65 MB

頁(yè)數(shù):58頁(yè)

時(shí)間:2019-05-22

基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究_第1頁(yè)
基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究_第2頁(yè)
基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究_第3頁(yè)
基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究_第4頁(yè)
基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究_第5頁(yè)
資源描述:

《基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究基于HTK的連續(xù)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)的研究摘要語(yǔ)音是人類(lèi)進(jìn)行相互通信和交流的最便捷的手段。在當(dāng)今數(shù)字化的信息時(shí)代,用數(shù)字化的技術(shù)進(jìn)行語(yǔ)音的增強(qiáng)、傳送、識(shí)別、合成、存儲(chǔ)己成為語(yǔ)音信號(hào)處理技術(shù)的學(xué)科前沿。蒙古語(yǔ)是世界范圍內(nèi)有影響的語(yǔ)言,因此蒙古語(yǔ)語(yǔ)音技術(shù)是這前沿中重要的部分且用途很廣,蒙古語(yǔ)語(yǔ)音識(shí)別的研究也日益受到重視。本文就是在這種情況下對(duì)蒙古語(yǔ)語(yǔ)音識(shí)別技術(shù)做了一些研究。本文基于語(yǔ)音產(chǎn)主的模型,從時(shí)域、頻域,特別是從倒譜出發(fā),對(duì)語(yǔ)音信號(hào)進(jìn)行分析,并結(jié)合模式識(shí)別的理論,論述

2、語(yǔ)音識(shí)別的基本理論。HTK是劍橋大學(xué)語(yǔ)音組開(kāi)發(fā)的一個(gè)極方便的、使用連續(xù)密度函數(shù)隱Markov模型來(lái)創(chuàng)建語(yǔ)音識(shí)別系統(tǒng)的軟件工具包。因此,本文以HTK為框架,創(chuàng)建了國(guó)內(nèi)第一個(gè)蒙古語(yǔ)語(yǔ)音識(shí)別系統(tǒng)。本系統(tǒng)運(yùn)用了5個(gè)狀態(tài)的混和高斯密度的隱Markov模型,分別用Baum-Welch重估算法和基于TokenPassing的N-Best算法作為模型的訓(xùn)練和識(shí)別算法。本系統(tǒng)分別采用音素、三音子和音節(jié)作為識(shí)別單元,訓(xùn)練出了三套不同的HMM模型,并在基于特定人、非特定人、環(huán)境噪音較大等情況下分別測(cè)試識(shí)別系統(tǒng)的性能。在每種條件下

3、,用相同的測(cè)試數(shù)據(jù)對(duì)三套模型進(jìn)行識(shí)別測(cè)試,記錄并比較三種識(shí)別單元選取方法所訓(xùn)練得到的模型的識(shí)別率。關(guān)掛詞:語(yǔ)音識(shí)別,隱Markov模型,蒙古語(yǔ),HTK,Mel倒譜系數(shù)內(nèi)蒙古大學(xué)碩士論文THERESEARCHOFHTKBASEDCONTINUOUSMONGOLIANSPEECHRECOGNITIONSYSTEMABSTRACTincontemporarydigitaltimes,theresearchaboutdigitSpeechrecognitionismoreandmorenoticed,sinceso

4、measpects妙digitaltechnique,suchasspeechintensification,Speechtransmission,speechrecognition,speechsynthesisandspeechdeposit,arethefrontpartsofspeechsignalprocessing,ofwhichMongoliananimportantpart,andinmanyareasbecauseMongolianisatheauthorhasdonesomeresear

5、ches.Onthebasisofthemodelofspeechgeneration,thespeechsignalisanalyzesinthetimedomain,inthedomain,andespeciallyinthecepstrum.Andthen,withthetheoryofpatternrecognition,thefundamentaltheoryofspeechrecognitionisdiscussedinthethesis.HTKisaportablesoftwaretoolki

6、tforbuildingspeechrecognitionsystemsusingcontinuousdensityhiddenMarkovmodelsdevelopedbytheCambridgeUniversitySpeechGroup.Oneparticularlysuccessfultypeofsystemusesmixturedensityfive-stateHMMS.inthisthesis,wehaveusedthistechniqueforthe57syllables,30phonemesa

7、nd132triphonesMongoliaspeechrecognitiontask.Weusedtheapproachthatusingsyllables,phonemeandtriphonemodels.SystemsofHMMandBaum-WelchreestimationalgorithmsisbasedonN-BestalgorithmsisusedtoRecognize.Ourutilizedtopassingcurrentsystemscanrunforrealtimecontinuous

8、Mongoliaspeechrecognition,andcorrectrateisgoodinnonoise,MFCCKEYWORD:speechhiddenmodel,recognize,V內(nèi)蒙古大學(xué)碩士論文其中較為典型的是美國(guó)Sensory公司的語(yǔ)音識(shí)別芯片RSC-X64系列;各種電子產(chǎn)品上也加入了語(yǔ)音識(shí)別的功能,如Philip和三星的手機(jī)即加入了特定人人名識(shí)別的功能。我國(guó)語(yǔ)音識(shí)別研究工作一直緊跟國(guó)際水平,

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。