基于htk漢語連續(xù)語音識別研究

基于htk漢語連續(xù)語音識別研究

ID:32430529

大?。?.92 MB

頁數(shù):84頁

時(shí)間:2019-02-04

基于htk漢語連續(xù)語音識別研究_第1頁
基于htk漢語連續(xù)語音識別研究_第2頁
基于htk漢語連續(xù)語音識別研究_第3頁
基于htk漢語連續(xù)語音識別研究_第4頁
基于htk漢語連續(xù)語音識別研究_第5頁
資源描述:

《基于htk漢語連續(xù)語音識別研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、中國科學(xué)技術(shù)大學(xué)碩士學(xué)位論文基于HTK的漢語連續(xù)語音識別研究作者姓名:學(xué)科專業(yè):導(dǎo)師姓名:完成時(shí)間:何金鑫模式識別與智能系統(tǒng)關(guān)勝曉副教授二。一三年五月二日豸f毗UniversityofScienceandTechnologyofChinaAdissertationformaster’SdegreeStudyonChineseContinuousSpeechRecognitionBasedonHTKAuthor’SName"JinxinHespeciality:Pattemrecognitionandintelligentsystem一,一Supervisor:Ass

2、ociateProf.ShenxiaoGuan11●1’上.mlstmdtlme:May2m,2013中國科學(xué)技術(shù)大學(xué)學(xué)位論文原創(chuàng)性聲明本人聲明所呈交的學(xué)位論文,是本人在導(dǎo)師指導(dǎo)下進(jìn)行研究工作所取得的成果。除已特別加以標(biāo)注和致謝的地方外,論文中不包含任何他人已經(jīng)發(fā)表或撰寫過的研究成果。與我--N二II作的同志對本研究所做的貢獻(xiàn)均已在論文中作了明確的說明。作者簽名:彳擻簽字日期:絲叢!絲:雛中國科學(xué)技術(shù)大學(xué)學(xué)位論文授權(quán)使用聲明作為申請學(xué)位的條件之一,學(xué)位論文著作權(quán)擁有者授權(quán)中國科學(xué)技術(shù)大學(xué)擁有學(xué)位論文的部分使用權(quán),即:學(xué)校有權(quán)按有關(guān)規(guī)定向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)

3、印件和電子版,允許論文被查閱和借閱,可以將學(xué)位論文編入《中國學(xué)位論文全文數(shù)據(jù)庫》等有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文。本人提交的電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。保密的學(xué)位論文在解密后也遵守此規(guī)定。啦仫開口保密(——年)作者簽名:么勇益龐導(dǎo)師簽名:簽字日期:絲廛!魚!生簽字日期:2望!至:笸顰摘要自動(dòng)語音識別(ASR,AutomaticSpeechRecognition)是通過機(jī)器識別和理解過程,把人類的語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語音識別技術(shù)是一門綜合技術(shù),融合聲學(xué)、語音學(xué)、語義學(xué)、信號處理、心理學(xué),經(jīng)過近60年

4、的發(fā)展,已經(jīng)取得了很大的進(jìn)展。目前在特定領(lǐng)域已經(jīng)能夠達(dá)到應(yīng)用的程度,但是要實(shí)現(xiàn)大詞匯量連續(xù)語音識別還有很多難點(diǎn)有待攻克,尤其是在說話人無關(guān)、高噪音的環(huán)境下,識別準(zhǔn)確度明顯下降。本文主要研究漢語連續(xù)語音識別中涉及的關(guān)鍵技術(shù)。建立語音識別系統(tǒng)的基本流程,語音信號處理的基本理論,著重研究了端點(diǎn)檢測方法、特征提取原理及方法。然后分別從兩個(gè)角度闡述漢語連續(xù)語音識別過程:模式識別角度和基于HTK的軟件識別過程。首先,研究了漢語語音的特點(diǎn)。漢語屬于東方語系,在字形、發(fā)音方式方面與英語等西歐語系差別很大,因此要建立高質(zhì)量的語音識別系統(tǒng)需要對漢語語音的特點(diǎn)進(jìn)行深入研究。本文是基于隱馬

5、爾科夫模型(HMM)的連續(xù)語音識別,特征向量采用美爾倒譜系數(shù)(MFCC),基于上下文相關(guān)的三音素HUM,結(jié)合漢語特有的聲韻母加聲調(diào)的發(fā)音方式等一系列技術(shù),利用隱馬爾科夫模型工具箱(HTK)構(gòu)建了實(shí)驗(yàn)平臺。設(shè)計(jì)實(shí)驗(yàn)比較了不同高斯混合度(Mix)和不同音素模型下系統(tǒng)的表現(xiàn)性能。實(shí)驗(yàn)結(jié)果表明,采用上下文相關(guān)三音素模型識別精度達(dá)到98.00%,識別效果明顯。其次,利用HTK工具包,設(shè)計(jì)實(shí)現(xiàn)了漢語連續(xù)語音識別模擬系統(tǒng)。本文介紹了HTK軟件包架構(gòu)及提供的模型分析工具,利用其接口應(yīng)用程序ATK(AnApplicationToolkitforHTK)實(shí)現(xiàn)漢語連續(xù)識別系統(tǒng)并進(jìn)行相關(guān)測

6、試。關(guān)鍵詞:語音識別HTK隱馬爾科夫模型決策樹狀態(tài)綁定三音素模型IIABSTRACTAutomaticspeechrecognition(ASR)isatechnologywhichtralls南rIllshu曲ntsmtⅦalspeechintocorrespondingtextorcommandbyidertifyingandunderstandingthecontentofthediscourse.Ifsacomplexart沁砌噸acoustics,phonetics,se艘Imlcs,signalprocessing,psychology.Ithasobt

7、ainedagreatdevelopmentduringthepast60years.Currently,it'spracticableinspecializedfield.Therefore,there鋤℃stillsomedifficultiestobetreated.Undertheenvironmentofperson-協(xié)depeI】dem,∞isMtherecognitionaceuracydeclinerapidly.Inthethesis,theamhordoessomeresearchinthecriticaltechnologYofcontin

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。