基于htk的語音識別系統(tǒng)設計new

基于htk的語音識別系統(tǒng)設計new

ID:34539952

大小:597.87 KB

頁數:3頁

時間:2019-03-07

基于htk的語音識別系統(tǒng)設計new_第1頁
基于htk的語音識別系統(tǒng)設計new_第2頁
基于htk的語音識別系統(tǒng)設計new_第3頁
資源描述:

《基于htk的語音識別系統(tǒng)設計new》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。

1、第16卷 第10期計算機技術與發(fā)展Vol.16No.102006年10月COMPUTERTECHNOLOGYANDDEVELOPMENTOct.2006基于HTK的語音識別系統(tǒng)設計石現(xiàn)峰,張學智,張 峰(西安工業(yè)大學 陜西西安710032)摘 要:HTK是英國劍橋大學開發(fā)的一套基于C語言的語音處理工具箱,廣泛應用于語音識別、語音合成、字符識別和DNA排序等領域。文中主要介紹了HTK的基本原理和軟件結構,并且針對HTK工具箱進行了二次開發(fā),設計開發(fā)了一套完整的語音識別輸入系統(tǒng)及其相應的測試平臺,并驗證了該語音識別系統(tǒng)的識別率,實

2、驗表明,該系統(tǒng)取得了較好的語音輸入效果。關鍵詞:HTK;語音識別;HMM中圖分類號:TP18       文獻標識碼:A       文章編號:1673-629X(2006)10-0037-02DesignofSpeechRecognitionSystemBasedonHTKSHIXian2feng,ZHANGXue2zhi,ZHANGFeng(Xi’anTechnologicalUniversity,Xi’an710032,China)Abstract:HTKisaClanguage-basedtoolkitdevelope

3、dbyCUEDmeanlyusedforspeechsignalreorganization,speechsynthesis,charac2terreorganization,DNAcompositorandsoon.HTK’sgeneralprinciplesandsoftwarearchitectureisdiscussedinthispaperandasuitofspeechrecognitionsystemisdesignedbasedonHTKusingfurtherdevelopmenttechnology.Ate

4、stplatformisalsodesignedtotestthissystemandgivesthecorrectrate.Experimentalresultsaresatisfied.Keywords:HTK;speechrecognition;HMM0 引 言的。當HMM應用于孤立詞語音識別時,它用不同的隱含  語音識別是指機器通過學習實現(xiàn)從語音信號到文字狀態(tài)轉移來描述不同的語音發(fā)音。對于連續(xù)語音識別系符號的理解過程,是一種十分重要的人機交互方式。信息統(tǒng),多個孤立詞HMM子模型按一定的語言模型組成的復產業(yè)的迅速發(fā)展促使

5、許多研究機構投入了大量的人力、物合HMM模型序列來刻畫連續(xù)的語音信號,在序列中的每力和財力來研究語音識別,這一領域的突破也具有重大的個模型直接對應于相關的發(fā)音,并且,每一個模型都有進現(xiàn)實意義,讓機器能夠聽懂人類的自然語音可以解決諸如入和退出狀態(tài),這兩個狀態(tài)沒有對應的觀察矢量,只用于智能機器人、語音輸入、低碼率語音編碼等問題,突破信息不同模型的連接。處理的一個瓶頸。在孤立詞語音識別中,對于訓練數據,需要為每一個HTK(HMMToolsKit)是一個劍橋大學開發(fā)的專門發(fā)音單元提供邊界信息,常使用手工標注的方法實現(xiàn)。這用于建立和處理

6、HMM的實驗工具包[1],主要應用于語音種方法對于少量的訓練數據還可以,對于大量訓練數據是識別領域,也可以應用于語音合成、字符識別和DNA排不可行的,需要的工作量太大,而且手工標注有時并不是序等領域。HTK經過劍橋大學、Entropic公司及Microsoft很準確,這會直接影響系統(tǒng)的識別率。但是,對于大量詞公司的不斷增強和改進,使其在語音識別領域處于世界領匯、連續(xù)語音識別系統(tǒng)來講,大量的訓練數據是必需的,所先水平,另外,HTK還是一套源代碼開放的工具箱,其基以,一般情況下,在連續(xù)語音識別的模型訓練中,發(fā)音單元于ANSIC的模

7、塊化設計方式可以方便地嵌入到用戶系的邊界信息是不需要的,只需要包含相應的發(fā)音序列的描統(tǒng)中。文中介紹了HTK的原理、特點及使用,并在VC環(huán)述文件。在HTK中使用MLF格式的文件來描述發(fā)音序境下設計了一套完整的語音識別及測試系統(tǒng)。列。訓練方法也必需使用嵌入式訓練算法,這種算法把樣本中前一個模型的退出狀態(tài)和后一個模型的進入狀態(tài)按照某種方式連按起來,這樣,每一個訓練樣本就成為了一1HTK原理個組合的HMM模型,在訓練時,同時對樣本中所有模型HTK工具箱是使用HMM模型作為語音識別的核心的參數進行調整。收稿日期:2006-03-18HT

8、K的許多功能被編譯為一序列的函數庫模塊,這作者簡介:石現(xiàn)峰(1978-),男,河南人,助教,博士研究生,研究方向些模塊可以使用相同的接口方式和外界進行交互。HTK為信號與信息處理、嵌入式系統(tǒng)。的主要函數模塊的功能如下:用戶的輸入輸出和與操作系·                

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現(xiàn)內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。