資源描述:
《語(yǔ)音識(shí)別htk代碼學(xué)習(xí)手冊(cè)范本》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫(kù)。
1、完美WORD格式HMM的理論基礎(chǔ)一、HMM定義1.??????N:模型中狀態(tài)的數(shù)目,記t時(shí)刻Markov鏈所處的狀態(tài)為2.??????M:每個(gè)狀態(tài)對(duì)應(yīng)的可能的觀察數(shù)目,記t時(shí)刻觀察到的觀察值為3.??????:初始狀態(tài)概率矢量,,,4.??????A:狀態(tài)轉(zhuǎn)移概率矩陣,,,5.??????B:觀察值概率矩陣(適用于離散HMM),,,;對(duì)于連續(xù)分布的HMM,記t時(shí)刻的觀察值概率為一個(gè)離散型的HMM模型可以簡(jiǎn)約的記為。二、關(guān)于語(yǔ)音識(shí)別的HMM的三個(gè)基本問題1.已知觀察序列和模型參數(shù),如何有效的計(jì)算。a.直接計(jì)算??
2、????????????2-1整理分享完美WORD格式當(dāng)N=5,T=100時(shí)大概需進(jìn)行次乘法!b.前向算法定義t時(shí)刻的前向變量(forwardvariable),可以通過迭代的方法來計(jì)算各個(gè)時(shí)刻的前向變量:1)初始化(Initialization)當(dāng)t=1時(shí)????2-22)遞歸(Induction)當(dāng)時(shí)???即:???????????????2-33)終結(jié)(Termination)????????????????????2-4乘法次數(shù)大約為:N2T整理分享完美WORD格式c.后向算法定義t時(shí)刻的后向變量(ba
3、ckwardvariable),可以通過迭代的方法來計(jì)算各個(gè)時(shí)刻的后向變量:1)???初始化(Initialization)當(dāng)t=T時(shí),??????????????????????2-52)???遞歸(Induction)當(dāng)時(shí)?????即:,??????????2-63)???終結(jié)(Termination)??????????????????2-7?????????????乘法計(jì)算次數(shù)約為:N2T2.已知觀察序列和模型參數(shù),在最佳意義上確定一個(gè)狀態(tài)序列。定義一個(gè)后驗(yàn)概率變量(posterioriprobabil
4、ityvariable)整理分享完美WORD格式??????????2-7??????則最優(yōu)序列可以通過,??????????2-7求得。不過,這樣求得的最優(yōu)序列有些問題。如果,那么這個(gè)最優(yōu)序列本身就不存在。這里討論的最佳意義上的最優(yōu)序列,是使最大化時(shí)的確定的狀態(tài)序列。即,使最大化時(shí)確定的狀態(tài)序列。??????定義為t時(shí)刻沿一條路徑,且,輸出觀察序列的最大概率,即:2-8??????下面介紹迭代計(jì)算的Viterbi算法:1)???初始化(Initialization),回溯變量:,2)???遞歸(Inducti
5、on)即:????????????????2-8??????????????????2-9整理分享完美WORD格式3)???終結(jié)(Termination)??????????????????2-10???????????????????2-114)???回溯狀態(tài)序列,???????????2-123.已知觀察序列和模型參數(shù),如何調(diào)整模型參數(shù)使最大。定義3.1給定訓(xùn)練序列和模型,時(shí)刻Markov鏈處在狀態(tài)和時(shí)刻處在狀態(tài)的概率定義如下??????3-1定義3.2給定訓(xùn)練序列和模型,時(shí)刻Markov鏈處在狀態(tài)的概率定
6、義如下???????????????3-2定義3.3給定訓(xùn)練序列和模型,從狀態(tài)轉(zhuǎn)移出去的概率為定義3.4給定訓(xùn)練序列和模型,從狀態(tài)轉(zhuǎn)移到狀態(tài)的概率為利用Baum-Welch重估算法可以得到使局部最大時(shí)的參數(shù)更新公式。1.?Baum-Welch重估公式的理論基礎(chǔ)引理3.1設(shè),,為正實(shí)數(shù),,,為非負(fù)實(shí)數(shù),那么,由對(duì)數(shù)函數(shù)的凹特性,有如下結(jié)論整理分享完美WORD格式????????3-3定義輔助函數(shù)如下??????????3-4其中,為更新前模型參數(shù),為更新后模型參數(shù),為訓(xùn)練序列,為可能的狀態(tài)序列。利用和引理3.1易
7、得????????????3-5式3-5構(gòu)成了重估公式得理論基礎(chǔ),對(duì)輔助函數(shù),只要能夠找到,使,從而,這樣,更新后的模型在擬和訓(xùn)練序列方面就比更新前的模型要好,使最大而得到的的參數(shù)更新公式就稱之為Baum-Welch重估公式。引理3.2,,在的約束條件下,函數(shù)的唯一最大值點(diǎn)為。證明如下?求最大值整理分享完美WORD格式令???得:?,同理可證:利用凹函數(shù)特性可知此最大值唯一。2.???????離散HMM模型的重估公式HTK內(nèi)存管理一、????HTK內(nèi)存管理概述C語(yǔ)言編程中,遇到的關(guān)于內(nèi)存分配和釋放的問題主要有如
8、下兩個(gè)方面。第一是指針維護(hù)問題。試想,你寫的一個(gè)程序執(zhí)行了一系列內(nèi)存空間分配(通常是由malloc函數(shù)完成)操作,為了能夠在以后適當(dāng)?shù)臅r(shí)候(通常是你不再需要那些內(nèi)存時(shí))可以將分配的內(nèi)存空間釋放(通常是由free函數(shù)完成),你必須小心謹(jǐn)慎的維護(hù)好這些指向分配的內(nèi)存空間的指針。有經(jīng)驗(yàn)的程序員大概都會(huì)有這樣的感受,維護(hù)這些指針并非易事!特別是當(dāng)程序比較復(fù)雜時(shí),尤為如此。如果你一不小心(其實(shí)這