隱馬爾可夫模型綜述

隱馬爾可夫模型綜述

ID:15127246

大?。?52.00 KB

頁數(shù):10頁

時間:2018-08-01

隱馬爾可夫模型綜述_第1頁
隱馬爾可夫模型綜述_第2頁
隱馬爾可夫模型綜述_第3頁
隱馬爾可夫模型綜述_第4頁
隱馬爾可夫模型綜述_第5頁
資源描述:

《隱馬爾可夫模型綜述》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。

1、隱馬爾可夫模型綜述于江德摘 要:隱馬爾可夫模型是一種有著廣泛應用的統(tǒng)計模型,它是在馬爾可夫模型基礎上發(fā)展起來的。本文首先簡要介紹了馬爾可夫模型,然后對隱馬爾可夫模型的基本概念、一般形式、三個基本問題及其解決算法進行了詳細介紹,最后就隱馬爾可夫模型的應用及當前研究的熱點、難點進行了論述。關鍵字:馬爾可夫模型;隱馬爾可夫模型;前向算法;后向算法;韋特比算法1引言隱馬爾可夫模型(HiddenMarkovModel,簡稱HMM)是一種用參數(shù)表示,用于描述隨機過程統(tǒng)計特性的概率模型,它是在馬爾可夫模型基礎上發(fā)展起來的。早在20世紀的6

2、0年代末和70年代初,HMM的基本理論就由Baum等人建立起來了,并由卡耐基-梅隆大學(CMU)的Baker和IBM的Jelinek等人將其應用到語音識別之中,取得了很大的成功[1]。但是,HMM引起世界各國從事語音處理研究的學者們廣泛關注,并成為語音識別系統(tǒng)中構(gòu)建統(tǒng)計模型的重要手段,卻是20世紀80年代中期以后的事情,究其原因主要有兩個[1]:首先,HMM理論起先發(fā)表在數(shù)學雜志上,并未被很多從事語音處理研究的工程技術人員獲悉。其次,HMM首次應用于語音處理時,并沒有提供足夠的一般性介紹,從而使得多數(shù)研究人員無法理解其基本理

3、論并將其應用到自己所從事的研究中去。直到1983年以后,Bell實驗室的Rabiner等人發(fā)表了很有影響的一系列系統(tǒng)介紹HMM的理論和應用的文章[1]上述狀況才得以根本改變。從上世紀80年代末開始,馬爾可夫模型和隱馬模型除了在語音識別領域繼續(xù)得到廣泛應用外,從上世紀90年代初到現(xiàn)在,HMM開始用到許多新的領域,如:自然語言處理領域的詞性標注(Part-of-speechTagging)[2~7]、命名實體識別[8]、特定信息抽取[9,10]、詞法分析等;生物信息學中HMM被廣泛用來分析基因序列[2,11]等。由于HMM是建立

4、在馬爾可夫模型基礎之上的,因此,本文首先簡要介紹馬爾可夫模型,然后對隱馬爾可夫模型的基本概念、一般形式、三個基本問題及其解決算法進行詳細介紹,最后就隱馬爾可夫模型的應用及當前研究的熱點、難點進行論述。2馬爾可夫模型馬爾可夫模型最早是由AndreiA.Markov于1913年提出的[2]10,它的最初始目的是為了語言上的應用,即為俄國文學作品中的字母序列建模,隨后馬爾可夫模型發(fā)展成了一個通用的統(tǒng)計模型。為了區(qū)別于HMM,一般把馬爾可夫模型稱為顯馬爾可夫模型(VisibleMarkovModel,簡稱VMM)。馬爾可夫模型描述了

5、一類重要的隨機過程,該過程對應了一個隨機變量序列(通常與時間有關),該序列滿足這樣的條件:序列中的隨機變量值只依賴于它前面的隨機變量。這樣的隨機變量序列,通常稱為一個馬爾可夫鏈。在實際工作中有很多類似的系統(tǒng),該系統(tǒng)有N個狀態(tài)S1,S2,……,SN,隨著時間的推移,該系統(tǒng)從某一狀態(tài)轉(zhuǎn)移到另一狀態(tài)。我們將在時間t的狀態(tài)記為qt。對該系統(tǒng)的描述通常需要給出系統(tǒng)的當前狀態(tài)(時間為t的狀態(tài))及其之前的所有狀態(tài),這些狀態(tài)序列就構(gòu)成了隨機變量序列。綜上所述,我們可以給出馬爾可夫模型如下形式定義:假設一個取值為S={s1,s2,.,sN}的

6、隨機變量序列X={X1,X2,.,XT},當該序列具有以下性質(zhì):(1)有限視野性:即當前狀態(tài)只與前n個狀態(tài)有關,如公式2.1所示。P(qt=sj

7、qt-1=si,qt-2=s,……)=P(qt=sj

8、qt-1=si,qt-2=s,…,qt-n)(2.1)如果在特定情況下,系統(tǒng)在時間t的狀態(tài)只與其在時間t-1的狀態(tài)相關,則該系統(tǒng)構(gòu)成一個離散的一階馬爾可夫鏈,公式2.1就簡化為2.2:P(qt=sj

9、qt-1=si,qt-2=s,……)=P(qt=sj

10、qt-1=si)(2.2)(2)時間不變性:即只考慮公式2.2獨立于時間t的

11、隨機過程,也就是說對任何時間t該公式都成立。P(qt=sj

12、qt-1=si,qt-2=s,……)=P(qt=sj

13、qt-1=si)=aij1≤i,j≥N(2.3)該概率aij就稱為狀態(tài)轉(zhuǎn)移概率。我們就稱該隨機變量序列為馬爾可夫鏈、或者一個馬爾可夫過程,這樣一個模型就稱為馬爾可夫模型。顯而易見一個馬爾可夫模型由以下幾個部分組成:狀態(tài)空間S={s1,s2,.,sN}隨機狀態(tài)序列變量X={X1,X2,.,XT}狀態(tài)轉(zhuǎn)移概率矩陣A={aij},1≤i≤N,1≤j≤N開始狀態(tài)向量Π={πi=P(X1=si)},1≤i≤N這樣,可以記一

14、個馬爾可夫模型為一個四元組:λ={S,X,П,A}或簡寫為一個二元組:λ={П,A}10馬爾可夫模型也可以用狀態(tài)轉(zhuǎn)換圖來表示[2]。在這個狀態(tài)轉(zhuǎn)換圖中,每個狀態(tài)轉(zhuǎn)移用一個轉(zhuǎn)換箭頭表示,每個狀態(tài)用一個結(jié)點表示。每個箭頭從轉(zhuǎn)換前狀態(tài)結(jié)點指向轉(zhuǎn)換后的狀態(tài)結(jié)點,箭頭上標有狀態(tài)間轉(zhuǎn)換概率。每個結(jié)點的

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。