資源描述:
《基于前向-后向hmm的連續(xù)語音識(shí)別系統(tǒng)的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、萬方數(shù)據(jù)計(jì)算機(jī)工程與設(shè)計(jì)ComputerEngineeringandDesign2009,30(18)4339·開發(fā)與應(yīng)用·基于前向一后向HMM的連續(xù)語音識(shí)別系統(tǒng)的研究于曉明,柏松(陜西科技大學(xué)電氣與信.g-工程學(xué)院,陜西西安710021)摘要:在分析語音識(shí)別原理的基礎(chǔ)上采用TMS320DM642DPS芯片,利用前向一后向HMM聲學(xué)模型和Viterbi算法進(jìn)行模式訓(xùn)練和識(shí)別,設(shè)計(jì)了一種連續(xù)的、小詞量的語音識(shí)別系統(tǒng)。實(shí)驗(yàn)結(jié)果表明,該語音識(shí)別系統(tǒng)具有較高的識(shí)別率和一定程度的魯棒性,實(shí)驗(yàn)室識(shí)別率和室外識(shí)別率分別達(dá)到9
2、6.8%J,L91.2%,該語音識(shí)別系統(tǒng)具有良好的實(shí)用性和可移植性.關(guān)鍵詞:隱馬爾可夫模型;語音識(shí)別;Markov鏈:Viterbi算法;語音模型;模式匹配中圖法分類號(hào):TN912.34文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000.7024(2009)18.4339.03ResearchonspeechrecognitionsystembasedonforwardandbackwardHMMYUXiao-ming.BAISong(SchoolofElectricalandInformationEngineering,Sha
3、anxiUniversityofScienceandTechnology,Xi’an710021,China)Abstract:BasedontheresearchfortheprincipleofspeechrecognitionandchipsofTMS320DM642DPS,usingacousticmodelsofforward-backwardHMMandViterbialgorithmmodeltotrainmodelandrecognition,thenaspeechrecognitionsyst
4、emofcontinuousandsmallvocabularyisestablished.Examplesshowthatthisvoicerecognitionsystemhasahighrecognitionrateanditisrobustinacertainextent,thelaboratoryandoutsiderecognitionratereacheashi29has96.8%and91.2%.thisspeechrecognitionsystemhasagoodpracticalortran
5、splantation.Keywords:hiddenMarkovmodel(HMM);speechrecognition;Markovchains;Viterbialgorithm;languagemodel;paaemmatch0引言語音識(shí)別技術(shù)是近幾年語音處理領(lǐng)域出現(xiàn)的~個(gè)關(guān)鍵技術(shù)。語音識(shí)別的目的就是研制出一種具有人類聽覺功能的系統(tǒng),以便能夠直接聽懂人的講話,并做出相應(yīng)的反應(yīng)。這種具備了語音識(shí)別功能的系統(tǒng)在互聯(lián)網(wǎng)、通信、軍事、國防等方面具有十分重要的價(jià)值。同時(shí),在語音識(shí)別技術(shù)發(fā)展過程中又以HMM的廣泛應(yīng)用
6、為特點(diǎn),該算法通過對(duì)大量語音數(shù)據(jù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì),建立識(shí)別詞條的統(tǒng)計(jì)模型,然后從待識(shí)別語音中提取特征,與這些模型匹配,通過比較匹配概率以獲得識(shí)別結(jié)果,并且通過大量的語音,就能夠獲得一個(gè)穩(wěn)健的統(tǒng)計(jì)模型,能夠適應(yīng)實(shí)際語音中的各種突發(fā)情況。本文在技創(chuàng)公司DM642多路實(shí)時(shí)圖像處理開發(fā)平臺(tái)上實(shí)現(xiàn)該識(shí)別系統(tǒng),通過反復(fù)測試,該系統(tǒng)在較小噪聲環(huán)境中具有很好的魯棒性,同時(shí)具有較高的識(shí)別率和正確率。1HMM識(shí)別算法在語音識(shí)別中的實(shí)現(xiàn)1.1.Markov鏈語音信號(hào)是一個(gè)可觀察的序列,如果能用一個(gè)模型描述該序列,那么就有可能去識(shí)別它。語
7、音信號(hào)在足夠小時(shí)間段上的特性近似于穩(wěn)定,7而總的過程可看作依次從相對(duì)穩(wěn)定的某一特性過渡到另一特性,那么在整個(gè)分析區(qū)間內(nèi)可將許多線性模型串接起來,這就是Markov鏈。Markov鏈?zhǔn)荕arkov隨機(jī)過程的特殊情況,即Markov鏈?zhǔn)綘顟B(tài)和時(shí)間參數(shù)都離散的Markov過程。定義如下:隨機(jī)過程xn,它的狀態(tài)宅間為(0.,0:,0,I.“,oN),它在m+k時(shí)刻所處的狀態(tài)為q。的概率。只與它在m時(shí)刻的狀態(tài)q。有關(guān),而與m時(shí)刻以前它所處的狀態(tài)無關(guān),即有P(Xn=q—√X。2q。,X。l=q。-,?,X·=qt)2PO(
8、一=q一/X=q。)qt,q2,?,‰,?,q?!啊?0一,0z,0:,?,eN)(1)式中:Ⅺ一Markov鏈,式(1)表示的性質(zhì)稱為無后效性,并且稱PⅡ(m,re+k)=P(q。q=O/q。=0J(2)式中:1≤i,j≤N,m,k為正整數(shù),為k步轉(zhuǎn)移概率。一般的轉(zhuǎn)移概率不僅與狀態(tài)有關(guān),而且與時(shí)刻m有關(guān)。當(dāng)P;;(m,re+k)與m無關(guān)時(shí),Markov鏈具有平穩(wěn)的轉(zhuǎn)移概率,稱這個(gè)Ma