資源描述:
《連續(xù)語音識別中半連續(xù)hmm碩士論文》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、密級:內(nèi)部連續(xù)語音識別中半連續(xù)HMM的研究及實(shí)現(xiàn)ResearchandImplementofSCHMMinCSR(申請清華大學(xué)工學(xué)碩士學(xué)位論文)院(系、所):計算機(jī)科學(xué)與技術(shù)系專業(yè):計算機(jī)應(yīng)用研究生:李軍指導(dǎo)教師:朱小燕教授2002年5月獨(dú)創(chuàng)性聲明本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得清華大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作
2、了明確的說明并表示了謝意。簽名:日期:關(guān)于論文使用授權(quán)的說明本人完全了解清華大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定,即:學(xué)校有權(quán)保留送交論文的復(fù)印件,允許論文被查閱和借閱;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以采用影印、縮印或其他復(fù)制手段保存論文。簽名:導(dǎo)師簽名:日期:摘要SCHMM作為一種有效的語音識別技術(shù),它充分地吸收了離散HMM和連續(xù)HMM的優(yōu)點(diǎn),具有識別精度高搜索速度快等特點(diǎn)。特別是它的碼本綁定策略,由于從全局的角度來共享和調(diào)整碼本,所生成的碼本性能更好,能夠有效地反映語音空間的特征,因此只要少量的碼本就能使系統(tǒng)達(dá)到較好的
3、性能,大大減輕了碼本計算的復(fù)雜性,提高了系統(tǒng)識別的速度。研究內(nèi)容包括如下幾個方面:1.在初始碼本生成中引入了隨機(jī)松弛算法,SCHMM的初始碼本生成是一個矢量量化的問題,量化的困難是量化結(jié)果通常會陷入局部最優(yōu),采用隨機(jī)松弛算法能夠比較好地克服這個缺點(diǎn)。2.在連續(xù)語音訓(xùn)練中,通過減去句子單元信息,克服了Baum-Welch算法訓(xùn)練不同類型句子時發(fā)生數(shù)據(jù)奇異的缺陷。3.改進(jìn)了SCHMM的搜索算法,通過對碼本進(jìn)行剪枝,Beam剪枝等措施,在保證一定識別率的前提下,大大減少了搜索在時間和空間上的消耗,加快了搜索的速度。4.實(shí)現(xiàn)了一個基
4、于SCHMM的連續(xù)語音訓(xùn)練和識別系統(tǒng)。關(guān)鍵詞:語音識別,半連續(xù)HMM,碼本,隨機(jī)松弛,搜索IVAbstractAsanefficienttechnologyofspeechrecognition,SemiContinuousHMM(SCHMM)integratestheadvantagesofdiscreteHMMandcontinuousHMM,andprovidesahighrecognitionaccuracyandsatisfactoryspeed.Inparticular,sincethesharingandmod
5、ificationofcodebooksinglobalscope,thecode-bindingstrategymakesitpossibletogeneratemuchbettercodebooksthatcoulddescribethefeatureofacousticspacemoreaccurately.Insuchacase,smallcodebookscanprovidesatisfactoryperformancesothatthecomputationalcomplexityisreducedandther
6、ecognitionspeedisincreased.Thekeyresearchcontainsthefollows1.Thealgorithmofstochasticrelaxationisintroducedintocodebookinitialization.CodebookinitializationofSCHMMisaproblemofvectorquantification,whosetroubleisthatthequantificationresultoftenreachesthelocalminimalp
7、oint.Theintroductionofstochasticrelaxationovercomesthisprobleminourexperiments.2.Incontinuousspeechtraining,thedisadvantagethatBaum-Welchalgorithmcouldbethrownintodataodditybecauseofdifferentsentencesgivesvariousweightstotheestimationisresolvedbysubtractingsentence
8、information.3.Throughcodebookselection,beampruning,thesearchalgorithmofSCHMMismodifiedsothatthecostofsearchisreducedintermsofbothtimeandspace,inc