資源描述:
《語音識別置信度特征提取算法研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、密級:保密期限:躊章卻碩士研究生學位論文學姓專導學號:Q2重量墨量名:墾垂晶業(yè):槿式遲別皇蟹能丕纏.師:割劇院:值皇皇通信王程堂暄2010年1月27日)北京郵電人學碩上學位論文語音識另0置信度特征提取算法研究獨創(chuàng)性c或創(chuàng)新性)聲明IYLILll111IIIIIt7LIlll51111181111151113IIill掣本人聲明所呈交的論文是本人在導師指導下進行的研究工作及耿借酮針艽成果。盡我所知,除了文中特別加以標注和致謝中所羅列的內容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含為獲得北京郵電大學或其他教育機構的學位或證書而
2、使用過的材料。與我一同工作的同志對本研究所做的任何貢獻均已在論文中作了明確的說明并表示了謝意。申請學位論文與資料若有不實之處,本人承擔一切相關責任。本人簽名:國玉昌l=蔓\瓢伊日期:2Q!Q:!:2晝關于論文使用授權的說明學位論文作者完全了解北京郵電大學有關保留和使用學位論文的規(guī)定,即:研究生在校攻讀學位期間論文工作的知識產(chǎn)權單位屬北京郵電大學。學校有權保留并向國家有關部門或機構送交論文的復印件和磁盤,允許學位論文被查閱和借閱;學??梢怨紝W位論文的全部或部分內容,可以允許采用影印、縮印或其它復制手段保存、匯編學位論文。(保密的學位論文在解
3、密后遵守此規(guī)定)保密論文注釋:本學位論文屬于保密在一年解密后適用本授權書。非保密論文注釋:本學位本人簽名:導師簽名:適用本授權書。同期:日期:2010.1.282殳f!:≥!墮一一一,北京郵電大學碩二t學位論文語音識別置信度特征語音識別置信度特征提取算法研究摘要大規(guī)模連續(xù)語音識別的研究已經(jīng)進行了二十多年,雖已取得了顯著進展,但距離廣泛應用還有相當?shù)木嚯x。在克服識別算法本身缺陷、追求識別性能提升的過程中,研究者們逐漸引入了置信度的概念,用它來衡量語音識別系統(tǒng)所作決策的可信程度。近年來,語音識別置信度在語音錯誤檢測與錯誤糾正,無監(jiān)督和半監(jiān)督訓練
4、、多遍搜索技術和語料庫中錯誤語料甄選等應用中都發(fā)揮了非常重要的作用。傳統(tǒng)的語音識別置信度標注基于不同置信特征或者特征組合進行分類判決,目前常使用的置信特征主要來源于解碼信息。但是,一方面現(xiàn)有置信度特征對解碼信息的挖掘仍局限于孤立和靜態(tài),而忽略了詞與周圍環(huán)境之間的關系;另一方面,目前聲學特征仍占主要地位,而人類聽覺實驗表明,人在進行語音理解時,大約有30%的信息來自于語法、語義等知識的指導。因此,在置信度特征提取中,如何挖掘出詞與環(huán)境之間的關系,同時提煉出詞的語法和語義特征,從而提高識別后處理性能,是一個非常值得研究的問題?;谏鲜瞿康?,本文
5、在搭建傳統(tǒng)語音識別置信度標記系統(tǒng)的基礎上,提出了兩種新的置信度特征,一是環(huán)境特征,分為上下文環(huán)境、動態(tài)環(huán)境、句全局環(huán)境三類,通過對解碼信息的再加工,從空間與時間角度較全面地描述了詞與環(huán)境之間的關系;二是基于主題相似性的語義層置信特征提取算法TSS(TopicSimilaritybasedSemanticconfidencefeatureextractionalgorithm),通過主題模型LDA(LatentDirichletAllocation)計算得到識別結果中詞的主題分布及其上下文的主題分布,并將二者之間的主題相似性作為詞的語義置信特
6、征。實驗表明,本文提出的兩種特征深入挖掘了解碼層的有效信息,又增加了置信特征的信息來源,與解碼層置信特征進行組合后能有效地提高置信度標注的精度。關鍵詞:置信度環(huán)境特征潛狄利克雷分配主題模型語義,beenmade,butthereiSstillaconsiderabledistancefromthewiderangeofapplications.Inthepursuitofovercomingthedeficienciesinsiderecognitionalgorithmitself,andimprovingrecognitionperfo
7、rmance,researchershavegraduallyintroducedtheconceptofconfidencemeasure,tomeasureinwhichdegreewecouldtrusttheresultofspeechrecognitionsystem.Inrecentyears,speechrecognitionconfidencemeasurehasplayedaveryimportantroleinmanyapplications,includingspeecherrordetectionandcorrect
8、ion,nosupervisionandsemi-supervisedtraining,multi-searchtechnologyandcorpusselectionandve