基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究

基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究

ID:39222441

大小:798.81 KB

頁(yè)數(shù):15頁(yè)

時(shí)間:2019-06-27

基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究_第1頁(yè)
基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究_第2頁(yè)
基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究_第3頁(yè)
基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究_第4頁(yè)
基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究_第5頁(yè)
資源描述:

《基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、基于小波變換的說(shuō)話人語(yǔ)音特征參數(shù)研究西安電子科技大學(xué)碩士學(xué)位論文宋麗亞摘要說(shuō)話人識(shí)別是利用說(shuō)話人的語(yǔ)音特征對(duì)說(shuō)話人的身份進(jìn)行辨認(rèn)或確認(rèn)。在說(shuō)話人識(shí)別系統(tǒng)中,最重要的是能夠從語(yǔ)音片斷中提取代表說(shuō)話人獨(dú)有特征的穩(wěn)定參數(shù)。針對(duì)短時(shí)傅立葉分析在提取說(shuō)話人特征參數(shù)時(shí)的缺陷,本文通過(guò)對(duì)小波理論和說(shuō)話人識(shí)別技術(shù)的研究,借鑒了一種傳統(tǒng)的基于聽(tīng)覺(jué)機(jī)理的特征參數(shù)MFCC(Mel頻域倒譜系數(shù)),利用小波變換、小波多分辨分析和小波包變換,構(gòu)造出了兩種基于小波變換的說(shuō)話人識(shí)別特征參數(shù):IWPTC(不完全小波包變換系數(shù))和WPTC(小波包變換系數(shù))。通過(guò)在Matlab平臺(tái)上構(gòu)建的說(shuō)話人識(shí)

2、別系統(tǒng)(包括文本有關(guān)和文本無(wú)關(guān)),驗(yàn)證了這兩種參數(shù)的有效性:它們的識(shí)別率均高于MFCC參數(shù)。理論和實(shí)驗(yàn)證明,利用小波變換提取的說(shuō)話人識(shí)別特征參數(shù)相比于傳統(tǒng)的短時(shí)分析方法確實(shí)具有更好的識(shí)別特性。關(guān)鍵詞:說(shuō)話人識(shí)別小波變換MFCC參數(shù)論文摘讀緒論部分說(shuō)話人識(shí)別技術(shù)雖然在近二十年得到了迅速發(fā)展,但仍然有許多問(wèn)題需要解決,其中最關(guān)鍵的問(wèn)題是,究竟用語(yǔ)音信號(hào)的哪些特征或特征變換來(lái)表征說(shuō)話人才是有效而可靠的?語(yǔ)音信號(hào)是一種典型的非平穩(wěn)時(shí)變信號(hào),但是在10~30ms的短時(shí)段內(nèi),語(yǔ)音信號(hào)是近似平穩(wěn)的,這是由于人的發(fā)音器官不可能是毫無(wú)規(guī)律地快速變化,因此其頻譜特性和某些物理特征

3、參量可以近似看作是不變的,這樣我們就可以用平穩(wěn)過(guò)程的分析方法來(lái)處理語(yǔ)音信號(hào)了。傳統(tǒng)意義上的特征參數(shù)構(gòu)造就是基于短時(shí)平穩(wěn)的假設(shè),需要將原始信號(hào)分成10~30ms的短時(shí)幀,主要采用短時(shí)傅立葉變換的分析手段。由于短時(shí)傅立葉變換只具有單一分辨率的分析,所以本質(zhì)上并不適合對(duì)語(yǔ)音信號(hào)這種非平穩(wěn)時(shí)變信號(hào)的分析,用它提取的特征參數(shù)必是不完善的。時(shí)頻分布理論和小波理論的興起為非平穩(wěn)信號(hào)的分析和表示提供了新的手段,并已經(jīng)在語(yǔ)音信號(hào)的分析和表示方面取得了一定的成功,有很大的發(fā)展?jié)摿?。小波變換采用多分辨分析的思想,非均勻的劃分時(shí)頻空間,在低頻時(shí)有高的頻率分辨率和低的時(shí)間分辨率,在高頻

4、時(shí)有低的頻率分辨率和高的時(shí)間分辨率。這樣對(duì)于頻率成分復(fù)雜的語(yǔ)音信號(hào),在服從不確定性原理的前提下,使不同的時(shí)頻區(qū)都可以獲得比較合適的時(shí)一頻分辨率。目前,小波分析應(yīng)用于端點(diǎn)檢測(cè)、基音提取、語(yǔ)音編碼等方面都有較成功的應(yīng)用,但是對(duì)于說(shuō)話人識(shí)別的特征參數(shù)提取方面涉及較少。用小波變換構(gòu)造新的語(yǔ)音識(shí)別特征參數(shù),不必受短時(shí)平穩(wěn)假設(shè)的限制,所以作者希望借助于小波分析工具能夠得到更高效的說(shuō)話人識(shí)別特征參數(shù)。在這個(gè)過(guò)程中,作者借鑒了MFCC參數(shù)的提取過(guò)程,提取出了兩種基于小波變換的特征參數(shù):IWPTC(不完全小波包變換參數(shù))、WPTC(小波包變換參數(shù)),在Matlab平臺(tái)上進(jìn)行了測(cè)

5、試,結(jié)果表明,采用這兩種參數(shù)的說(shuō)話人識(shí)別系統(tǒng)的識(shí)別率均高于MFCC參數(shù)。第四章基于小波變換的新參數(shù)(部分)4.1倒譜分析和MFCC參數(shù)倒譜特征是用于說(shuō)話人個(gè)性特征表征和說(shuō)話人識(shí)別的最有效的特征之一。語(yǔ)音信號(hào)是聲道頻率特性和激勵(lì)信號(hào)源二者的共同結(jié)果,后者對(duì)于某幀而言常帶有一定的隨機(jī)性,而說(shuō)話人的個(gè)性特征很大程度上取決于說(shuō)話人的發(fā)音聲道,即聲道頻率特性,因此,需要將二者進(jìn)行有效地分離。由于語(yǔ)音信號(hào)是由激勵(lì)信號(hào)與聲道頻率相卷積的結(jié)果,可以把信號(hào)作適當(dāng)?shù)耐瑧B(tài)濾波將卷積的兩個(gè)部分分離,濾波的關(guān)鍵是先將卷積處理化為乘積,然后作對(duì)數(shù)處理,使之化為可分離的相加成份。人耳對(duì)聲音

6、的感知在頻域是非線性的,經(jīng)驗(yàn)證明,在信號(hào)處理中考慮到非線性特性,能夠使提取出來(lái)的特征參數(shù)更加強(qiáng)壯。Mel標(biāo)度描述了人耳對(duì)頻率感知的非線性特性。MFCC就是基于聽(tīng)覺(jué)系統(tǒng)的臨界帶效應(yīng)、在Mel標(biāo)度頻率域提取出來(lái)的一種倒譜參數(shù)。許多實(shí)驗(yàn)表明,大部分情況下,MFCC優(yōu)于其它倒譜系數(shù)。4.2基于小波變換的新參數(shù)1.新參數(shù)的提出通過(guò)對(duì)MFCC參數(shù)的提取原理和提取過(guò)程的分析,可以看到這種參數(shù)的提取還是基于短時(shí)平穩(wěn)的假設(shè)條件:人為地將語(yǔ)音信號(hào)分割成10-20ms的幀序列以滿足短時(shí)平穩(wěn)的要求,為了減少截?cái)嗾`差又采用了幀疊的方法,這些手段都會(huì)導(dǎo)致計(jì)算誤差的產(chǎn)生,影響語(yǔ)音處理的穩(wěn)定

7、性和準(zhǔn)確性。提取MFCC參數(shù)的核心是利用短時(shí)傅立葉變換,在第四章我們已經(jīng)提到過(guò)短時(shí)傅立葉變換的缺陷:因其固定的窗口形狀導(dǎo)致了對(duì)信號(hào)分析只能采用一定的時(shí)頻分辨率,而不能兼顧二者,所以不太適合對(duì)語(yǔ)音信號(hào)這種非平穩(wěn)信號(hào)進(jìn)行分析。小波變換具有可變的時(shí)頻分辨率,即在低頻時(shí)有高的頻率分辨率和低的時(shí)閫分辨率,在高頻時(shí)有低的頻率分辨率和高的時(shí)間分辨率,被稱為“數(shù)學(xué)顯微鏡”,還具有實(shí)現(xiàn)簡(jiǎn)單和無(wú)平穩(wěn)性要求等諸多優(yōu)點(diǎn),可以彌補(bǔ)短時(shí)分析的缺憾,能夠?qū)π盘?hào)進(jìn)行更細(xì)致的分析。從理論上講,凡是傳統(tǒng)使用短時(shí)分析的地方,在語(yǔ)音信號(hào)處理中,都可以用小波分析來(lái)代替。目前,小波分析應(yīng)用于端點(diǎn)檢測(cè)、基

8、音提取、語(yǔ)音編碼等方面都有較成功的應(yīng)用

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。