一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文

一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文

ID:28674485

大?。?88.60 KB

頁數(shù):5頁

時(shí)間:2018-12-12

一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文_第1頁
一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文_第2頁
一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文_第3頁
一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文_第4頁
一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文_第5頁
資源描述:

《一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法——畢業(yè)論文》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫

1、一種快速的基于短時(shí)能量和過零率的語音端點(diǎn)檢測方法摘要:本文提出了一種快速的語音端點(diǎn)檢測方法,它結(jié)合短時(shí)能量和過零率在時(shí)域信號(hào)中。由于它通過設(shè)置兩個(gè)門限電平綜合使用來得到語音信號(hào)的端點(diǎn),并且原理上也不復(fù)雜,實(shí)時(shí)性和精度比較高,因此具有廣泛的應(yīng)用。本文首先從原理出發(fā)闡述,其次利用MATLAB工具進(jìn)行仿真,然后對(duì)實(shí)現(xiàn)結(jié)果進(jìn)行評(píng)價(jià)和比較,實(shí)驗(yàn)結(jié)果表明,檢測的效果好于分別使用其中任意一種的情況。最后,文章中還對(duì)現(xiàn)階段的語音端點(diǎn)檢測的研究予以展望。關(guān)鍵詞:端點(diǎn)檢測;短時(shí)能量;過零率;門限AFastSpeechSignalEndpointsDetectionMethodBas

2、edonShort-timeEnergyandZero-crossingCounts

Abstract:Thispaperpresentsafastspeechendpointdetectionmethod,whichcombinesshort-timeenergyandzero-crossingcountsinthetimedomainsignal.Itiswidelyusedbecauseitiscombinedwithtwothresholdlevelstogettheendpointofspeechsignal,andit

3、isnotcomplicatedintheoryandhashighreal-timeperformanceandaccuracy.Inthispaper,theprincipleofthefirstsetout,followedbyMATLABtoolsforsimulation,andthentoevaluateandcomparetheresults,theexperimentalresultsshowthatthedetectioneffectisbetterthantheuseofanyoneofthecases.Atlast,theresearcho

4、fspeechendpointdetectionisalsodiscussedinthispaper.Keywords:endpointdetection;short-timeenergy;zero-crossing;threshold0引言近年來隨著語音信號(hào)處理的發(fā)展,語音信號(hào)中的端點(diǎn)檢測以及判斷方法的研究越來越重要。語音端點(diǎn)檢測是語音分析、合成和識(shí)別中的一個(gè)重要的環(huán)節(jié),目的是從語音信號(hào)中找到語音的起始點(diǎn)和結(jié)束點(diǎn),從而能夠準(zhǔn)確的提取語音信號(hào)的特征值,在語音編碼階段還可以降低噪聲和靜音段的比特率,提高編碼效率。一個(gè)準(zhǔn)確并且算法不復(fù)雜的端點(diǎn)檢測方法顯得更加突出,這

5、不僅可以減少數(shù)據(jù)的存儲(chǔ)量和處理運(yùn)行的時(shí)間,而且可以排除無聲段噪音的干擾。目前的研究工作中,比較流行的語音信號(hào)端點(diǎn)檢測方法也是比較多,有短時(shí)能量,自相關(guān)函數(shù),基于能量熵[1],基于倒譜率[2]的方法,通常情況下這些方法也能夠達(dá)到一定的效果,但是由于其計(jì)算量大精度不高,或者是只能針對(duì)某一類群體,不具有很好的代表性。通常由于噪聲環(huán)境的引入,將使有效的語音的起始點(diǎn)和終止點(diǎn)的虛檢或是漏檢情況[3]。本文的就是結(jié)合兩種檢測方法:短時(shí)能量和過零率相結(jié)合,在判斷清濁音和靜音段可以起到優(yōu)勢互補(bǔ)的作用,并且具有很好的效果。1語音信號(hào)的短時(shí)能量和過零率的特征1.1短時(shí)能量語音信號(hào)的能

6、量隨時(shí)間變化比較明顯,語音和噪聲、語音和非語音的區(qū)別可以體現(xiàn)在它們的能量上,語音段的能量比噪聲段能量大,一般情況下清音的能量比濁音小。但是語音信號(hào)不是一個(gè)平穩(wěn)的過程,不能用平均幅度來描述其特征,也不能使用像平穩(wěn)信號(hào)的處理技術(shù)對(duì)其進(jìn)行分析,但可以通過一個(gè)加窗的分幀得到某一幀的信號(hào)的能量,可以將其視為短時(shí)平穩(wěn)信號(hào)處理。5信號(hào)的短時(shí)能量定義如下:設(shè)語音波形的時(shí)域信號(hào)為xl,加窗分幀處理后得到的第n幀語音信號(hào)為xn(m),則xn(m)滿足下式[4]:其中的n=0,1T,2T,???,并且N為幀長,T為幀移長度。設(shè)第n幀語音信號(hào)xn(m)的短時(shí)能量用En表示,其計(jì)算公式如

7、下[5]:En是一個(gè)度量語音信號(hào)幅度值變化的函數(shù),它使用的是信號(hào)的幅度的平方,因此它對(duì)大信號(hào)比較敏感。語音和靜音段的噪聲的區(qū)分可以體現(xiàn)在它的能量上,語音段的能量比噪聲段的能量大,如果環(huán)境噪聲和系統(tǒng)輸入的噪聲比較小,信噪比比較高時(shí),只要利用短時(shí)能量就可以把語音段和噪聲段區(qū)分開。另外利用短時(shí)能量也可以很好的區(qū)分濁音,這是因?yàn)闈嵋舭l(fā)聲的聲帶振動(dòng),攜帶比較高的能量。但是在判斷輕音時(shí)效果就不是很好了,輕音發(fā)聲時(shí)聲帶不震動(dòng),攜帶的能量比較少,這就需要借助于短時(shí)過零率來判斷了。1.2短時(shí)過零率短時(shí)過零率表示一幀語音信號(hào)波形穿過橫軸(零電平)的次數(shù)。過零分析是語音分析中一種很常

8、用的方法。對(duì)于連續(xù)的信號(hào)

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。