資源描述:
《基于先驗(yàn)信噪比估計(jì)的語音增強(qiáng)算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、摘要摘要作為信息傳遞最主要的方式之一,語音隨著人工智能的發(fā)展,變得愈加的舉足輕重。但我們生活在一個(gè)充溢噪聲的世界中,外界噪聲在我們的日常應(yīng)用中會(huì)嚴(yán)重影響我們語音拾取的質(zhì)量。為了能夠有效地解決這一問題,在系統(tǒng)前端加入合適的語音增強(qiáng)算法模塊可以從被噪聲污染的語音中獲取純凈語音,進(jìn)而提升應(yīng)用系統(tǒng)的性能。此外,語音增強(qiáng)在語音拾取與識(shí)別,語音編碼以及軍事通信中也都起著非常重要的作用。基于現(xiàn)實(shí)場景的需求,本文研究工作將圍繞先驗(yàn)信噪比估計(jì)的語音增強(qiáng)算法展開。針對(duì)現(xiàn)有先驗(yàn)信噪比估計(jì)算法的不足,本文從諧波重構(gòu)和人耳感知特性兩個(gè)
2、角度對(duì)原有的先驗(yàn)信噪比估計(jì)算法進(jìn)行了改進(jìn)。并從原理和實(shí)踐仿真兩方面剖析了所提算法的可行性。本文的具體工作和創(chuàng)新性體現(xiàn)在以下三點(diǎn):1)提出了一種諧波重構(gòu)的先驗(yàn)信噪比估計(jì)算法。在信噪比較高時(shí)經(jīng)典地先驗(yàn)信噪比算法在保證一定語音質(zhì)量的前提下可以抑制大量的背景噪聲,但隨著信噪比逐漸降低,語音信號(hào)的高次諧波失真變得較為嚴(yán)重?;诖?,利用二次譜修正增強(qiáng)后的信號(hào)以加強(qiáng)語音信號(hào)的周期性,然后對(duì)語音信號(hào)進(jìn)行諧波重構(gòu),從而恢復(fù)語音信號(hào)丟失的諧波分量。實(shí)驗(yàn)研究表明,該算法在低信噪比時(shí)能夠有效地增強(qiáng)語音諧波分量,相對(duì)于傳統(tǒng)的先驗(yàn)信噪比
3、估計(jì)算法有較少的語音失真。2)結(jié)合語音重分配譜圖和聽覺掩蔽效應(yīng)提出了一種單通道語音增強(qiáng)算法。針對(duì)傳統(tǒng)先驗(yàn)信噪比估計(jì)算法殘留背景噪聲的同時(shí)又引入“音樂噪聲”的情況,依據(jù)語音諧波之間的強(qiáng)相關(guān)性,利用重分配譜圖中語音的幀間特性和頻間特性來控制二步DD算法的遺忘因子,以更好地抑制非語音成分;然后結(jié)合人耳聽覺掩蔽特性,利用改進(jìn)的語音幅度譜估計(jì)去更新感知增益函數(shù)中的噪聲掩蔽閾值。實(shí)驗(yàn)研究表明,本文提出的算法相對(duì)于傳統(tǒng)的算法具有相同降噪量的同時(shí)可以提高語音信號(hào)的可懂度3)提出了一種基于先驗(yàn)信噪比約束的二值掩碼估計(jì)算法。首先
4、分析了低信噪比情況下的噪聲功率譜函數(shù)與先驗(yàn)信噪比估計(jì)的關(guān)系。分析表明通過最小均方誤差準(zhǔn)則對(duì)先驗(yàn)信噪比進(jìn)行二次處理可以獲得較為準(zhǔn)確的噪聲功率譜和增益函數(shù)。進(jìn)而將其應(yīng)用于二值掩碼算法中以保留噪聲高估的時(shí)頻單元,同時(shí)丟棄低估的時(shí)頻單元。實(shí)驗(yàn)表明,在低信噪比情況下本文提出的算法具有更高的語音可懂度。I廣州大學(xué)碩士學(xué)位論文關(guān)鍵詞:語音增強(qiáng)、先驗(yàn)信噪比、二次譜處理、諧波重構(gòu)、掩蔽特性、重分配譜圖、二值掩碼IIAbstractAbstractWiththedevelopmentofartificialintelligenc
5、e,asoneofthemainmeansofinformationtransmission,speechinteractionbecomesmoreandmoreimportant.Andweliveinanoisyword,itisnotavoidthatthequalityofthepickingvoicehasseriouslyaffectedbytheexternalnoise.Inordertosolvethisproblem,wecanobtaincleanspeechfromthenoisys
6、peechbyselectingtheappropriatespeechenhancementalgorithm,whichiscarryoutinthefront-endtoimprovetheperformanceofthesystem.Speechenhancementhasbeenwidelyusedinhuman-computerinteraction,whichplaysanimportantroleinvoicepickingandrecognition,speechcodingandmilit
7、arycommunication.Basedonthedemandofrealisticscene,thisthesisfocusesonthesinglechannelspeechenhancementmethod.AccordingtothedeficiencyoftheaprioriSNRestimators,somenewmethodsfortheaprioriSNRestimatorareproposedfromtheperspectiveofharmonicreconstructionandhum
8、anearmaskingeffect.Thefeasibilityoftheproposedalgorithmisanalyzedfromboththeoreticalandexperimentalanalysis.Themainworkandinnovationofthisthesiscanbereflectedinthefollowingaspects:1)TheaprioriSNRestima