資源描述:
《語(yǔ)音信號(hào)矢量量化設(shè)計(jì)及實(shí)現(xiàn)算法的matlab仿真畢業(yè)論文設(shè)計(jì)說(shuō)明書(shū)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、引言21世紀(jì)是信息的社會(huì),各種科技領(lǐng)域的信息大爆炸。數(shù)字信號(hào)的數(shù)據(jù)量通常很巨大,對(duì)存儲(chǔ)器的存儲(chǔ)容量,通信信道的帶寬及計(jì)算機(jī)的處理速度帶來(lái)壓力,因此必須對(duì)其進(jìn)行量化壓縮來(lái)緊縮數(shù)據(jù)存儲(chǔ)容量,較快地傳輸各種信號(hào),并使發(fā)信機(jī)功率降低。矢量量化(VQ)是一種極其重要的信號(hào)壓縮方法,其在語(yǔ)音信號(hào)處理中占有十分重要的地位,廣泛應(yīng)用于語(yǔ)音編碼,語(yǔ)音識(shí)別,語(yǔ)音合成等領(lǐng)域。在許多重要的課題中,VQ都起著非常重要的作用。采用矢量量化技術(shù)對(duì)信號(hào)波形或參數(shù)進(jìn)行壓縮處理,可以獲得非常高的效益。VQ不僅可以壓縮表示語(yǔ)音參數(shù)所需的數(shù)碼率,而且在減少運(yùn)算量方面也是非常高效的,它還能直接用于構(gòu)成語(yǔ)音識(shí)別和說(shuō)話人識(shí)別系統(tǒng)。語(yǔ)音數(shù)字
2、通信的兩個(gè)關(guān)鍵部分是語(yǔ)音質(zhì)量和傳輸數(shù)碼率。但這兩者是矛盾的:要獲得較高的語(yǔ)音質(zhì)量,就必須使用較高的傳輸碼率;相反,為了實(shí)現(xiàn)高效地壓縮傳輸數(shù)碼率,就很難得到良好的語(yǔ)音質(zhì)量。但是矢量量化卻是一種既能得到高效壓縮的數(shù)碼率,又能保證語(yǔ)音質(zhì)量的方法。量化可以分為兩大類:一類是標(biāo)量量化,一類是矢量量化VQ。標(biāo)量量化是把抽樣后的信號(hào)值逐個(gè)進(jìn)行量化,而矢量量化是先將k個(gè)抽樣值組成k維空間中的一個(gè)矢量,然后將此矢量進(jìn)行量化,它可以極大的降低數(shù)碼率,優(yōu)于標(biāo)量量化。各種數(shù)據(jù)都可以用矢量表示,直接對(duì)矢量進(jìn)行量化,可以方便的對(duì)數(shù)據(jù)進(jìn)行壓縮。矢量量化屬于不可逆壓縮方法,具備比特率低,解碼簡(jiǎn)單,失真較小的優(yōu)點(diǎn)。矢量量化的發(fā)
3、展大致可以分為兩各階段:第一階段約為1956至1977年。1956年steinhaus第一次系統(tǒng)的闡述了最佳矢量量化的問(wèn)題。1957年,在loyd的“PCM中的最小平方化”一文中給出了如何劃分量化區(qū)間和如何求量化值問(wèn)題的結(jié)論。約于此同時(shí)MAX也得出同樣的結(jié)果。雖然他們談?wù)摰亩际菢?biāo)量量化問(wèn)題,但他們的算法對(duì)后面的矢量量化的發(fā)展有著深刻的影響。1964年,NEWMAN研究了正六邊形原理。1977年,berger的‘率失真理論’一書(shū)出版??傮w來(lái)說(shuō),這一階段的工作多是理論性的,但它為第二階段的發(fā)展奠定了一定的基礎(chǔ)。第二階段約為1978年至今。1978年,buzo第一個(gè)提出實(shí)際的矢量量化器。他提出的量化
4、系統(tǒng)組成分為兩步:第一步將語(yǔ)音信號(hào)做線性預(yù)測(cè)分析,求出預(yù)測(cè)系數(shù),第二步,對(duì)這些系數(shù)做矢量量化,于是得到壓縮數(shù)碼的語(yǔ)音編碼器。1980年,linde,buzo和gray將Loyd-max算法推廣,發(fā)表了第一個(gè)矢量量化器的設(shè)計(jì)算法,通常稱為L(zhǎng)BG算法。這就將矢量量化的研究向前推動(dòng)了一大步。這一時(shí)期,人們對(duì)矢量量化問(wèn)題展開(kāi)了全面的研究,其中主要是對(duì)失真測(cè)度的探討,碼書(shū)的設(shè)計(jì),各種矢量量化系統(tǒng)的研究,快速搜索算法的尋找等等。矢量量化研究的進(jìn)展是很快的,1980年,美國(guó)加州公司在原來(lái)的編碼速度為2.4kbs的線性預(yù)測(cè)聲編碼器的基礎(chǔ)上,僅將濾波系數(shù)從標(biāo)量量化改為矢量量化,就可以使編碼速率降低到800bs,
5、而聲音質(zhì)量基本未下降。1983年,美國(guó)BBN公司研制了一種分段式聲編碼器。由于該聲碼器采用了矢量量化,所以可以用150bs的速率來(lái)傳送可懂的話音。近幾十年來(lái)在已經(jīng)提出的各種矢量量化方法和系數(shù)的基礎(chǔ)上,更多更好的矢量量化方法漸漸出現(xiàn)。在圖像數(shù)據(jù)壓縮和語(yǔ)音識(shí)別的應(yīng)用方面,矢量量化研究也得到了很快的發(fā)展,提出各種各樣的矢量量化系統(tǒng),用硬件實(shí)現(xiàn)矢量量化系統(tǒng)的方法也越來(lái)越多矢量量化壓縮技術(shù)的應(yīng)用領(lǐng)域非常廣闊,如軍事部門(mén)和氣象部門(mén)的衛(wèi)星(或航天飛機(jī))遙感照片的壓縮編碼和實(shí)時(shí)傳輸、雷達(dá)圖像和軍用地圖的存儲(chǔ)與傳輸、數(shù)字電視和DVD的視頻壓縮、醫(yī)學(xué)圖像的壓縮與存儲(chǔ)、網(wǎng)絡(luò)化測(cè)試數(shù)據(jù)的壓縮和傳輸、語(yǔ)音編碼、圖像識(shí)別
6、和語(yǔ)音識(shí)別等等。第一章矢量量化器1.1矢量量化概述矢量量化技術(shù)涉及到許多學(xué)科的技術(shù)和理論知識(shí),且應(yīng)用范圍非常廣泛。由于矢量量化的數(shù)據(jù)壓縮具有編碼簡(jiǎn)單,效率高,壓縮比大等優(yōu)點(diǎn),所以矢量量化最先在語(yǔ)音,圖像,視頻這些媒體信息的壓縮中取得了巨大的應(yīng)用。由于矢量量化的高壓縮比,使得它可以應(yīng)用在民用的高清電視,網(wǎng)絡(luò)視頻的實(shí)時(shí)傳輸上,也可以應(yīng)用在軍用國(guó)防的衛(wèi)星遙感,雷達(dá)監(jiān)測(cè)等方面。矢量量化技術(shù)在其他方面的應(yīng)用也發(fā)展十分迅速,如矢量量化技術(shù)已廣泛地應(yīng)用于語(yǔ)音識(shí)別,說(shuō)話人識(shí)別,數(shù)字水印,文件檢索,紋理壓縮,移動(dòng)通信等眾多科學(xué)領(lǐng)域。矢量量化的三大關(guān)鍵步驟和技術(shù)是:碼書(shū)設(shè)計(jì),碼字搜索和碼字索引分配前兩項(xiàng)是矢量量化
7、過(guò)程中的關(guān)鍵。碼書(shū)設(shè)計(jì)可以看成是一個(gè)統(tǒng)計(jì)聚類的過(guò)程。從另一個(gè)角度來(lái)看,碼書(shū)設(shè)計(jì)也是一個(gè)迭代過(guò)程,碼書(shū)可以視為一個(gè)類似函數(shù)優(yōu)化的問(wèn)題,所以要搜索最優(yōu)化的全局碼書(shū),就需要一種全局算法。從以上分析可以看出,碼書(shū)的優(yōu)化是一個(gè)很重要的任務(wù)。人們?cè)噲D找到各種新的碼書(shū)優(yōu)化的算法和策略。多種理論研究都應(yīng)用到了碼書(shū)算法,例如神經(jīng)網(wǎng)絡(luò),模糊集合論,遺傳算法等。此外,先進(jìn)的預(yù)測(cè)技術(shù)也是提高壓縮比的一種方法。1.1.1矢