資源描述:
《語音信號(hào)矢量量化設(shè)計(jì)及實(shí)現(xiàn)算法的matlab仿真畢業(yè)設(shè)計(jì)說明書》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說明書引言21世紀(jì)是信息的社會(huì),各種科技領(lǐng)域的信息大爆炸。數(shù)字信號(hào)的數(shù)據(jù)量通常很巨大,對(duì)存儲(chǔ)器的存儲(chǔ)容量,通信信道的帶寬及計(jì)算機(jī)的處理速度帶來壓力,因此必須對(duì)其進(jìn)行量化壓縮來緊縮數(shù)據(jù)存儲(chǔ)容量,較快地傳輸各種信號(hào),并使發(fā)信機(jī)功率降低。矢量量化(VQ)是一種極其重要的信號(hào)壓縮方法,其在語音信號(hào)處理中占有十分重要的地位,廣泛應(yīng)用于語音編碼,語音識(shí)別,語音合成等領(lǐng)域。在許多重要的課題中,VQ都起著非常重要的作用。采用矢量量化技術(shù)對(duì)信號(hào)波形或參數(shù)進(jìn)行壓縮處理,可以獲得非常高的效益。VQ不僅可以
2、壓縮表示語音參數(shù)所需的數(shù)碼率,而且在減少運(yùn)算量方面也是非常高效的,它還能直接用于構(gòu)成語音識(shí)別和說話人識(shí)別系統(tǒng)。語音數(shù)字通信的兩個(gè)關(guān)鍵部分是語音質(zhì)量和傳輸數(shù)碼率。但這兩者是矛盾的:要獲得較高的語音質(zhì)量,就必須使用較高的傳輸碼率;相反,為了實(shí)現(xiàn)高效地壓縮傳輸數(shù)碼率,就很難得到良好的語音質(zhì)量。但是矢量量化卻是一種既能得到高效壓縮的數(shù)碼率,又能保證語音質(zhì)量的方法。量化可以分為兩大類:一類是標(biāo)量量化,一類是矢量量化VQ。標(biāo)量量化是把抽樣后的信號(hào)值逐個(gè)進(jìn)行量化,而矢量量化是先將k個(gè)抽樣值組成k維空間中的一個(gè)矢量,然后將此
3、矢量進(jìn)行量化,它可以極大的降低數(shù)碼率,優(yōu)于標(biāo)量量化。各種數(shù)據(jù)都可以用矢量表示,直接對(duì)矢量進(jìn)行量化,可以方便的對(duì)數(shù)據(jù)進(jìn)行壓縮。矢量量化屬于不可逆壓縮方法,具備比特率低,解碼簡單,失真較小的優(yōu)點(diǎn)。矢量量化的發(fā)展大致可以分為兩各階段:第一階段約為1956至1977年。1956年steinhaus第一次系統(tǒng)的闡述了最佳矢量量化的問題。1957年,在loyd的“PCM中的最小平方化”一文中給出了如何劃分量化區(qū)間和如何求量化值問題的結(jié)論。約于此同時(shí)MAX也得出同樣的結(jié)果。雖然他們談?wù)摰亩际菢?biāo)量量化問題,但他們的算法對(duì)后面
4、的矢量量化的發(fā)展有著深刻的影響。1964年,NEWMAN研究了正六邊形原理。1977年,berger的‘率失真理論’一書出版??傮w來說,這一階段的工作多是理論性的,但它為第二階段的發(fā)展奠定了一定的基礎(chǔ)。46內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說明書第二階段約為1978年至今。1978年,buzo第一個(gè)提出實(shí)際的矢量量化器。他提出的量化系統(tǒng)組成分為兩步:第一步將語音信號(hào)做線性預(yù)測分析,求出預(yù)測系數(shù),第二步,對(duì)這些系數(shù)做矢量量化,于是得到壓縮數(shù)碼的語音編碼器。1980年,linde,buzo和gray將Loyd-max算法
5、推廣,發(fā)表了第一個(gè)矢量量化器的設(shè)計(jì)算法,通常稱為LBG算法。這就將矢量量化的研究向前推動(dòng)了一大步。這一時(shí)期,人們對(duì)矢量量化問題展開了全面的研究,其中主要是對(duì)失真測度的探討,碼書的設(shè)計(jì),各種矢量量化系統(tǒng)的研究,快速搜索算法的尋找等等。矢量量化研究的進(jìn)展是很快的,1980年,美國加州公司在原來的編碼速度為2.4kb/s的線性預(yù)測聲編碼器的基礎(chǔ)上,僅將濾波系數(shù)從標(biāo)量量化改為矢量量化,就可以使編碼速率降低到800b/s,而聲音質(zhì)量基本未下降。1983年,美國BBN公司研制了一種分段式聲編碼器。由于該聲碼器采用了矢量量
6、化,所以可以用150b/s的速率來傳送可懂的話音。近幾十年來在已經(jīng)提出的各種矢量量化方法和系數(shù)的基礎(chǔ)上,更多更好的矢量量化方法漸漸出現(xiàn)。在圖像數(shù)據(jù)壓縮和語音識(shí)別的應(yīng)用方面,矢量量化研究也得到了很快的發(fā)展,提出各種各樣的矢量量化系統(tǒng),用硬件實(shí)現(xiàn)矢量量化系統(tǒng)的方法也越來越多矢量量化壓縮技術(shù)的應(yīng)用領(lǐng)域非常廣闊,如軍事部門和氣象部門的衛(wèi)星(或航天飛機(jī))遙感照片的壓縮編碼和實(shí)時(shí)傳輸、雷達(dá)圖像和軍用地圖的存儲(chǔ)與傳輸、數(shù)字電視和DVD的視頻壓縮、醫(yī)學(xué)圖像的壓縮與存儲(chǔ)、網(wǎng)絡(luò)化測試數(shù)據(jù)的壓縮和傳輸、語音編碼、圖像識(shí)別和語音識(shí)別
7、等等。46內(nèi)蒙古工業(yè)大學(xué)本科畢業(yè)設(shè)計(jì)說明書第一章矢量量化器1.1矢量量化概述矢量量化技術(shù)涉及到許多學(xué)科的技術(shù)和理論知識(shí),且應(yīng)用范圍非常廣泛。由于矢量量化的數(shù)據(jù)壓縮具有編碼簡單,效率高,壓縮比大等優(yōu)點(diǎn),所以矢量量化最先在語音,圖像,視頻這些媒體信息的壓縮中取得了巨大的應(yīng)用。由于矢量量化的高壓縮比,使得它可以應(yīng)用在民用的高清電視,網(wǎng)絡(luò)視頻的實(shí)時(shí)傳輸上,也可以應(yīng)用在軍用國防的衛(wèi)星遙感,雷達(dá)監(jiān)測等方面。矢量量化技術(shù)在其他方面的應(yīng)用也發(fā)展十分迅速,如矢量量化技術(shù)已廣泛地應(yīng)用于語音識(shí)別,說話人識(shí)別,數(shù)字水印,文件檢索,紋
8、理壓縮,移動(dòng)通信等眾多科學(xué)領(lǐng)域。矢量量化的三大關(guān)鍵步驟和技術(shù)是:碼書設(shè)計(jì),碼字搜索和碼字索引分配前兩項(xiàng)是矢量量化過程中的關(guān)鍵。碼書設(shè)計(jì)可以看成是一個(gè)統(tǒng)計(jì)聚類的過程。從另一個(gè)角度來看,碼書設(shè)計(jì)也是一個(gè)迭代過程,碼書可以視為一個(gè)類似函數(shù)優(yōu)化的問題,所以要搜索最優(yōu)化的全局碼書,就需要一種全局算法。從以上分析可以看出,碼書的優(yōu)化是一個(gè)很重要的任務(wù)。人們試圖找到各種新的碼書優(yōu)化的算法和策略。多種理論研究都應(yīng)用