資源描述:
《語音信號矢量量化設(shè)計及實現(xiàn)算法的matlab仿真畢業(yè)設(shè)計說明書》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學術(shù)論文-天天文庫。
1、內(nèi)蒙古工業(yè)大學本科畢業(yè)設(shè)計說明書引言21世紀是信息的社會,各種科技領(lǐng)域的信息大爆炸。數(shù)字信號的數(shù)據(jù)量通常很巨大,對存儲器的存儲容量,通信信道的帶寬及計算機的處理速度帶來壓力,因此必須對其進行量化壓縮來緊縮數(shù)據(jù)存儲容量,較快地傳輸各種信號,并使發(fā)信機功率降低。矢量量化(VQ)是一種極其重要的信號壓縮方法,其在語音信號處理中占有十分重要的地位,廣泛應(yīng)用于語音編碼,語音識別,語音合成等領(lǐng)域。在許多重要的課題中,VQ都起著非常重要的作用。采用矢量量化技術(shù)對信號波形或參數(shù)進行壓縮處理,可以獲得非常高的效益。VQ不僅可以壓縮表示語音參
2、數(shù)所需的數(shù)碼率,而且在減少運算量方面也是非常高效的,它還能直接用于構(gòu)成語音識別和說話人識別系統(tǒng)。語音數(shù)字通信的兩個關(guān)鍵部分是語音質(zhì)量和傳輸數(shù)碼率。但這兩者是矛盾的:要獲得較高的語音質(zhì)量,就必須使用較高的傳輸碼率;相反,為了實現(xiàn)高效地壓縮傳輸數(shù)碼率,就很難得到良好的語音質(zhì)量。但是矢量量化卻是一種既能得到高效壓縮的數(shù)碼率,又能保證語音質(zhì)量的方法。量化可以分為兩大類:一類是標量量化,一類是矢量量化VQ。標量量化是把抽樣后的信號值逐個進行量化,而矢量量化是先將k個抽樣值組成k維空間中的一個矢量,然后將此矢量進行量化,它可以極大的降
3、低數(shù)碼率,優(yōu)于標量量化。各種數(shù)據(jù)都可以用矢量表示,直接對矢量進行量化,可以方便的對數(shù)據(jù)進行壓縮。矢量量化屬于不可逆壓縮方法,具備比特率低,解碼簡單,失真較小的優(yōu)點。矢量量化的發(fā)展大致可以分為兩各階段:第一階段約為1956至1977年。1956年steinhaus第一次系統(tǒng)的闡述了最佳矢量量化的問題。1957年,在loyd的“PCM中的最小平方化”一文中給出了如何劃分量化區(qū)間和如何求量化值問題的結(jié)論。約于此同時MAX也得出同樣的結(jié)果。雖然他們談?wù)摰亩际菢肆苛炕瘑栴},但他們的算法對后面的矢量量化的發(fā)展有著深刻的影響。1964年
4、,NEWMAN研究了正六邊形原理。1977年,berger的‘率失真理論’一書出版??傮w來說,這一階段的工作多是理論性的,但它為第二階段的發(fā)展奠定了一定的基礎(chǔ)。46內(nèi)蒙古工業(yè)大學本科畢業(yè)設(shè)計說明書第二階段約為1978年至今。1978年,buzo第一個提出實際的矢量量化器。他提出的量化系統(tǒng)組成分為兩步:第一步將語音信號做線性預(yù)測分析,求出預(yù)測系數(shù),第二步,對這些系數(shù)做矢量量化,于是得到壓縮數(shù)碼的語音編碼器。1980年,linde,buzo和gray將Loyd-max算法推廣,發(fā)表了第一個矢量量化器的設(shè)計算法,通常稱為LBG算
5、法。這就將矢量量化的研究向前推動了一大步。這一時期,人們對矢量量化問題展開了全面的研究,其中主要是對失真測度的探討,碼書的設(shè)計,各種矢量量化系統(tǒng)的研究,快速搜索算法的尋找等等。矢量量化研究的進展是很快的,1980年,美國加州公司在原來的編碼速度為2.4kb/s的線性預(yù)測聲編碼器的基礎(chǔ)上,僅將濾波系數(shù)從標量量化改為矢量量化,就可以使編碼速率降低到800b/s,而聲音質(zhì)量基本未下降。1983年,美國BBN公司研制了一種分段式聲編碼器。由于該聲碼器采用了矢量量化,所以可以用150b/s的速率來傳送可懂的話音。近幾十年來在已經(jīng)提出
6、的各種矢量量化方法和系數(shù)的基礎(chǔ)上,更多更好的矢量量化方法漸漸出現(xiàn)。在圖像數(shù)據(jù)壓縮和語音識別的應(yīng)用方面,矢量量化研究也得到了很快的發(fā)展,提出各種各樣的矢量量化系統(tǒng),用硬件實現(xiàn)矢量量化系統(tǒng)的方法也越來越多矢量量化壓縮技術(shù)的應(yīng)用領(lǐng)域非常廣闊,如軍事部門和氣象部門的衛(wèi)星(或航天飛機)遙感照片的壓縮編碼和實時傳輸、雷達圖像和軍用地圖的存儲與傳輸、數(shù)字電視和DVD的視頻壓縮、醫(yī)學圖像的壓縮與存儲、網(wǎng)絡(luò)化測試數(shù)據(jù)的壓縮和傳輸、語音編碼、圖像識別和語音識別等等。46內(nèi)蒙古工業(yè)大學本科畢業(yè)設(shè)計說明書第一章矢量量化器1.1矢量量化概述矢量量化
7、技術(shù)涉及到許多學科的技術(shù)和理論知識,且應(yīng)用范圍非常廣泛。由于矢量量化的數(shù)據(jù)壓縮具有編碼簡單,效率高,壓縮比大等優(yōu)點,所以矢量量化最先在語音,圖像,視頻這些媒體信息的壓縮中取得了巨大的應(yīng)用。由于矢量量化的高壓縮比,使得它可以應(yīng)用在民用的高清電視,網(wǎng)絡(luò)視頻的實時傳輸上,也可以應(yīng)用在軍用國防的衛(wèi)星遙感,雷達監(jiān)測等方面。矢量量化技術(shù)在其他方面的應(yīng)用也發(fā)展十分迅速,如矢量量化技術(shù)已廣泛地應(yīng)用于語音識別,說話人識別,數(shù)字水印,文件檢索,紋理壓縮,移動通信等眾多科學領(lǐng)域。矢量量化的三大關(guān)鍵步驟和技術(shù)是:碼書設(shè)計,碼字搜索和碼字索引分配前
8、兩項是矢量量化過程中的關(guān)鍵。碼書設(shè)計可以看成是一個統(tǒng)計聚類的過程。從另一個角度來看,碼書設(shè)計也是一個迭代過程,碼書可以視為一個類似函數(shù)優(yōu)化的問題,所以要搜索最優(yōu)化的全局碼書,就需要一種全局算法。從以上分析可以看出,碼書的優(yōu)化是一個很重要的任務(wù)。人們試圖找到各種新的碼書優(yōu)化的算法和策略。多種理論研究都應(yīng)用