資源描述:
《各種音頻編碼方式的比對(duì)new》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、一.各種音頻編碼方式的比對(duì)PCM編碼(原始數(shù)字音頻信號(hào)流)?類型:Audio?制定者:ITU-T?所需頻寬:1411.2?Kbps?特性:音源信息完整,但冗余度過大優(yōu)點(diǎn):音源信息保存完整,音質(zhì)好缺點(diǎn):信息量大,體積大,冗余度過大應(yīng)用領(lǐng)域:voip?版稅方式:Free?備注:在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,被廣泛用于素材保存及音樂欣賞,CD、DVD以及我們常見的WAV文件中均有應(yīng)用。因此,PCM約定俗成了無損編碼,因?yàn)镻CM代表了數(shù)字音頻中最佳的保真水準(zhǔn),并不意味著PCM就能夠確保信號(hào)絕對(duì)保真,PCM也只能做到最大程度的無限接近。要
2、算一個(gè)PCM音頻流的碼率是一件很輕松的事情,采樣率值×采樣大小值×聲道數(shù)bps。一個(gè)采樣率為44.1KHz,采樣大小為16bit,雙聲道的?PCM編碼的WAV文件,它的數(shù)據(jù)速率則為?44.1K×16×2?=1411.2Kbps。我們常見的Audio?CD就采用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂信息。?WMA(Windows?Media?Audio)?類型:Audio?制定者:微軟公司所需頻寬:320~112kbps(壓縮10~12倍)特性:當(dāng)Bitrate小于128K時(shí),WMA幾乎在同級(jí)別的所有有損編碼格式中表現(xiàn)得最出色,但似乎128k
3、是WMA一個(gè)檻,當(dāng)Bitrate再往上提升時(shí),不會(huì)有太多的音質(zhì)改變。優(yōu)點(diǎn):當(dāng)Bitrate小于128K時(shí),WMA最為出色且編碼后得到的音頻文件很小。缺點(diǎn):當(dāng)Bitrate大于128K時(shí),WMA音質(zhì)損失過大。WMA標(biāo)準(zhǔn)不開放,由微軟掌。握應(yīng)用領(lǐng)域:voip?版稅方式:按個(gè)收取備注:WMA的全稱是Windows?Media?Audio,它是微軟公司推出的與MP3格式齊名的一種新的音頻格式。由于WMA在壓縮比和音質(zhì)方面都超過了MP3,更是遠(yuǎn)勝于RA(Real?Audio),即使在較低的采樣頻率下也能產(chǎn)生較好的音質(zhì),再加上WMA有微軟的Windows?Medi
4、a?Player做其強(qiáng)大的后盾,所以一經(jīng)推出就贏得一片喝彩。??ADPCM(?自適應(yīng)差分PCM)?類型:Audio?制定者:ITU-T?所需頻寬:32Kbps?特性:ADPCM(adaptive?difference?pulse?code?modulation)綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。?它的核心想法是:①利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值;②使用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測(cè)值,使實(shí)際樣本值和預(yù)測(cè)值之間的差值總
5、是最小。優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比小(CD音質(zhì)>400kbps),編解碼延時(shí)最短(相對(duì)其它技術(shù))缺點(diǎn):聲音質(zhì)量一般應(yīng)用領(lǐng)域:voip?版稅方式:Free?備注:ADPCM?(ADPCM?Adaptive?Differential?Pulse?Code?Modulation),?是一種針對(duì)16bit?(或者更高?)?聲音波形數(shù)據(jù)的一種有損壓縮算法,?它將聲音流中每次采樣的?16bit?數(shù)據(jù)以?4bit?存儲(chǔ),?所以壓縮比?1:4而壓縮/解壓縮算法非常的簡(jiǎn)單,?所以是一種低空間消耗,高質(zhì)量聲音獲得的好途徑。LPC(Linear?Predictive?Cod
6、ing,線性預(yù)測(cè)編碼)?類型:Audio?制定者:?所需頻寬:2Kbps-4.8Kbps?特性:壓縮比大,計(jì)算量大,音質(zhì)不高,廉價(jià)?優(yōu)點(diǎn):壓縮比大,廉價(jià)?缺點(diǎn):計(jì)算量大,語(yǔ)音質(zhì)量不是很好,自然度較低?應(yīng)用領(lǐng)域:voip?版稅方式:Free?備?注:參數(shù)編碼又稱為聲源編碼,是將信源信號(hào)在頻率域或其它正交變換域提取特征參數(shù),并將其變換成數(shù)字代碼進(jìn)行傳輸。譯碼為其反過程,將收到的數(shù)字序列經(jīng)變?換恢復(fù)特征參量,再根據(jù)特征參量重建語(yǔ)音信號(hào)。具體說,參數(shù)編碼是通過對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取和編碼,力圖使重建語(yǔ)音信號(hào)具有盡可能高的準(zhǔn)確性,但重建信號(hào)的波形同原語(yǔ)音信號(hào)的
7、波形可能會(huì)有相當(dāng)大的差別。如:線性預(yù)測(cè)編碼(LPC)及其它各種改進(jìn)型都屬于參數(shù)編碼。該編碼比特率可壓縮到2Kbit/s-?4.8Kbit/s,甚至更低,但語(yǔ)音質(zhì)量只能達(dá)到中等,特別是自然度較低。??CELP(Code?Excited?Linear?Prediction碼激勵(lì)線性預(yù)測(cè)編碼)?類型:Audio?制定者:歐洲通信標(biāo)準(zhǔn)協(xié)會(huì)(ETSI)?所需頻寬:4~16Kbps的速率?特性:改善語(yǔ)音的質(zhì)量:①?對(duì)誤差信號(hào)進(jìn)行感覺加權(quán),利用人類聽覺的掩蔽特性來提高語(yǔ)音的主觀質(zhì)量;?②用分?jǐn)?shù)延遲改進(jìn)基音預(yù)測(cè),使?jié)嵋舻谋磉_(dá)更為準(zhǔn)確,尤其改善了女性語(yǔ)音的質(zhì)量;③使用修
8、正的MSPE準(zhǔn)則來尋找?“最佳”的延遲,使得基音周期延遲的外形更LPC(Linear?Pred