資源描述:
《多媒體新技術(shù)發(fā)展與應(yīng)用論文》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、多媒體新技術(shù)的發(fā)展與應(yīng)用班級:08050642X學(xué)號:姓名:中北大學(xué)信息商務(wù)學(xué)院音頻編碼標(biāo)準的發(fā)展與應(yīng)用利用計算機交互式綜合處理多種媒體信息(如文本、聲音、圖形、圖像、動畫、視頻等),使多種信息建立邏輯連接并集成為一個具有交互性能的系統(tǒng)的技術(shù)。形象地說多媒體技術(shù)就是利用計算機將各種媒體信息以數(shù)字化的方式集成在一起,從而使計算機具有表現(xiàn)、存儲和處理多種媒體信息的綜合能力,它是一種跨學(xué)科的綜合技術(shù)。而音頻信息在人們的工作和生活中具有非常重要的作用,數(shù)字化的音頻信息的數(shù)據(jù)量也相當(dāng)巨大,為更好地存儲、傳輸和使用數(shù)字化的音頻信息需要對音頻信息進行標(biāo)準化的編碼壓縮。一、概述音頻信號數(shù)字化之
2、后所面臨的一個問題是巨大的數(shù)據(jù)量,這為存儲和傳輸帶來了壓力。例如,對于CD音質(zhì)的數(shù)字音頻,所用的采樣頻率為44.1kHz,量化精度為16bit;采用雙聲道立體聲時,其數(shù)碼率約為1.41Mbit/s;1秒的CD立體聲信號需要約176.4KB的存儲空間。因此,為了降低傳輸或存儲的費用,就必須對數(shù)字音頻信號進行編碼壓縮。到目前為止,音頻信號經(jīng)壓縮后的數(shù)碼率降低到32至256kbit/s,語音低至8kbit/s以下,個別甚至到2kbit/s。為使編碼后的音頻信息可以被廣泛地使用,在進行音頻信息編碼時需要采用標(biāo)準的算法。因而,需要對音頻編碼進行標(biāo)準化。二、音頻編碼技術(shù)和應(yīng)用2.1音頻信號
3、通常將人耳可以聽到的頻率在20Hz到20KHz的聲波稱為為音頻信號。人的發(fā)音器官發(fā)出的聲音頻段在80Hz到3400Hz之間,人說話的信號頻率在300到3000Hz,有的人將該頻段的信號稱為語音信號。在多媒體技術(shù)中,處理的主要是音頻信號,它包括音樂、語音、風(fēng)聲、雨聲、鳥叫聲、機器聲等。表1數(shù)字音頻等級信號類型頻率范圍(Hz)采樣率(KHz)量化精度(采樣位數(shù))電話話音200~3400813~16寬帶話音50~70001616調(diào)頻廣播20~15k3216高質(zhì)量音頻20~20k44.1162.2音頻編碼技術(shù)對數(shù)字音頻信息的壓縮主要是依據(jù)音頻信息自身的相關(guān)性以及人耳對音頻信息的聽覺冗余
4、度。音頻信息在編碼技術(shù)中通常分成兩類來處理,分別是語音和音樂,各自采用的技術(shù)有差異?,F(xiàn)代聲碼器的一個重要的課題是,如何把語音和音樂的編碼融合起來。2.3數(shù)字音頻編碼的主要應(yīng)用對數(shù)字音頻信息的編碼進行壓縮的目的是在不影響人們使用的情況下使數(shù)字音頻信息的數(shù)據(jù)量最少。通常用如下6個屬性來衡量:ü比特率;ü主觀/客觀的語音質(zhì)量;ü計算復(fù)雜度和對存儲器的要求;ü延遲;ü對于通道誤碼的靈敏度;ü信號的帶寬。由于不同的應(yīng)用,人們對數(shù)字音頻信息的要求是不同的,并且在選擇數(shù)字音頻信息編碼所采用的技術(shù)時也需要了解人們對音頻信息的各種應(yīng)用。目前數(shù)字音頻信息處理技術(shù)主要應(yīng)用于:l消費電子類數(shù)字音響設(shè)備
5、CD唱機、數(shù)字磁帶錄音機(DAT)、MP3播放機以及MD(MiniDisc)唱機已經(jīng)廣泛地應(yīng)用了數(shù)字音頻技術(shù)。l廣播節(jié)目制作系統(tǒng)在聲音節(jié)目制作系統(tǒng),如錄音、聲音處理加工、記錄存儲、非線性編輯等環(huán)節(jié)使用了數(shù)字調(diào)音臺、數(shù)字音頻工作站等數(shù)字音頻設(shè)備。l多媒體應(yīng)用在多媒體上的應(yīng)用體現(xiàn)在VCD、DVD、多媒體計算機以及Internet。VCD采用MPEG-I編碼格式記錄聲音和圖像;DVD-Audio格式支持多種不同的編碼方式和記錄參數(shù),可選的編碼方式包括無損的MLP、DSD、DilbyAC-3、MPEG2-layer2Audio等,而且是可擴充的、開放的,并可以應(yīng)用未來的編碼技術(shù):Int
6、ernet上采用MP3的音頻格式傳輸聲音,以提高下載能力。l廣播電視數(shù)字化在廣播電視和數(shù)字音頻廣播系統(tǒng)中,聲音編碼采用MUSICAM編碼方法,符合MPEG-1Layer1高級音頻編碼。如當(dāng)今的數(shù)字電視采用的音頻標(biāo)準就是DilbyAC-3和MPEG-layer2。l通訊系統(tǒng)在通訊系統(tǒng)中,必須對音頻進行壓縮。傳統(tǒng)的PSTN電話中采用的是G.711和G.726的標(biāo)準;GSM移動通訊采用的是GSMHR/FR/EFR標(biāo)準;CDMA移動通訊采用的是3GPP2EVRC、QCELP8k、QCELP16k、4GV標(biāo)準;WCDMA第3代移動通訊采用的是3GPPAMR-NB、AMR-WB標(biāo)準。另外在
7、IPTV和移動流媒體中,采用的是AMR-WB+和AAC的標(biāo)準。三、音頻編碼標(biāo)準發(fā)展現(xiàn)狀3.1語音編碼標(biāo)準發(fā)展現(xiàn)狀國際電信聯(lián)盟(ITU)主要負責(zé)研究和制定與通信相關(guān)的標(biāo)準,作為主要通信業(yè)務(wù)的電話通信業(yè)務(wù)中使用的語音編碼標(biāo)準均是由ITU負責(zé)完成的。其中用于固定網(wǎng)絡(luò)電話業(yè)務(wù)使用的語音編碼標(biāo)準如ITU-TG.711等主要在ITU-TSG15完成,并廣泛應(yīng)用于全球的電話通信系統(tǒng)之中。目前,隨著Internet網(wǎng)絡(luò)及其應(yīng)用的快速發(fā)展,在2005到2008研究期內(nèi),ITU-T將研究和制定變速率語音編碼標(biāo)準