資源描述:
《CCD_CMOS圖像傳感器基礎(chǔ)與應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第6章視頻壓縮技術(shù)6.1視頻壓縮的基本原理6.2靜止圖像壓縮6.3活動(dòng)圖像編碼6.4音頻壓縮的原理和標(biāo)準(zhǔn)思考題和習(xí)題6.1視頻壓縮的基本原理6.1.1視頻信號(hào)壓縮的可能性視頻數(shù)據(jù)中存在著大量的冗余,即圖像的各像素?cái)?shù)據(jù)之間存在極強(qiáng)的相關(guān)性。利用這些相關(guān)性,一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來(lái),結(jié)果視頻數(shù)據(jù)量能極大地壓縮,有利于傳輸和存儲(chǔ)。視頻數(shù)據(jù)主要存在以下形式的冗余。1.空間冗余視頻圖像在水平方向相鄰像素之間、垂直方向相鄰像素之間的變化一般都很小,存在著極強(qiáng)的空間相關(guān)性。特別是同一景物各點(diǎn)的灰度和顏色之
2、間往往存在著空間連貫性,從而產(chǎn)生了空間冗余,常稱(chēng)為幀內(nèi)相關(guān)性。2.時(shí)間冗余在相鄰場(chǎng)或相鄰幀的對(duì)應(yīng)像素之間,亮度和色度信息存在著極強(qiáng)的相關(guān)性。當(dāng)前幀圖像往往具有與前、后兩幀圖像相同的背景和移動(dòng)物體,只不過(guò)移動(dòng)物體所在的空間位置略有不同,對(duì)大多數(shù)像素來(lái)說(shuō),亮度和色度信息是基本相同的,稱(chēng)為幀間相關(guān)性或時(shí)間相關(guān)性。3.結(jié)構(gòu)冗余在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。如方格狀的地板圖案等。已知分布模式,可以通過(guò)某一過(guò)程生成圖像,稱(chēng)為結(jié)構(gòu)冗余。4.知識(shí)冗余有些圖像與某些知識(shí)有相當(dāng)大的相關(guān)性。如人臉的圖像有固定的結(jié)
3、構(gòu),嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于臉部圖像的中線上。這類(lèi)規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)得到,此類(lèi)冗余稱(chēng)為知識(shí)冗余。5.視覺(jué)冗余人眼具有視覺(jué)非均勻特性,對(duì)視覺(jué)不敏感的信息可以適當(dāng)?shù)厣釛?。在記錄原始的圖像數(shù)據(jù)時(shí),通常假定視覺(jué)系統(tǒng)是線性的和均勻的,對(duì)視覺(jué)敏感和不敏感的部分同等對(duì)待,從而產(chǎn)生了比理想編碼(即把視覺(jué)敏感和不敏感的部分區(qū)分開(kāi)來(lái)編碼)更多的數(shù)據(jù),這就是視覺(jué)冗余。人眼對(duì)圖像細(xì)節(jié)、幅度變化和圖像的運(yùn)動(dòng)并非同時(shí)具有最高的分辨能力。人眼視覺(jué)對(duì)圖像的空間分解力和時(shí)間分解力的要求具有交換性,當(dāng)對(duì)一方要求較高時(shí),對(duì)另一方
4、的要求就較低。根據(jù)這個(gè)特點(diǎn),可以采用運(yùn)動(dòng)檢測(cè)自適應(yīng)技術(shù),對(duì)靜止圖像或慢運(yùn)動(dòng)圖像降低其時(shí)間軸抽樣頻率,例如每?jī)蓭瑐魉鸵粠?;?duì)快速運(yùn)動(dòng)圖像降低其空間抽樣頻率。另外,人眼視覺(jué)對(duì)圖像的空間、時(shí)間分解力的要求與對(duì)幅度分解力的要求也具有交換性,對(duì)圖像的幅度誤差存在一個(gè)隨圖像內(nèi)容而變的可覺(jué)察門(mén)限,低于門(mén)限的幅度誤差不被察覺(jué),在圖像的空間邊緣(輪廓)或時(shí)間邊緣(景物突變瞬間)附近,可覺(jué)察門(mén)限比遠(yuǎn)離邊緣處增大3~4倍,這就是視覺(jué)掩蓋效應(yīng)。根據(jù)這個(gè)特點(diǎn),可以采用邊緣檢測(cè)自適應(yīng)技術(shù),對(duì)于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量
5、化,對(duì)圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化;當(dāng)由于景物的快速運(yùn)動(dòng)而使幀間預(yù)測(cè)編碼碼率高于正常值時(shí)進(jìn)行粗量化,反之則進(jìn)行細(xì)量化。在量化中,盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺(jué)察門(mén)限之下,這樣能實(shí)現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評(píng)價(jià)不變。6.圖像區(qū)域的相同性冗余在圖像中的兩個(gè)或多個(gè)區(qū)域所對(duì)應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲(chǔ),這就是圖像區(qū)域的相似性冗余。在這種情況下,記錄了一個(gè)區(qū)域中各像素的顏色值,與其相同或相近的區(qū)域就不再記錄各像素的值。矢量量化方法就是針對(duì)這種冗余圖像的壓縮方法。7.紋
6、理的統(tǒng)計(jì)冗余有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律,但是在統(tǒng)計(jì)的意義上服從該規(guī)律,利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,稱(chēng)為紋理的統(tǒng)計(jì)冗余。電視圖像信號(hào)數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。6.1.2視頻信號(hào)的數(shù)字化和壓縮模擬電視信號(hào)(包括視頻和音頻)通過(guò)取樣、量化后編碼為二進(jìn)制數(shù)字信號(hào)的過(guò)程稱(chēng)為模數(shù)變換(A/D變換)或脈沖編碼調(diào)制(PCM,PulseCodingModulation),所得到的信號(hào)也稱(chēng)為PCM信號(hào),其過(guò)程可用圖6-1(a)表示。若取樣頻率等于fs、用n比特量化,則PCM信號(hào)的碼率為nfs(
7、比特/s)。PCM編碼既可以對(duì)彩色全電視信號(hào)直接進(jìn)行,也可以對(duì)亮度信號(hào)和兩個(gè)色差信號(hào)分別進(jìn)行,前者稱(chēng)為全信號(hào)編碼,后者稱(chēng)為分量編碼。PCM信號(hào)經(jīng)解碼和插入濾波恢復(fù)為模擬信號(hào),如圖6-1(b)所示,解碼是編碼的逆過(guò)程,插入濾波是把解碼后的信號(hào)插補(bǔ)為平滑、連續(xù)的模擬信號(hào)。這兩個(gè)步驟合稱(chēng)為數(shù)模變換(D/A變換)或PCM解碼。圖6-1電視信號(hào)的數(shù)字化和復(fù)原(a)A/D變換;(b)D/A變換1.奈奎斯特取樣定理理想取樣時(shí),只要取樣頻率大于或等于模擬信號(hào)中最高頻率的兩倍,就可以不失真地恢復(fù)模擬信號(hào),稱(chēng)為奈奎斯特取樣定理。模擬信
8、號(hào)中最高頻率的兩倍稱(chēng)為折疊頻率。2.亞奈奎斯特取樣按取樣定理,若取樣頻率fs小于模擬信號(hào)最高頻率fmax的2倍會(huì)產(chǎn)生混疊失真,但若巧妙地選擇取樣頻率,令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間,就可用梳狀濾波器去掉混疊成分。3.均勻量化和非均勻量化在輸入信號(hào)的動(dòng)態(tài)范圍內(nèi),量化間隔幅度都相等的量化稱(chēng)為均勻量化或線性量化。對(duì)于量化間距固定的均勻量化,信噪