資源描述:
《CCD_CMOS圖像傳感器基礎(chǔ)與應(yīng)用》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、第6章視頻壓縮技術(shù)6.1視頻壓縮的基本原理6.2靜止圖像壓縮6.3活動圖像編碼6.4音頻壓縮的原理和標(biāo)準(zhǔn)思考題和習(xí)題6.1視頻壓縮的基本原理6.1.1視頻信號壓縮的可能性視頻數(shù)據(jù)中存在著大量的冗余,即圖像的各像素數(shù)據(jù)之間存在極強(qiáng)的相關(guān)性。利用這些相關(guān)性,一部分像素的數(shù)據(jù)可以由另一部分像素的數(shù)據(jù)推導(dǎo)出來,結(jié)果視頻數(shù)據(jù)量能極大地壓縮,有利于傳輸和存儲。視頻數(shù)據(jù)主要存在以下形式的冗余。1.空間冗余視頻圖像在水平方向相鄰像素之間、垂直方向相鄰像素之間的變化一般都很小,存在著極強(qiáng)的空間相關(guān)性。特別是同一景物各點的灰度和顏色之
2、間往往存在著空間連貫性,從而產(chǎn)生了空間冗余,常稱為幀內(nèi)相關(guān)性。2.時間冗余在相鄰場或相鄰幀的對應(yīng)像素之間,亮度和色度信息存在著極強(qiáng)的相關(guān)性。當(dāng)前幀圖像往往具有與前、后兩幀圖像相同的背景和移動物體,只不過移動物體所在的空間位置略有不同,對大多數(shù)像素來說,亮度和色度信息是基本相同的,稱為幀間相關(guān)性或時間相關(guān)性。3.結(jié)構(gòu)冗余在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。如方格狀的地板圖案等。已知分布模式,可以通過某一過程生成圖像,稱為結(jié)構(gòu)冗余。4.知識冗余有些圖像與某些知識有相當(dāng)大的相關(guān)性。如人臉的圖像有固定的結(jié)
3、構(gòu),嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于臉部圖像的中線上。這類規(guī)律性的結(jié)構(gòu)可由先驗知識得到,此類冗余稱為知識冗余。5.視覺冗余人眼具有視覺非均勻特性,對視覺不敏感的信息可以適當(dāng)?shù)厣釛墶T谟涗浽嫉膱D像數(shù)據(jù)時,通常假定視覺系統(tǒng)是線性的和均勻的,對視覺敏感和不敏感的部分同等對待,從而產(chǎn)生了比理想編碼(即把視覺敏感和不敏感的部分區(qū)分開來編碼)更多的數(shù)據(jù),這就是視覺冗余。人眼對圖像細(xì)節(jié)、幅度變化和圖像的運動并非同時具有最高的分辨能力。人眼視覺對圖像的空間分解力和時間分解力的要求具有交換性,當(dāng)對一方要求較高時,對另一方
4、的要求就較低。根據(jù)這個特點,可以采用運動檢測自適應(yīng)技術(shù),對靜止圖像或慢運動圖像降低其時間軸抽樣頻率,例如每兩幀傳送一幀;對快速運動圖像降低其空間抽樣頻率。另外,人眼視覺對圖像的空間、時間分解力的要求與對幅度分解力的要求也具有交換性,對圖像的幅度誤差存在一個隨圖像內(nèi)容而變的可覺察門限,低于門限的幅度誤差不被察覺,在圖像的空間邊緣(輪廓)或時間邊緣(景物突變瞬間)附近,可覺察門限比遠(yuǎn)離邊緣處增大3~4倍,這就是視覺掩蓋效應(yīng)。根據(jù)這個特點,可以采用邊緣檢測自適應(yīng)技術(shù),對于圖像的平緩區(qū)或正交變換后代表圖像低頻成分的系數(shù)細(xì)量
5、化,對圖像輪廓附近或正交變換后代表圖像高頻成分的系數(shù)粗量化;當(dāng)由于景物的快速運動而使幀間預(yù)測編碼碼率高于正常值時進(jìn)行粗量化,反之則進(jìn)行細(xì)量化。在量化中,盡量使每種情況下所產(chǎn)生的幅度誤差剛好處于可覺察門限之下,這樣能實現(xiàn)較高的數(shù)據(jù)壓縮率而主觀評價不變。6.圖像區(qū)域的相同性冗余在圖像中的兩個或多個區(qū)域所對應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復(fù)性存儲,這就是圖像區(qū)域的相似性冗余。在這種情況下,記錄了一個區(qū)域中各像素的顏色值,與其相同或相近的區(qū)域就不再記錄各像素的值。矢量量化方法就是針對這種冗余圖像的壓縮方法。7.紋
6、理的統(tǒng)計冗余有些圖像紋理盡管不嚴(yán)格服從某一分布規(guī)律,但是在統(tǒng)計的意義上服從該規(guī)律,利用這種性質(zhì)也可以減少表示圖像的數(shù)據(jù)量,稱為紋理的統(tǒng)計冗余。電視圖像信號數(shù)據(jù)存在的信息冗余為視頻壓縮編碼提供了可能。6.1.2視頻信號的數(shù)字化和壓縮模擬電視信號(包括視頻和音頻)通過取樣、量化后編碼為二進(jìn)制數(shù)字信號的過程稱為模數(shù)變換(A/D變換)或脈沖編碼調(diào)制(PCM,PulseCodingModulation),所得到的信號也稱為PCM信號,其過程可用圖6-1(a)表示。若取樣頻率等于fs、用n比特量化,則PCM信號的碼率為nfs(
7、比特/s)。PCM編碼既可以對彩色全電視信號直接進(jìn)行,也可以對亮度信號和兩個色差信號分別進(jìn)行,前者稱為全信號編碼,后者稱為分量編碼。PCM信號經(jīng)解碼和插入濾波恢復(fù)為模擬信號,如圖6-1(b)所示,解碼是編碼的逆過程,插入濾波是把解碼后的信號插補(bǔ)為平滑、連續(xù)的模擬信號。這兩個步驟合稱為數(shù)模變換(D/A變換)或PCM解碼。圖6-1電視信號的數(shù)字化和復(fù)原(a)A/D變換;(b)D/A變換1.奈奎斯特取樣定理理想取樣時,只要取樣頻率大于或等于模擬信號中最高頻率的兩倍,就可以不失真地恢復(fù)模擬信號,稱為奈奎斯特取樣定理。模擬信
8、號中最高頻率的兩倍稱為折疊頻率。2.亞奈奎斯特取樣按取樣定理,若取樣頻率fs小于模擬信號最高頻率fmax的2倍會產(chǎn)生混疊失真,但若巧妙地選擇取樣頻率,令取樣后頻譜中的混疊分量落在色度分量和亮度分量之間,就可用梳狀濾波器去掉混疊成分。3.均勻量化和非均勻量化在輸入信號的動態(tài)范圍內(nèi),量化間隔幅度都相等的量化稱為均勻量化或線性量化。對于量化間距固定的均勻量化,信噪