資源描述:
《hevc視頻編碼碼率控制技術(shù)研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第一章緒論第一章緒論1.1選題背景與意義隨著計算機(jī)網(wǎng)絡(luò)、通信技術(shù)及多媒體技術(shù)的發(fā)展,視頻相關(guān)應(yīng)用變得越來越廣泛。HDTV、IPTV、網(wǎng)絡(luò)電視、可視電話等對人們?nèi)粘I畹囊财鹬絹碓街匾淖饔?。視頻信息相對于圖片、文字等具有生動、直觀等優(yōu)勢,而且數(shù)字化后的視頻信息也更易存儲、處理和傳輸。但是視頻數(shù)據(jù)往往十分巨大,視頻的存儲和傳輸給現(xiàn)有的存儲和通信系統(tǒng)帶來了巨大的挑戰(zhàn)。以PAL制電視視頻為例,一秒鐘PAL視頻所需要33.2MB存儲空間,對于650MB的光盤來說,僅能存20s。若是直接存儲原始視頻數(shù)據(jù),所需要的存
2、儲空間巨大,因此直接存儲是不切實際的;另外想要以25幀/s來傳輸此未經(jīng)壓縮的視頻數(shù)據(jù),數(shù)據(jù)的傳輸速率必須要達(dá)到216Mbps,顯然,以現(xiàn)在的通信技術(shù)直接傳輸不壓縮的視頻是不現(xiàn)實的。因此,必須利用視頻壓縮技術(shù)來降低視頻的存儲容量以及傳輸帶寬。為了統(tǒng)一視頻壓縮的技術(shù)規(guī)范和碼流格式,國際視頻組織制定了一系列的視頻編碼技術(shù)標(biāo)準(zhǔn)。在2013年1月,國際標(biāo)準(zhǔn)組織JCT-VC頒布了新一代的視頻編碼標(biāo)準(zhǔn),即高性能視頻編碼(HighEfficiencyVideoCoding,HEVC)標(biāo)準(zhǔn)[1]。視頻數(shù)據(jù)一般可分為信息和冗余
3、數(shù)據(jù)兩部分。視頻數(shù)據(jù)中的冗余數(shù)據(jù)一般是相同或者相似信息的重復(fù),因此可以通過去掉這些冗余信息達(dá)到視頻壓縮的目的。目前各種編碼標(biāo)準(zhǔn)都是有損壓縮,而且網(wǎng)絡(luò)通信的信道帶寬是有限和可變的,如果編碼后的碼流過大,超出了信道容量,那么視頻數(shù)據(jù)就丟失了;如果碼流過低,那么帶寬資源就被浪費了且無法獲得更高的視頻質(zhì)量。因此為了在有限的帶寬下獲得最佳的視頻質(zhì)量,就需要采用碼率控制技術(shù)。從根本上講,碼率控制就是在碼率和緩沖區(qū)的約束下,通過自適應(yīng)調(diào)節(jié)編碼參數(shù),使碼流與信道傳輸帶寬相適應(yīng),并且使視頻的失真最小[2]。碼率控制常常通過編
4、碼參數(shù)QP進(jìn)行調(diào)整,使得實際碼率與目標(biāo)碼率相接近。若量化參數(shù)QP較小視頻圖像中較多的細(xì)節(jié)信息可以被保留下來,但輸出碼率也會因此而較高;若量化參數(shù)QP較大,則碼率會降低,但此時視頻的質(zhì)量也會隨之降低。因此碼率控制的目標(biāo)并不是單一的,它涉及視頻質(zhì)量和信道帶寬的折衷。碼率控制算法若合理,則不但能夠提高信道的利用率而且還能保證視頻的質(zhì)量,因此碼率控制算法對視頻壓縮和傳輸具有非常重要的意義。隨著高清視頻內(nèi)容的增多,視頻數(shù)1第一章緒論據(jù)量將會更加巨大,這就更需要精確的碼率控制算法能夠在一定的帶寬限制下保證視頻的質(zhì)量。本
5、文針對HEVC標(biāo)準(zhǔn),研究了如何精確控制碼率的問題。1.1國內(nèi)外研究現(xiàn)狀MPEG-2[3]的TM5[4]算法、MPEG-4[5]的VM8[6]算法、H.263[7]的TMN8[8]算法以及H.264[9]的JVT-F086[10]、JVT-G012[11]和JVT-W042[12]是碼率控制中較為經(jīng)典的算法。其中,JVT-G012碼率控制的效果較好,得到了廣泛的應(yīng)用。為了解決單擊悖論,JVT-G012采用了線性平均絕對值(MAD)預(yù)測模型。對于目標(biāo)比特分配,則采用了流量傳輸模型;對于編碼參數(shù)QP,則采用二次率
6、失真模型計算。近十年來,國內(nèi)外相關(guān)學(xué)者針對視頻編碼標(biāo)準(zhǔn)中碼率控制算法提出了大量的改進(jìn)算法和解決方案,其中主要針對JVT-G012碼率控制算法進(jìn)行了改進(jìn)。這些改進(jìn)算法可以分為I幀碼率控制算法改進(jìn)、P幀碼率控制算法改進(jìn)和基于主觀的碼率控制算法等方面。接下來,將對各個方面具有一定代表性的改進(jìn)算法進(jìn)行介紹。(1)I幀碼率控制I幀的量化參數(shù)將對之后編碼幀量化參數(shù)的計算起到十分重要的作用,這是因為I幀是后續(xù)編碼幀的參考幀。如果I幀量化參數(shù)值較小,可能消耗比特數(shù)較多,那么很可能引起緩沖區(qū)上溢而出現(xiàn)大量跳幀,而且因為之后編
7、碼的幀可用比特數(shù)減少,后續(xù)幀的質(zhì)量可能會隨之下降。若I幀量化參數(shù)較大,雖然I幀所用比特數(shù)減少,但是降低了I幀的質(zhì)量,而且還會使后續(xù)編碼幀的質(zhì)量也隨之降低。經(jīng)典JVT-G012提案中第一個GOP的I幀和第一個P幀是以QP0編碼,而QP0是由兩個因素確定的,即GOP長度和信道帶寬,因此這種方法的缺點是沒有考慮圖像復(fù)雜度以及緩沖區(qū)的狀態(tài)。文獻(xiàn)[13]中在I幀編碼之前通過計算平均梯度來測量圖像復(fù)雜度,并基于梯度的圖像復(fù)雜度提出了一個自適應(yīng)R-Qstep模型。此模型優(yōu)點是用梯度值來計算圖像復(fù)雜度,計算復(fù)雜度較小,而且
8、更新模型參數(shù)時不需要對圖像進(jìn)行預(yù)編碼,但此模型的缺點在于沒有考慮緩沖區(qū)的狀態(tài)。文獻(xiàn)[14]提出了一種基于失真的I幀碼率預(yù)測模型(ADIE)。該文獻(xiàn)首先通過建立了Qstep與MSE之間的線性模型,然后利用亮度的直方圖差分來判斷場景是否發(fā)生變換,若發(fā)生場景變換,此幀就會被當(dāng)作I幀進(jìn)行編碼。該文獻(xiàn)提出的碼率控制模型同時考慮了圖像復(fù)雜度,緩沖區(qū)狀態(tài)和場景變換,不僅提高了碼率控制準(zhǔn)確性,還可以使緩沖區(qū)的占用量更穩(wěn)定。但缺點