資源描述:
《多視點視頻編碼快速算法研究【文獻綜述】》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、畢業(yè)設計文獻綜述電子信息科學與技術多視點視頻編碼快速算法研究摘要:多視點視頻編碼快速算法的主要目的,是研究如何通過提高壓縮效率以及有效消除各個視頻流內的時空冗余及交叉冗余并提高多視點視頻壓縮效率的技術,為提高多視點視頻編解碼的處理速度提供技術支持。本文介紹了多視點視頻編碼技術的研究現狀和發(fā)展趨勢,分析比較了幾種快速算法,特別是多宏塊快速算法。每種快速算法均可以提高編碼效率,但是性能方面卻不太相同。大多數算法采用率失真代價這一評價手段來衡量所提出的快速算法,最后提出了多視點視頻今后的研究方向。關鍵詞:多視點視頻;視頻編碼;快速算法;宏塊模式選擇一、背景1.1傳統(tǒng)的單視點視頻
2、編碼技術傳統(tǒng)的視頻編碼技術上一種單路視頻信號,同時其對應的深度視頻也是單路的。單路是視頻信號由于對物體圖像的采集只是從單一的一個視點出發(fā)的,因此在圖像呈現上存在不夠立體,不夠真實,同時存在遮擋的問題。在傳統(tǒng)的視頻編碼技術中以ISO/IEC(InternationalOrganizationforStandards/InternationalElectro-TechnicalCommission國際標準化組織/國際電工委員會)制定的MPEG-x系列[1]和ITU-T(InternationalTelecommunicationUnion國際電子聯(lián)盟電信標準化局)制定的H.2
3、6-x系列編碼技術最為人們所熟悉和應用。1.2多視點視頻編碼技術在視頻技術領域中,主要的發(fā)展趨勢是追求對自然景物更加真實、清晰的表征。立體電視和立體電影表征出來的3D顯示效果;在進行可視電話或者遠程可視會議時,用戶的臨場感;遠程診療時,醫(yī)生需要病人全方位的視頻信息;網上購物,人們也希望能夠看到物品在多個視角的描述。多視點視頻技術越來越受到學術界和工業(yè)界的重視,并且成為當前視頻研究領域的熱點之一[2-4]。1.3多視點視頻編碼技術研究現狀國外對于多視點視頻的研究從20世紀90年代就開始展開了[5],十多年來,其研究成果已經覆蓋多視點視頻各個領域,包括多視點的捕獲、編碼、傳輸
4、以及呈現等。其中德國、法國、美國、日本和韓國等對多視點的研究比較深入[6],比如歐洲幾個國家從1992年開始聯(lián)合開展的DISTIMA項目,采用MPEG2標準作為基礎實現了一個完整的立體視頻系統(tǒng)。另外,德國的HHI研究所致力于研究沉浸式立體視頻會議系統(tǒng)[7]。國內學術界對多視點視頻的研究開始于90年代后期,到目前為止,已在多視點視頻編碼壓縮以及虛擬視點合成等領域取得了一定的研究成果,其中主要有清華大學、上海大學、天津大學、寧波大學等高校。一、多視點視頻編碼技術2.1多視點視頻快速算法研究現狀JVT(jointvideoteam)[1]提出了多視點視頻編碼(MVC,multi
5、viewvideocoding)的概念,并長期致力于視頻編碼的標準化工作,目前正在提出多視點視頻編碼校驗模型型(JointMultiviewVideoModel,JMVM)[8],作為多視點視頻編碼的研究平臺。在編碼過程中,采用了率失真優(yōu)化技術來進行宏塊模式的選擇,可以在獲得好的畫面質量和代碼率之間獲取平衡。在多視點視頻編碼技術的研究過程中,國內外的一些研究機構和大學提出了一些多視點視頻編碼的快速算法。目前,國內外一些研究機構和高等院校仍在積極探索高精度、高效率的視頻編碼宏塊模式快速選擇算法,取得了很大的進展,提出了許多宏塊模式快速選擇算法。這些方法從不同的角度或不同的目
6、的對視頻編碼問題進行了研究?;贘MVM的宏塊模式選擇情況,國內外研究針對降低宏塊模式選擇方法中的計算復雜度,提出了各種改進的算法。基于動態(tài)多閾值、多視點視頻編碼、H.264的幀間宏塊模式、虛擬視點合成算法、塊匹配的運動估計等,有選擇地對某個或某幾個預測塊模式進行搜索計算,從而達到降低計算復雜度的效果。2.2各種多視點視頻快速算法H.246采用的全新編碼技術包括幀內預測多宏塊、多參考幀、率失真優(yōu)化等。文獻[9][9]一文中提出的一系列基于統(tǒng)計信息、宏塊分類和自適應判決門限的提前選擇某模式為最優(yōu)模式的快速模式選擇策略;文獻[10][10]一文中利用圖像序列的時/空相關性提出
7、了一種H.246中幀間預測的快速預測模式選擇法;文獻[11][11]一文中提出了基于率失真優(yōu)化的復雜度可分級碼率控制算法等。多宏塊模式有效地提高了編碼效率,對于圖像細節(jié)分布不均勻的視頻序列效果尤其明顯;多參考幀進一步提高了預測精度和編碼效率,但基于多宏塊模式、多參考幀所帶來的編碼高性能是以算法的高復雜性為代價。文獻[12][12]一文中提出基于H.264多宏塊模式多參考幀運動估計的一種快速搜索算法,此快速搜索算法能有效降低搜索算法的運算量,提高H.264編碼速度,但是增加了算法的復雜性。因此,能夠在保證編碼性能的前提下提高編碼