資源描述:
《不規(guī)則區(qū)域編碼概述與進(jìn)展》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、http://www.paper.edu.cn1不規(guī)則區(qū)域編碼綜述與進(jìn)展馬義德,張北斗,齊春亮蘭州大學(xué)信息科學(xué)與工程學(xué)院蘭州730000E-mail:ydma@lzu.edu.cn摘要:不規(guī)則區(qū)域編碼作為新一代圖像編碼方法,在壓縮圖像區(qū)域、保護(hù)邊緣紋理、提高圖像的重建質(zhì)量等方面具有較大潛力。本文將已有的各類不規(guī)則區(qū)域編碼方法與傳統(tǒng)方法進(jìn)行比較,綜述了此領(lǐng)域已取得的成果,提出了自己特有的處理方法,并分析所面臨的難點與對策,最后進(jìn)行了展望。關(guān)鍵詞:圖像編碼;彩色編碼;不規(guī)則區(qū)域;PCNN1.引言“第一代”圖像編碼技術(shù)在去除圖像數(shù)據(jù)的線性相關(guān)性方面進(jìn)行了
2、深入的研究,其出發(fā)點是消除圖像數(shù)據(jù)的統(tǒng)計冗余信息,如信息熵冗余、空間冗余等。行程編碼、霍夫曼編碼、算術(shù)編碼等便是其中杰出的經(jīng)典算法。目前為止,這類技術(shù)已十分成熟,研究空間極其有限。[1]1985年,Kunt等人提出了利用人眼視覺特性發(fā)展“第二代”圖像編碼技術(shù);1988年,Barnsley[2]M提出基于迭代系統(tǒng)的分形圖像編碼技術(shù);1989年,MallatS首先將小波變換用于多分辨[3]率圖像的描述。這些具有里程碑意義的事件給研究人員指引了研究方向,為圖像編碼開拓了新的領(lǐng)域。第二代編碼技術(shù)不再局限于信息論的框架,而是要求充分利用人的視覺、生理、心理及
3、圖像信源的各種特征,進(jìn)一步提高壓縮比。編碼時首先將圖像中諸如邊界、輪廓、紋理等結(jié)構(gòu)特征提取出來予以編碼,解碼時再根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行圖像重建,在獲得更高壓縮比的同時消除了JPEG等方法存在的重建圖像失真,比如方塊效應(yīng)。傳統(tǒng)的方法很少考慮圖像的內(nèi)容含義及人眼視覺系統(tǒng)(VHS),用規(guī)則的方塊分割處理后再編碼,因此容易導(dǎo)致高壓縮時出現(xiàn)嚴(yán)重的圖像失真?;诜指畹摹暗诙本幋a技術(shù)不再局限于簡單的方塊編碼,其出發(fā)點是,先讓分割區(qū)域(或紋理)與原始圖像對應(yīng)部分之間在視覺意義下最大地接近,然后再對這些區(qū)域(紋理)進(jìn)行編碼。當(dāng)然,這種突破常規(guī)的做法必然帶來處理上
4、的問題,比如,使用何種方案分割圖像,才能使分割簡單且適用范圍廣泛,使用何種基函數(shù)壓縮圖像區(qū)域,如何定位分割出的圖像內(nèi)容等。本文較全面地綜述了人們在這些方面的研究成果,同時提出了自己特有的處理思路和方法。2.幾種區(qū)域編碼方法的比較圖1所示為三種典型圖像編碼方案。圖1(b)為JPEG所用模型,以256×256的Lena圖1基金項目:國家自然科學(xué)基金資助項目(60572011),985特色項目計劃基金資助項目(LZ985-231-58262)-1-http://www.paper.edu.cn像為例,先進(jìn)行8×8分塊(總共1024塊),然后分別對每塊進(jìn)行
5、DCT變換,再對系數(shù)進(jìn)行游程和霍夫曼編碼等一系列操作。圖1(c)用二叉樹的方法對圖像進(jìn)行編解碼。圖1(d)是用一些研究中的新方法對圖像進(jìn)行不規(guī)則分割(本圖基于PCNN),然后分別對圖像邊緣及區(qū)域進(jìn)行編碼。(a)Lena原圖(b)8×8分塊(c)二叉樹分解(d)不規(guī)則分割圖1幾種典型編碼方法3.不規(guī)則區(qū)域編碼對圖1比較發(fā)現(xiàn),基于分塊的JPEG編碼只需要存儲或傳輸系數(shù)信息,不需要考慮邊緣及像素塊的位置;但是,這種方塊式的分塊編碼方法在高壓縮比下便產(chǎn)生了[4]方塊效應(yīng),如圖2所示??紤]到邊緣、紋理、平坦區(qū)域的重要性依次降低,基于不規(guī)則區(qū)域的編碼方法(a)
6、原圖(b)JPEG壓縮對人眼敏感的不同類型分別采取不同的編碼方法。①對邊緣像素使用鏈碼的方法,圖2JPEG壓縮效果幾乎無損壓縮;②對區(qū)域內(nèi)容,采用高壓縮比方法編碼。這樣,既保證了圖像編碼的高壓縮比,又能使重建圖像紋理清晰、邊緣分明。對同一幅圖像,分割后的不規(guī)則區(qū)域面積越大,總的塊數(shù)越少,整幅圖像的壓縮比就越高。本文后半部內(nèi)容會給出具體的數(shù)據(jù)及效果圖比較,下面先介紹圖像分割方法及不規(guī)則區(qū)域的編碼方法。3.1圖像分割方法[5][6][7]基于邊緣檢測、區(qū)域增長分水嶺的圖像分割是常用的方法之一。文獻(xiàn)[8]使用數(shù)學(xué)形態(tài)學(xué)算子(MathematicalMor
7、phologicOperator)分割圖像。在P.Salembier提出的形態(tài)學(xué)分割過程中,標(biāo)識提取(MarkerExtraction)是其中的重要一步,它的目的是在完成前一步的形態(tài)學(xué)簡化運算后,標(biāo)識出圖像中具有相同灰度等級的均勻區(qū)域。P.Salembier采用了基于尺寸的標(biāo)識方法,即首先計算每個均勻區(qū)域中像素的多少,然后按一個臨界值進(jìn)行取舍。然而當(dāng)分割過程進(jìn)一步細(xì)化時,采用尺寸法將產(chǎn)生許多小的區(qū)域,考慮到具有高對比度的區(qū)域包含更多的圖像特征信息,于是又提出了基于對比度的標(biāo)識方法,以便得到更理想的標(biāo)識結(jié)果??墒牵?2-http://www.pape
8、r.edu.cn這兩種方法都各有缺陷。文獻(xiàn)[10]使用小波變換的圖像分割方法,并將邊緣信息融入了小波系數(shù)之中。為了最大接近