資源描述:
《基于內(nèi)容的圖像檢索技術(shù)研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、基于內(nèi)容的圖像檢索技術(shù)研究摘要:本文首先介紹了基于內(nèi)容的圖像檢索系統(tǒng)的一般結(jié)構(gòu),然后詳細(xì)介紹了國內(nèi)外被廣泛應(yīng)用的特征提取和描述方法,主要對(duì)幾種常用的基于單一特征和多特征的相似性度量方法進(jìn)行分析。關(guān)鍵詞:關(guān)鍵詞:圖像檢索單一特征多特征相似度中圖分類號(hào):TP752文獻(xiàn)標(biāo)識(shí)碼:A:0引言圖像數(shù)據(jù)庫是目前一個(gè)研究熱門領(lǐng)域,怎樣對(duì)這些圖像數(shù)據(jù)進(jìn)行快速檢索,則需要用到圖像檢索技術(shù),而基于內(nèi)容的圖像檢索技術(shù)是用于對(duì)海量圖像數(shù)據(jù)進(jìn)行檢索的新技術(shù)。1.基于內(nèi)容的圖像檢索系統(tǒng)一般結(jié)構(gòu)在基于內(nèi)容的圖像數(shù)據(jù)庫中,首先把被檢索圖像的顏色、紋理、形狀
2、等特征信息提取出來,然后再與圖像數(shù)據(jù)庫中圖像的特征信息進(jìn)行相似性比較,根據(jù)相似度大小輸出查詢結(jié)果,要求基于內(nèi)容圖像檢索技術(shù)需要包括數(shù)據(jù)模型、圖像內(nèi)容獲取、人機(jī)接口、以及完成檢索框架等功能,以下描述基于內(nèi)容的圖像檢索系統(tǒng)的體系結(jié)構(gòu)劃分為特征提取和查詢兩個(gè)子系統(tǒng),一般框架如圖1-1所示:圖1基于內(nèi)容的圖像檢索系統(tǒng)一般結(jié)構(gòu)各個(gè)模塊的作用分別是:(1)預(yù)處理:對(duì)圖像進(jìn)行一些預(yù)處理操作,包括圖像去噪、增強(qiáng)、格式轉(zhuǎn)換、規(guī)格化等,方便后面對(duì)圖像進(jìn)行特征提?。唬?)目標(biāo)識(shí)別:識(shí)別出圖像中用戶感興趣的區(qū)域或?qū)ο?,以方便進(jìn)行特征提取和檢索;(
3、3)特征提取:這是基于內(nèi)容的圖像檢索系統(tǒng)的核心部分。目前使用較多、比較成熟的檢索算法大部分是基于圖像低層視覺特征的。數(shù)據(jù)庫由圖像庫、特征庫和知識(shí)庫組成。其中特征庫是包含提取出的圖像的各種特征;知識(shí)庫包含專門和通用知識(shí),能實(shí)現(xiàn)查詢優(yōu)化和快速匹配。(4)查詢接口:為用戶提供一個(gè)友好的查詢界面和多樣的查詢手段,主要的查詢方式有外部圖例查詢、內(nèi)部圖例查詢、草圖查詢和綜合查詢。外部圖例查詢是實(shí)例圖像于圖像檢索系統(tǒng)的外部,不是圖像庫中存儲(chǔ)的圖像。內(nèi)部圖例查詢則是實(shí)例圖像于圖像檢索系統(tǒng)的圖像庫中。草圖查詢是實(shí)例圖像由用戶自己創(chuàng)建。綜合查
4、詢方法則是綜合應(yīng)用了以上的幾種查詢方式。(5)檢索引擎:包含一個(gè)有效可靠的相似性測(cè)度函數(shù)集,用于對(duì)查詢圖像和圖像庫中的圖像進(jìn)行相似性度量。(6)索引/過濾:對(duì)圖像庫中的圖像按某種標(biāo)準(zhǔn)進(jìn)行篩選,以提高檢索的速度。2.特征提取與描述特征提取是基于內(nèi)容的圖像檢索技術(shù)研究的核心內(nèi)容,是把圖像的內(nèi)容信息提取出來,據(jù)此進(jìn)行圖像檢索。圖像的特征主要包括低層特征和高層語義特征。低層特征如顏色、形狀、紋理是圖像的一些定量的特征,可以通過計(jì)算機(jī)自動(dòng)或人機(jī)交互的方式提取。而高層語義特征是圖像的一種定性的特征,更接近于智能化的理解,主要通過人機(jī)交
5、互或人工的方式提取。基于語義的圖像檢索技術(shù)是最符合用戶要求的檢索技術(shù),它的發(fā)展可能是基于內(nèi)容的圖像檢索技術(shù)走向成熟與實(shí)用的關(guān)鍵。但是由于低層視覺特征和高層語義之間存在溝通鴻溝,難以找到圖像語義的有效描述方式、提取圖像語義描述的方法以及語義的處理方法,所以目前應(yīng)用較多、比較成熟的檢索方法都是基于低層特征的。2.1顏色特征顏色是描述一幅圖像的最簡便而有效的特征,因?yàn)轭伾蛨D像中所包含的物體和場(chǎng)景十分有關(guān)。而且與其他低層特征相比,顏色特征對(duì)于圖像縮放、旋轉(zhuǎn)、遮擋及其他形變有著更強(qiáng)的魯棒性,是基于內(nèi)容的圖像檢索采用的最早最廣泛
6、的低層特征。(1)顏色空間介紹對(duì)圖像的處理需要在特定的顏色空間中進(jìn)行,選擇不同的顏色空間就會(huì)有不同的處理效果。顏色空間通??梢苑譃槊嫦蛴布兔嫦蛞曈X感知兩類。面向硬件的顏色空間包括RGB、CMY等;面向視覺感知的顏色空間包括HSV、YUV、L*a*b*等。①RGB空間現(xiàn)有的圖像采集設(shè)備采集到的信息都是RGB值,所以RGB空間是最基礎(chǔ)的顏色空間,圖像處理中其它的顏色空間也是從RGB空間轉(zhuǎn)換而來。RGB的三個(gè)分量R、G、B即是自然界中的三原色,紅色、綠色、藍(lán)色。它是一種與人的視覺系統(tǒng)密切相關(guān)的顏色模型。它的模型如圖2所示,三個(gè)
7、坐標(biāo)軸分別代表R、G、B三個(gè)分量,圖中坐標(biāo)為(1,0,0)、(0,1,0)、(0,0,1)的三個(gè)點(diǎn)分別對(duì)應(yīng)于紅色、綠色、藍(lán)色,原點(diǎn)對(duì)應(yīng)于黑色,坐標(biāo)為(1,1,1)的點(diǎn)就代表白色。每一幅彩色圖像的顏色值都可以用這個(gè)模型進(jìn)行分解。圖2RGB顏色空間模型RGB空間的缺點(diǎn)主要有兩個(gè),一是不符合人的視覺感知心理,不能與人的視覺特征相匹配,不夠直觀;二是RGB空間屬于不均勻顏色空間,R、G、B這三個(gè)分量存在著密切的關(guān)聯(lián)性,所以不能通過直接計(jì)算兩個(gè)顏色點(diǎn)之間的距離來表示它們之間的顏色差異。②HSV空間與RGB空間相比,HSV空間是一種均
8、勻的顏色空間,而且它與人類的視覺感知相符合。三個(gè)分量H、S、V分別是色調(diào)、飽和度和亮度。色調(diào)(H)是指光的顏色,它與混合光譜中主要光波長相聯(lián)系。波長不同,光呈現(xiàn)的顏色就不同。飽和度(S)是指彩色的深淺程度,飽和度越高的,顏色程度越深,越低的顏色程度就越淺。亮度(V)是指人眼感受到的光的明暗程度。從RGB