資源描述:
《基于視覺感知的場景提取方法》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、基于生物視覺感知的場景提取方法陳碩吳成東陳東岳楚好(東北大學信息科學與工程學院)摘要:針對復(fù)雜背景環(huán)境下圖像場景理解及分類中遇到的諸多難題,提出了一種模擬生物視覺感知的新的圖像場景特征提取方法。該方法采用方向、顏色和亮度三種感知特征來構(gòu)造視覺顯著圖,并對基本單元進行最大化處理來得到更加精確的方向信息。為了提高特征提取的速度,設(shè)計了區(qū)域分割算法,然后構(gòu)造分割區(qū)域描述子,最后通過SVM對特征向量集合進行無監(jiān)督分類以實現(xiàn)顯著區(qū)域匹配,與傳統(tǒng)方法相比,該方法提取的特征對于一定程度的仿射和光照變化具有較好的分類
2、效果,實驗結(jié)果表明上述方法能夠較好地應(yīng)用于場景分類及檢索,并具有較強的時效性。引言場景分類是運用數(shù)字圖像處理與模式識別方法實現(xiàn)圖像按場景分類與識別。其目標是把圖像場景自動的分到有語義的場景分類方法中,如辦公室、運動場、公路等。目前,在圖像場景分類方法中,較為經(jīng)典的有基于目標識別的方法、基于背景的方法、基于感興趣區(qū)域分割的方法及基于模擬視覺系統(tǒng)(Humanvisionsystem,HVS)的方法?;谀繕俗R別的方法多采用圖像的局部特征來表示圖像。Lowe[1]提出尺度不變特征轉(zhuǎn)換(scaleinvari
3、antfeaturetransform,SIFT)。Mikolajczyk[2]提出了尺度和仿射不變量的興趣點檢測GLOH算法。這些方法被成功應(yīng)用到了很多領(lǐng)域。但是基于目標的場景分類方法忽略了圖像的空間信息,并且信息量非常大,因此時效性和泛化能力都存在很大的不足?;诒尘暗姆椒ㄊ抢脠D像的底層全局特征來表征圖像的概要信息,一般采用小波變換、傅里葉分析等方法提取圖像的紋理特征,并結(jié)合語義[3]分析方法來實現(xiàn)場景分類。實驗證明該方法對實現(xiàn)復(fù)雜多變背景下[4]場景分類效果顯著,但是該方法不能處理局部區(qū)域中的
4、噪聲及特征變化對分類造成的影響?;诟信d趣區(qū)域分割的方法在特征提取過程中應(yīng)用了相關(guān)反饋算法,進一步學習產(chǎn)生用戶的主觀意圖,如通過共生矩陣分割、水平集等方法實現(xiàn)。該方法需要很強的背景支持,主要應(yīng)用于有監(jiān)督分類,在無監(jiān)督分類中不能得到滿意的效果。模擬HVS的場景分類方法就是通過模擬人的視覺層感知[5]功能來實現(xiàn)場景分類,現(xiàn)已成為神經(jīng)系統(tǒng)科學和計算機視覺領(lǐng)域的研究熱點。研究表明視皮層更為復(fù)雜的分塊分層結(jié)構(gòu),生物視覺系統(tǒng)是一個串行和并行處理相結(jié)合的復(fù)雜系統(tǒng),由此產(chǎn)生的感受野理論闡述了在視覺通道上各層次神經(jīng)細胞
5、所處理的信息分別對應(yīng)于視網(wǎng)膜上的一個局部區(qū)域,感受野是支持視覺信息分層串行處理的最重要的生理學基礎(chǔ)。Itti[6]等人構(gòu)建了第一個基于神經(jīng)生物學框架的視覺顯著度計算模型,簡稱Itti模型。Siagian[7]等人開發(fā)了一個基于概要模型的場景分類框架,該框架增加了模擬人的注意力選擇模塊。Poggio[8]等人提出采用Cl單元信息來反應(yīng)視皮層中復(fù)雜的神經(jīng)細胞。Song[9]等人提出生物感知特征(biologicalinspiredfeature,BIF)用于場景分類。1.場景分類框圖設(shè)計圖1基于生物視覺特
6、征的場景分類框架基于Treisment[10]的特征整合理論(featureintegrationtheory,F(xiàn)IT)和Koch[11]提出的神經(jīng)生物學結(jié)構(gòu)框架,本文選擇了方向、顏色和亮度三個符合視覺注意的特征作為場景特征,并通過改進Itti視覺注意模型得到融合這三種特征的顯著圖;然后利用單元最小化的區(qū)域生長算法對得到一些矩形區(qū)域,通過分塊梯度方向直方圖組合來生成特征區(qū)域描述子;最后采用SVM對描述子向量進行無監(jiān)督分類,根據(jù)顯著區(qū)域匹配結(jié)果得到場景分類結(jié)果。基于本文提出的場景特征的場景分類框架如圖1
7、所示。2.場景特征提取圖像的特征是用來表示圖像信息并應(yīng)用于圖像分類及檢索。本文通過多尺度濾波、單元最小化的區(qū)域生長、分塊梯度直方圖組合等步驟來實現(xiàn)場景的特征提取,并通過SVM對特征向量進行分類,進而來指導(dǎo)場景分類。2.1生物感知特征提取利用與感受野機制相似的Gabor濾波器來獲得方向特征。Gabor基函數(shù)的一般形式如式(1):式中為空間域中高斯函數(shù)的帶寬。以g(x,y)為母小波,則通過對g(x,y)進行適當?shù)某叨茸儞Q和旋轉(zhuǎn)變換,就可得到自相似的一組濾波器,成為Gabor小波,如式(2)所示:其中:=,
8、,這里x和y的范圍決定了Gabor濾波器的尺度變化范圍,控制著方向數(shù)。采用Gabor濾波器組成一個具有八尺度(濾波器大小由77到2121,步長為2個像素),四方向()的濾波器組,可以得到32幅濾波圖像。由于Gabor提取的方向信息和視網(wǎng)膜神經(jīng)細胞的響應(yīng)不完全一致且相鄰兩個尺度的Gabor濾波器尺寸差很小,基于Poggio提出的cl單元對相同方向尺度相鄰的2幅濾波圖像進行一個最大化處理可以得到更加精確的方向信息,這樣可將32幅濾波圖像縮減為16幅。具體做法