基于視覺感知的場景提取方法

ID：14551213

大小：469.92 KB

頁數(shù)：4頁

時間：2018-07-29

資源描述：

《基于視覺感知的場景提取方法》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、基于生物視覺感知的場景提取方法陳碩吳成東陳東岳楚好（東北大學信息科學與工程學院）摘要：針對復(fù)雜背景環(huán)境下圖像場景理解及分類中遇到的諸多難題，提出了一種模擬生物視覺感知的新的圖像場景特征提取方法。該方法采用方向、顏色和亮度三種感知特征來構(gòu)造視覺顯著圖，并對基本單元進行最大化處理來得到更加精確的方向信息。為了提高特征提取的速度，設(shè)計了區(qū)域分割算法，然后構(gòu)造分割區(qū)域描述子，最后通過SVM對特征向量集合進行無監(jiān)督分類以實現(xiàn)顯著區(qū)域匹配，與傳統(tǒng)方法相比，該方法提取的特征對于一定程度的仿射和光照變化具有較好的分類

2、效果，實驗結(jié)果表明上述方法能夠較好地應(yīng)用于場景分類及檢索，并具有較強的時效性。引言場景分類是運用數(shù)字圖像處理與模式識別方法實現(xiàn)圖像按場景分類與識別。其目標是把圖像場景自動的分到有語義的場景分類方法中，如辦公室、運動場、公路等。目前，在圖像場景分類方法中，較為經(jīng)典的有基于目標識別的方法、基于背景的方法、基于感興趣區(qū)域分割的方法及基于模擬視覺系統(tǒng)（Humanvisionsystem，HVS）的方法?；谀繕俗R別的方法多采用圖像的局部特征來表示圖像。Lowe[1]提出尺度不變特征轉(zhuǎn)換（scaleinvari

3、antfeaturetransform，SIFT）。Mikolajczyk[2]提出了尺度和仿射不變量的興趣點檢測GLOH算法。這些方法被成功應(yīng)用到了很多領(lǐng)域。但是基于目標的場景分類方法忽略了圖像的空間信息，并且信息量非常大，因此時效性和泛化能力都存在很大的不足?；诒尘暗姆椒ㄊ抢脠D像的底層全局特征來表征圖像的概要信息，一般采用小波變換、傅里葉分析等方法提取圖像的紋理特征，并結(jié)合語義[3]分析方法來實現(xiàn)場景分類。實驗證明該方法對實現(xiàn)復(fù)雜多變背景下[4]場景分類效果顯著,但是該方法不能處理局部區(qū)域中的

4、噪聲及特征變化對分類造成的影響?；诟信d趣區(qū)域分割的方法在特征提取過程中應(yīng)用了相關(guān)反饋算法,進一步學習產(chǎn)生用戶的主觀意圖,如通過共生矩陣分割、水平集等方法實現(xiàn)。該方法需要很強的背景支持,主要應(yīng)用于有監(jiān)督分類,在無監(jiān)督分類中不能得到滿意的效果。模擬HVS的場景分類方法就是通過模擬人的視覺層感知[5]功能來實現(xiàn)場景分類，現(xiàn)已成為神經(jīng)系統(tǒng)科學和計算機視覺領(lǐng)域的研究熱點。研究表明視皮層更為復(fù)雜的分塊分層結(jié)構(gòu)，生物視覺系統(tǒng)是一個串行和并行處理相結(jié)合的復(fù)雜系統(tǒng)，由此產(chǎn)生的感受野理論闡述了在視覺通道上各層次神經(jīng)細胞

5、所處理的信息分別對應(yīng)于視網(wǎng)膜上的一個局部區(qū)域，感受野是支持視覺信息分層串行處理的最重要的生理學基礎(chǔ)。Itti[6]等人構(gòu)建了第一個基于神經(jīng)生物學框架的視覺顯著度計算模型，簡稱Itti模型。Siagian[7]等人開發(fā)了一個基于概要模型的場景分類框架，該框架增加了模擬人的注意力選擇模塊。Poggio[8]等人提出采用Cl單元信息來反應(yīng)視皮層中復(fù)雜的神經(jīng)細胞。Song[9]等人提出生物感知特征（biologicalinspiredfeature，BIF）用于場景分類。1.場景分類框圖設(shè)計圖1基于生物視覺特

6、征的場景分類框架基于Treisment[10]的特征整合理論（featureintegrationtheory，F(xiàn)IT）和Koch[11]提出的神經(jīng)生物學結(jié)構(gòu)框架，本文選擇了方向、顏色和亮度三個符合視覺注意的特征作為場景特征，并通過改進Itti視覺注意模型得到融合這三種特征的顯著圖；然后利用單元最小化的區(qū)域生長算法對得到一些矩形區(qū)域，通過分塊梯度方向直方圖組合來生成特征區(qū)域描述子；最后采用SVM對描述子向量進行無監(jiān)督分類，根據(jù)顯著區(qū)域匹配結(jié)果得到場景分類結(jié)果。基于本文提出的場景特征的場景分類框架如圖1

7、所示。2.場景特征提取圖像的特征是用來表示圖像信息并應(yīng)用于圖像分類及檢索。本文通過多尺度濾波、單元最小化的區(qū)域生長、分塊梯度直方圖組合等步驟來實現(xiàn)場景的特征提取，并通過SVM對特征向量進行分類，進而來指導(dǎo)場景分類。2.1生物感知特征提取利用與感受野機制相似的Gabor濾波器來獲得方向特征。Gabor基函數(shù)的一般形式如式(1)：式中為空間域中高斯函數(shù)的帶寬。以g（x，y）為母小波，則通過對g（x，y）進行適當?shù)某叨茸儞Q和旋轉(zhuǎn)變換，就可得到自相似的一組濾波器，成為Gabor小波，如式（2）所示：其中：=，

8、，這里x和y的范圍決定了Gabor濾波器的尺度變化范圍，控制著方向數(shù)。采用Gabor濾波器組成一個具有八尺度（濾波器大小由77到2121，步長為2個像素），四方向（）的濾波器組，可以得到32幅濾波圖像。由于Gabor提取的方向信息和視網(wǎng)膜神經(jīng)細胞的響應(yīng)不完全一致且相鄰兩個尺度的Gabor濾波器尺寸差很小，基于Poggio提出的cl單元對相同方向尺度相鄰的2幅濾波圖像進行一個最大化處理可以得到更加精確的方向信息，這樣可將32幅濾波圖像縮減為16幅。具體做法

當前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 / 4



此文檔下載收益歸作者所有

當前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

基于視覺感知的場景提取方法

基于視覺感知的場景提取方法

相關(guān)文章

相關(guān)標簽