資源描述:
《語義判別投影在圖像檢索中的應用》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、摘要摘要隨著數(shù)碼設備的普及,互聯(lián)網(wǎng)的興起,每天將產生大量數(shù)字圖像。為了有效的存儲、管理圖像數(shù)據(jù)庫,需要對圖像庫進行索引,按特定的需求檢索圖像。怎么根據(jù)數(shù)字圖像的視覺內容有效地管理圖像庫是當前研究的一大熱點。為此,基于內容的圖像檢索(ContentBasedImageRetrieval:CBIR)受到廣大計算機視覺、機器學習等領域研究人員的廣泛關注。經(jīng)過十幾年的努力,基于內容的圖像檢索依然有兩個基本問題有待解決。首先,用于描述圖像視覺內容的特征向量,如顏色、紋理、形狀、空間關系等等,一般維數(shù)比較高。很多情況下都是從幾百到幾千,一般的機器學習方法不能在這么高維的特征空間學習。這就是所謂的“維
2、數(shù)災難’’。其次,基于內容的圖像檢索中用于刻畫圖像視覺內容的低維特征與高層語義概念之間不存在直接的聯(lián)系,這就是所謂的“語義鴻溝”。為了更好的揭示低維視覺特征與高層語義概念間的聯(lián)系,本文提出一種基于拉普拉斯的學習方法,學習得到的語義子空間為基于內容的圖像檢索提供更強的判別表示。本文提出的方法在構建鄰接圖時,不僅考慮到表示描述信息的無類別的視覺相似性,而且包含了表示判別信息的語義相異性。充分利用這兩種信息學習得到語義子空間。通過引入一個懲罰參數(shù)7,本文提出建立一個差式約束優(yōu)化問題。那么最優(yōu)投影就可以通過矩陣的特征值分解求得。創(chuàng)建的鄰接圖用一個關系矩陣表示,這樣,計算復雜度和計算量都比比保局投
3、影和局部判別嵌入要小。另一方面,學習的得到語義子空間不僅具有保持局部幾何特性,而且全局相關信息也得到很好地保持。以前相關學習方法都存在奇異性問題,而且不能確定學習后子空間的維數(shù)。本文提出的方法解決了這兩個問題。本文側重研究子空間學習方法在基于內容的圖像檢索中的應用,提出一種新的子空間學習方法——“語義判別投影”,通過學習描述信息和判別信息得到新的語義子空間。本文用一個圖描述圖像間基于內容的視覺特征的相似性,用另一個圖表示圖像間的語義相異性。接著,求解一個帶懲罰參數(shù)的差式約束優(yōu)化問題。本文提出的語義子空間學習方法避免了奇異性問題,而且能學習得到一個最優(yōu)維。同樣地,本文提出的方法也可應用于再
4、生核希爾伯特空間,得到稱為“核廣東工業(yè)大學工學碩士學位論文語義判別投影"的學習方法。隨后,本文提出另外兩種擴展學習方法——二維語義判別投影和通過相關反饋增量學習的方法。實驗結果表明,本文提出的方法比當前其它學習方法具有更好的檢索性能。最后,總結全文并探討進一步研究工作。關鍵詞基于內容的圖像檢索;子空間學習;數(shù)據(jù)降維;語義判別投影;核方法;張量學習;相關反饋ⅡABSTRACTAbstractWiththedevelopmentofdigitalimagingtechnologyandthepopularityofWorldWideWeb,Gigabytesofimagesalegenera
5、tedeveryday.Itisachallengetoeffectivelymanageimagesvisualcontent.ContentBasedImageRetrieval(CBIR)hasreceivedmuchinterestforthispurpose.However,therealestillmanyopenissuestobesolved.Firstly,thevisualcontentsuchascolor,shape,texture,isextractedfromanimageasfeaturevectors.Thedimensionalityoffeatures
6、paceisusuallyveryhigh.Itrangesfromtenstohundredsofthousandsinmostcases.Traditionalmachinelearningap-proachesfailtolearninsuchahigh-dimensionalfeaturespace.Thisisthewell—knowncurseofdimensionality.Secondly,thelow-levelimagefeaturesusedinCBIRaleoftenvisualcharacter-ized,butitdoesn’texistthedirectly
7、connectionwithhigh-levelsemanticconcepts,i.e.SO-calledsemanticgap.Tobridgelow-levelvisualfeaturetothehigh-levelsemanticisagreatchallengeinCBIR.WeuseLaplaciantolearntheimagessemanticsubspaceinordertoachievemorediscrimin