資源描述:
《在圖像檢索中的應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、LLE在圖像檢索中的應(yīng)用盧進(jìn)軍,楊杰,梁棟,常宇疇(上海交通大學(xué)圖像處理與模式識(shí)別研究所,上海200030)摘要:在基于內(nèi)容的圖像檢索中,當(dāng)特征向量的維數(shù)非常高時(shí),建立圖像特征庫(kù)時(shí)的存儲(chǔ)高維特征的空間復(fù)雜度和度量圖像之間相似性的運(yùn)算復(fù)雜度都將非常的高。本文將LLE用于圖像檢索中高維特征的降維和特征提取,降低了空間和運(yùn)算復(fù)雜度;同時(shí),實(shí)驗(yàn)結(jié)果表明采用LLE降維和提取特征之后,能獲得較好的檢索結(jié)果。關(guān)鍵詞:圖像檢索、LLE、高維特征、降維ApplicationofLLEinImageRetrievalAbstract:InCo
2、ntent-BasedImageRetrieval,whenthedimensionofeigenvectorisveryhigh,thespatialcomplexityofhigheigenvector’sstorageandtheoperationcomplexityofcomputingtheirsimilaritywillbemuchhigher.Inthispaper,LLEisappliedtothedimensionreductionandextractingeigenvector,thenitwillre
3、ducebothspatialandoperationcomplexity.Theexperimentsprovethatitcangetbetterresults.KeyWordImageRetrieval,LLE,high-dimensionedeigenvector,dimensionreduction1.引言隨著多媒體、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,圖像信息的應(yīng)用日益廣泛,對(duì)規(guī)模越來(lái)越大的圖像數(shù)據(jù)庫(kù)、可視信息進(jìn)行有效的管理成為迫切需要解決的問題。靈活、高效、準(zhǔn)確的圖像檢索策略是解決這一問題的關(guān)鍵技術(shù)之一。傳統(tǒng)的圖像檢索基于文
4、本方式,使用關(guān)鍵字或自由文本描述圖像數(shù)據(jù)庫(kù)中的每幅圖像,采用文本匹配檢索。但目前計(jì)算機(jī)視覺技術(shù)還不成熟,達(dá)不到對(duì)圖像的描述性關(guān)鍵字和語(yǔ)義信息的自動(dòng)提取,而人工提取一方面費(fèi)時(shí),另一方面帶有強(qiáng)烈的主觀性;同時(shí),圖像的某些可視信息,例如紋理、形狀、空間關(guān)系等,很難用文本準(zhǔn)確描述。因此,新興的基于內(nèi)容的圖像檢索(content-basedimageretrieval,CBIR)技術(shù)日益受到人們的重視。CBIR是一種信息檢索技術(shù),它關(guān)注的是以基于內(nèi)容的方法快速發(fā)現(xiàn)信息。一般地,圖像內(nèi)容可由一組低層特征來(lái)描述,其中包括顏色、形狀、紋理
5、、空間位置以及對(duì)象間的相互關(guān)系等。CBIR是一種相似匹配,它使用距離度量函數(shù)來(lái)計(jì)算兩個(gè)圖像間的相似度,評(píng)價(jià)的標(biāo)準(zhǔn)是預(yù)先定義的。相似查詢是多媒體信息系統(tǒng)基于內(nèi)容檢索的本質(zhì)需求,能否有效地支持支持這一特性是衡量系統(tǒng)查詢功能強(qiáng)弱的重要標(biāo)志。多維索引結(jié)構(gòu)是CBIR研究的一個(gè)基本問題。一般地,圖像特征的表示均是高維向量,并且圖像的距離度量也有很多準(zhǔn)則。因此,一個(gè)圖像可使用尺度空間中的一個(gè)點(diǎn)來(lái)表示,而圖像檢索可視為在高維特征空間中尋找與指定點(diǎn)距離最近的一組點(diǎn)的問題。然而,對(duì)大型的圖像數(shù)據(jù)庫(kù),高維向量的存儲(chǔ),以及高維空間中距離的計(jì)算,其
6、空間復(fù)雜度和運(yùn)算復(fù)雜度非常高。如果能將高維尺度空間的點(diǎn)集映射到低維尺度空間,并且保持?jǐn)?shù)據(jù)原來(lái)的分布結(jié)構(gòu),即對(duì)于在高維尺度空間里點(diǎn)X的K近鄰點(diǎn)集Y,在低維尺度空間里的映射X’的K近鄰點(diǎn)集是Y到低維尺度空間的映射Y’。這樣,無(wú)論是從存儲(chǔ)復(fù)雜度,還是運(yùn)算復(fù)雜度上來(lái)講,都會(huì)得到很大的降低。目前降維的算法有很多,比如PCA,ICA,ISOMAP,還有比較新的[1][2][3]LLE。[4]比較常用的降維算法比如PCA,是針對(duì)線性分布的高維數(shù)據(jù)進(jìn)行降維的算法,并且有局部最優(yōu)的問題。而LLE(LocalLinearEmbedding)算
7、法則針對(duì)于非線性數(shù)據(jù),圖1是一個(gè)很好的例子。在這個(gè)例子里,用LLE進(jìn)行降維成功的體現(xiàn)了數(shù)據(jù)內(nèi)在的局部分布結(jié)構(gòu),而用PCA映射則會(huì)將高維空間里的遠(yuǎn)點(diǎn)映射到低維空間后變成了近鄰點(diǎn)。和PCA和MDS一樣,LLE算法也可以很容易實(shí)現(xiàn),并且它不存在局部最優(yōu)的問題,可以解決高度非線性分布數(shù)據(jù)的降維。(a)(b)(c)(d)圖1.(b)是從一個(gè)曲面(a)上采樣得到的一組3維數(shù)據(jù);(c)是經(jīng)LLE降維后的二維數(shù)據(jù)分布;(d)是經(jīng)PCA降維后的數(shù)據(jù)分布本文將討論LLE在圖像檢索高維特征降維以及特征中的應(yīng)用。2.LLE算法介紹d給定N個(gè)輸入向
8、量{x,x,L,x},x∈R,通過LLE算法,得到輸出向量y,12Niimi∈[1,N],y∈R,m<