資源描述:
《圖像論文:基于多特征集成圖像自動(dòng)標(biāo)注方法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、圖像論文:基于多特征集成的圖像自動(dòng)標(biāo)注方法研究【中文摘要】隨著數(shù)碼設(shè)備和計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展及廣泛應(yīng)用,數(shù)字圖像在計(jì)算機(jī)中的存儲(chǔ)量呈爆炸式的增長。為了實(shí)現(xiàn)計(jì)算機(jī)對(duì)海量圖像的自動(dòng)管理,圖像檢索特別是圖像自動(dòng)標(biāo)注成為近年來研究的重點(diǎn)和熱點(diǎn)。針對(duì)圖像的多標(biāo)注問題和“語義鴻溝”問題,本文研究使用多特征集成的圖像自動(dòng)標(biāo)注方法,以進(jìn)一步提高圖像自動(dòng)標(biāo)注的性能。本文的主要研究內(nèi)容和創(chuàng)新點(diǎn)如下:(1)為解決傳統(tǒng)圖像標(biāo)注中標(biāo)注詞與圖像區(qū)域之間缺乏對(duì)應(yīng)關(guān)系的問題,本文在對(duì)未標(biāo)注圖像進(jìn)行標(biāo)注之前,引入分割算法將圖像劃分成若干個(gè)圖像區(qū)域,并對(duì)每個(gè)圖像區(qū)域分別進(jìn)行圖像自動(dòng)標(biāo)注的策略
2、,使圖像區(qū)域與標(biāo)注詞之間建立起一一對(duì)應(yīng)的關(guān)系。(2)鑒于目前圖像自動(dòng)標(biāo)注中只有少量已標(biāo)注樣本的實(shí)際情況,本文采用半監(jiān)督學(xué)習(xí)方法思想來建立標(biāo)注模型。該方法同時(shí)將已標(biāo)注樣本和未標(biāo)注樣本用于機(jī)器學(xué)習(xí)中,并利用圖像底層視覺特征空間的分布信息,來度量未標(biāo)注圖像到各標(biāo)注詞之間的視覺特征距離,從而為未標(biāo)注圖像選擇標(biāo)注關(guān)鍵詞。(3)針對(duì)圖像自動(dòng)標(biāo)注系統(tǒng)多采用單個(gè)分類器,從而導(dǎo)致標(biāo)注準(zhǔn)確率較低問題,本文研究并提出基于多特征集成的圖像自動(dòng)標(biāo)注算法EMDAIA。該算法將圖像自動(dòng)標(biāo)注問題看作是圖像的多分類問題,構(gòu)造并集合多個(gè)分類器的分類結(jié)果,選擇出現(xiàn)概率最大的預(yù)測詞來對(duì)圖像進(jìn)
3、行標(biāo)注。EMDAIA使用LabelMe圖像數(shù)據(jù)庫進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,EMDAIA比僅使用單一特征進(jìn)行圖像自動(dòng)標(biāo)注的準(zhǔn)確率提高了約10%。(4)研究并提出一種基于感興趣區(qū)域的圖像自動(dòng)標(biāo)注方法ROIAIA,該方法在對(duì)未標(biāo)注圖像進(jìn)行標(biāo)注前,先采用Itti模型提取圖像的感興趣區(qū)域,然后對(duì)提取的感興趣區(qū)域進(jìn)行標(biāo)注。實(shí)驗(yàn)表明,基于感興趣區(qū)域的圖像自動(dòng)標(biāo)注能有效地減少圖像次要區(qū)域?qū)χ饕獏^(qū)域的影響,將圖像自動(dòng)標(biāo)注的注意力集中到用戶感興趣的圖像區(qū)域。(5)研究了特征子集的選擇對(duì)圖像自動(dòng)標(biāo)注性能的影響,對(duì)提取的10種視覺特征選擇后組合成10個(gè)不同的特征子集,在PASC
4、ALVOC2008圖像數(shù)據(jù)庫上進(jìn)行實(shí)驗(yàn),結(jié)果表明:使用多特征集成可以提高分類器的分類性能,8種視覺特征構(gòu)造特征子集時(shí)圖像標(biāo)注的平均準(zhǔn)確率最高,繼續(xù)增加特征的種類反而會(huì)降低標(biāo)注結(jié)果的準(zhǔn)確率?!居⑽恼縒iththedevelopmentofdigitalequipmentandcomputernetwork,thenumberofdigitalimagesisgrowingdramatically.Inordertomanagethelargevolumesofdigitalimagesautomatically,variousimageretriev
5、altechniques,especiallyimageautomaticallyannotationalgorithms,drawalotofattentionsinrecentyears.Aimingathandlingtheproblemofmultipleannotationsand“semanticgap”ofimages,thispaperinvestigateshowtoutilizemultiplevisualdescriptorstoimprovetheperformanceofautomaticallyimageannotation
6、.Themajorcontentsandcontributionsofthispaperare:(1)Inordertocopewiththeproblemoflackinglinkagesbetweenimagesregionsandlabelkeywords,thispaperemploysaNormalizedCutsalgorithmtosegmenteachimageintoimageregionsbeforeannotation,andthenusesanimageannotationstrategyoneachimageregionres
7、pectively,soastocreateone-VS-onelinkagesbetweenimageregionsandlabelkeywords.(2)Ascurrentlyonlylimitedlabeledsamplesareavailablewhilealargeamountofunlabeledsamplesexistinagivenimageannotationsystem,thispaperadoptstheideaofsemi-supervisedlearningtoconstructlearningmodels.Themodelu
8、tilizesbothlabeledandunlabeledsamplesfortrainin