資源描述:
《自動圖像標(biāo)注論文:基于機器學(xué)習(xí)算法及自動圖像標(biāo)注》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、自動圖像標(biāo)注論文:基于機器學(xué)習(xí)算法的自動圖像標(biāo)注【中文摘要】”語義清晰”是大規(guī)模數(shù)字圖像管理的重要前提,現(xiàn)有的基于底層特征的圖像內(nèi)容和高級人為理解的圖像語義之間存在巨大的鴻溝,因此通過計算機自動獲取圖像語義內(nèi)容的研究具有十分重要的意義。自動圖像標(biāo)注的實質(zhì)是通過對圖像的底層視覺特征的處理和分析來獲取高層語義關(guān)鍵詞,用這組語義關(guān)鍵詞表示圖像的含義?;诜诸惖淖詣訄D像標(biāo)注方法是當(dāng)前圖像標(biāo)注領(lǐng)域中使用最廣泛的方法之一。本文的研究目標(biāo)是結(jié)合當(dāng)前標(biāo)注模型的特點應(yīng)用機器學(xué)習(xí)算法對圖像進行標(biāo)注,與前期基于分類模型的自動圖像標(biāo)注經(jīng)典算法相比,本文采用的決策樹改進算法在分類精度和
2、時間上有所改善,并且該系統(tǒng)可以利用人能理解的規(guī)則模型來標(biāo)注圖像。為了獲取標(biāo)注規(guī)則,本文將采集到的圖像數(shù)據(jù)庫預(yù)定義一組需要的關(guān)鍵詞(或語義概念)。利用圖像分割技術(shù)將數(shù)據(jù)庫中的圖像分割成許多不同的區(qū)域,每個區(qū)域大致對應(yīng)于一個語義對象。然后對圖像分割后所得到的各個區(qū)域提取出底層視覺特征,包括顏色、紋理和形狀特征等。提取出區(qū)域的特征屬性后,手動將有意義的區(qū)域歸并為幾個類,這幾個類均為預(yù)定義的語義概念。特征屬性數(shù)據(jù)可以作為后續(xù)機器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)。然后該系統(tǒng)可以通過機器學(xué)習(xí)方法從這些特征數(shù)據(jù)中學(xué)習(xí)到語義概念,利用預(yù)定義關(guān)鍵詞來標(biāo)注各個區(qū)域,最后圖像就可以被這些關(guān)鍵詞標(biāo)注出
3、來。本文主要關(guān)注的機器學(xué)習(xí)算法為改進后的NewNBtree算法、SimpleC4.5算法和FastRandomForest算法,通過訓(xùn)練可以得到相應(yīng)的標(biāo)注模型,最終實現(xiàn)自動圖像標(biāo)注。在自動語義標(biāo)注階段,本文利用圖像信息熵的概念對噪聲區(qū)域進行剔除,更有效地提高了標(biāo)注系統(tǒng)的準(zhǔn)確度。本文通過標(biāo)準(zhǔn)Corel圖像庫和基于Corel圖像庫的不同10組訓(xùn)練集對采用的算法進行實驗分析,驗證了改進算法和標(biāo)注系統(tǒng)的有效性和魯棒性。實驗結(jié)果表明本文所采用的機器學(xué)習(xí)算法比傳統(tǒng)決策樹算法更能有效地分類圖像數(shù)據(jù),并能夠應(yīng)用到較大規(guī)模圖像集中實現(xiàn)圖像的自動標(biāo)注?!居⑽恼俊盨emanti
4、cClarity”isanimportantprerequisiteofalarge-scaledigitalimagemanagement,itexistsabiggapbetweentheunderlyingfeaturesoftheimageandadvancedsemanticsoftheimageunderstoodbyhuman.Therefore,automaticacquisitionofthesemanticcontentoftheimagethroughcomputerinformationtechnologyisveryimportant
5、theoreticalandpracticalsignificance.Thesubstanceofautomaticimageannotationistoobtainhigh-levelsemantickeywordsthroughprocessingandanalyzingtheunderlyingvisualinformationfeaturesofimage.Weusethissetoftopsemantickeywordstorepresenttheimagefeaturesinthesamewaywhichimagecanberetrievedas
6、currenttextsearch.Automaticimageannotationbasedonclassificationisoneofthemostwidelyusedmethodsinthecurrentimageannotationfields.Theresearchgoalistocombinethecharacteristicsofthecurrentannotationmodel,andusemachinelearningclassificationalgorithmtoannotatetheimage.Comparedwiththeprevi
7、ousclassificationbasedontheclassicmodelofautomaticimageannotationalgorithm,theproposeddecisiontreealgorithmclassificationhasahighimprovementinaccuracy,andthesystemcanuserulestomarktheimagethatcanbeunderstood.Inordertoobtainthelabelingrules,wemustfirstcarryoutthetrainingprocessofthew
8、holesystem.Aftereac