資源描述:
《自動(dòng)圖像標(biāo)注論文:基于機(jī)器學(xué)習(xí)算法及自動(dòng)圖像標(biāo)注》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、自動(dòng)圖像標(biāo)注論文:基于機(jī)器學(xué)習(xí)算法的自動(dòng)圖像標(biāo)注【中文摘要】”語(yǔ)義清晰”是大規(guī)模數(shù)字圖像管理的重要前提,現(xiàn)有的基于底層特征的圖像內(nèi)容和高級(jí)人為理解的圖像語(yǔ)義之間存在巨大的鴻溝,因此通過(guò)計(jì)算機(jī)自動(dòng)獲取圖像語(yǔ)義內(nèi)容的研究具有十分重要的意義。自動(dòng)圖像標(biāo)注的實(shí)質(zhì)是通過(guò)對(duì)圖像的底層視覺(jué)特征的處理和分析來(lái)獲取高層語(yǔ)義關(guān)鍵詞,用這組語(yǔ)義關(guān)鍵詞表示圖像的含義。基于分類的自動(dòng)圖像標(biāo)注方法是當(dāng)前圖像標(biāo)注領(lǐng)域中使用最廣泛的方法之一。本文的研究目標(biāo)是結(jié)合當(dāng)前標(biāo)注模型的特點(diǎn)應(yīng)用機(jī)器學(xué)習(xí)算法對(duì)圖像進(jìn)行標(biāo)注,與前期基于分類模型的自動(dòng)圖像標(biāo)注經(jīng)典算法
2、相比,本文采用的決策樹(shù)改進(jìn)算法在分類精度和時(shí)間上有所改善,并且該系統(tǒng)可以利用人能理解的規(guī)則模型來(lái)標(biāo)注圖像。為了獲取標(biāo)注規(guī)則,本文將采集到的圖像數(shù)據(jù)庫(kù)預(yù)定義一組需要的關(guān)鍵詞(或語(yǔ)義概念)。利用圖像分割技術(shù)將數(shù)據(jù)庫(kù)中的圖像分割成許多不同的區(qū)域,每個(gè)區(qū)域大致對(duì)應(yīng)于一個(gè)語(yǔ)義對(duì)象。然后對(duì)圖像分割后所得到的各個(gè)區(qū)域提取出底層視覺(jué)特征,包括顏色、紋理和形狀特征等。提取出區(qū)域的特征屬性后,手動(dòng)將有意義的區(qū)域歸并為幾個(gè)類,這幾個(gè)類均為預(yù)定義的語(yǔ)義概念。特征屬性數(shù)據(jù)可以作為后續(xù)機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù)。然后該系統(tǒng)可以通過(guò)機(jī)器學(xué)習(xí)方法從這些特征數(shù)
3、據(jù)中學(xué)習(xí)到語(yǔ)義概念,利用預(yù)定義關(guān)鍵詞來(lái)標(biāo)注各個(gè)區(qū)域,最后圖像就可以被這些關(guān)鍵詞標(biāo)注出來(lái)。本文主要關(guān)注的機(jī)器學(xué)習(xí)算法為改進(jìn)后的NewNBtree算法、SimpleC4.5算法和FastRandomForest算法,通過(guò)訓(xùn)練可以得到相應(yīng)的標(biāo)注模型,最終實(shí)現(xiàn)自動(dòng)圖像標(biāo)注。在自動(dòng)語(yǔ)義標(biāo)注階段,本文利用圖像信息熵的概念對(duì)噪聲區(qū)域進(jìn)行剔除,更有效地提高了標(biāo)注系統(tǒng)的準(zhǔn)確度。本文通過(guò)標(biāo)準(zhǔn)Corel圖像庫(kù)和基于Corel圖像庫(kù)的不同10組訓(xùn)練集對(duì)采用的算法進(jìn)行實(shí)驗(yàn)分析,驗(yàn)證了改進(jìn)算法和標(biāo)注系統(tǒng)的有效性和魯棒性。實(shí)驗(yàn)結(jié)果表明本文所采用的機(jī)
4、器學(xué)習(xí)算法比傳統(tǒng)決策樹(shù)算法更能有效地分類圖像數(shù)據(jù),并能夠應(yīng)用到較大規(guī)模圖像集中實(shí)現(xiàn)圖像的自動(dòng)標(biāo)注?!居⑽恼俊盨emanticClarity”isanimportantprerequisiteofalarge-scaledigitalimagemanagement,itexistsabiggapbetweentheunderlyingfeaturesoftheimageandadvancedsemanticsoftheimageunderstoodbyhuman.Therefore,automaticacquisit
5、ionofthesemanticcontentoftheimagethroughcomputerinformationtechnologyisveryimportanttheoreticalandpracticalsignificance.Thesubstanceofautomaticimageannotationistoobtainhigh-levelsemantickeywordsthroughprocessingandanalyzingtheunderlyingvisualinformationfeatureso
6、fimage.Weusethissetoftopsemantickeywordstorepresenttheimagefeaturesinthesamewaywhichimagecanberetrievedascurrenttextsearch.Automaticimageannotationbasedonclassificationisoneofthemostwidelyusedmethodsinthecurrentimageannotationfields.Theresearchgoalistocombinethe
7、characteristicsofthecurrentannotationmodel,andusemachinelearningclassificationalgorithmtoannotatetheimage.Comparedwiththepreviousclassificationbasedontheclassicmodelofautomaticimageannotationalgorithm,theproposeddecisiontreealgorithmclassificationhasahighimprove
8、mentinaccuracy,andthesystemcanuserulestomarktheimagethatcanbeunderstood.Inordertoobtainthelabelingrules,wemustfirstcarryoutthetrainingprocessofthewholesystem.Aftereac