資源描述:
《基于主動學(xué)習(xí)圖像分類的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、代號10701學(xué)號1032121616分類號TP391密級公開題(中、英文)目基于主動學(xué)習(xí)的圖像分類研究ImageClassificationBasedonActiveLearning作者姓名李向林指導(dǎo)教師姓名、職務(wù)過潤秋教授學(xué)科門類工學(xué)學(xué)科、專業(yè)控制理論與控制工程提交論文日期二○一三年一月摘要隨著多媒體信息技術(shù)的發(fā)展,數(shù)字圖像的數(shù)量呈爆炸式的增長,對海量圖像進行自動管理的需要促使基于內(nèi)容的圖像分類成為研究的熱點。建立準確的圖像分類模型往往需要大量的帶標簽樣本,而這在實際應(yīng)用中很難獲取。主動學(xué)習(xí)的意圖正是當某些無標簽樣本被選擇加注標簽后可以減少解決問題所需標記樣本數(shù)量從而顯
2、著降低人工標記成本。本文首先對圖像特征提取與分類算法進行了系統(tǒng)的分析與總結(jié),然后對基于主動學(xué)習(xí)的圖像分類技術(shù)進行了研究,主要內(nèi)容包括:1)總結(jié)了圖像分類常用的特征,包括低層特征、中層特征和高層語義特征。詳細介紹了尺度不變特征變換,重點分析了以BagofWords特征和稀疏編碼特征為代表的中層特征的實現(xiàn)過程。2)系統(tǒng)總結(jié)了常用的圖像分類算法,包括貝葉斯決策理論、支持向量機、Logistic回歸和隨機森林等,并結(jié)合中層特征表達進行了圖像分類實驗。結(jié)合工程實際,編寫了圖像分類演示軟件,實現(xiàn)了圖像分類的基本流程。3)對主動學(xué)習(xí)理論中代表性的算法進行了詳細的總結(jié)與分析,包括理論基礎(chǔ)和
3、各自的適用范圍。4)為了提升主動學(xué)習(xí)過程分類器更新的效率,引入增量支持向量機。針對主動學(xué)習(xí)批量樣本選擇中樣本間存在冗余信息的問題,提出了基于近鄰傳播(affinitypropagation)聚類的Multi-pool主動學(xué)習(xí)算法,三個公開圖像數(shù)據(jù)集上的實驗結(jié)果證明了本文方法相對于傳統(tǒng)算法的有效性。關(guān)鍵詞:圖像分類中層特征主動學(xué)習(xí)增量支持向量機AbstractWiththedevelopmentofmultimediainformationtechnology,thenumberofdigitalimageshasbeengrowingexplosively;automati
4、ccontent-basedimageclassificationhasbecomeahotresearchareawhichmainlyincludestwoaspectsasfeatureextractionandtrainingofclassifier.Obtainingtheaccurateclassificationmodeloftenrequiresalotoflabeledsampleswhicharecostlytogetwhilethepromiseofactivelearningisjustthis:whensomeunlabeledexamplesto
5、belabeledareselectedproperly,thenumberoflabeledsamplesforsomeproblemsdecreasesdrasticallysothecostofmanuallylabelingcanbereduced.Thisthesisfirstsummarizesthetechniquesaboutimagefeatureextractionandclassificationalgorithm,andthenstudiesthecombinationofactivelearningwithimageclassification.T
6、hemainworkofthisthesisisasfollows:1)Thefirstpartsummarizesthecommonlyusedfeaturesinimageclassificationtasks,includinglow-levelfeatures,mid-levelfeaturesandhigh-levelsemanticfeaturesandgivingtheorydetailsoflocaldescriptorsScaleInvariantFeatureTransform.Thispartmainsfocusonanalysisofextracti
7、onprocessoftherepresentativesofthemid-levelfeatures:BagofWordsandsparsecoding.2)Thesecondpartsummarizesthecommonimageclassificationalgorithms,includingBayesiandecisiontheory,supportvectormachines,Logisticregressionandrandomforests,etc.Thispartpresentssomeimage