資源描述:
《基于字典學(xué)習(xí)的圖像自動標(biāo)注方法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、學(xué)校代碼10530學(xué)號201510171827分類號TP391密級公開碩士學(xué)位論文基于字典學(xué)習(xí)的圖像自動標(biāo)注方法的研究學(xué)位申請人楊曉玲指導(dǎo)教師李志清副教授學(xué)院名稱信息工程學(xué)院學(xué)科專業(yè)計算機科學(xué)與技術(shù)研究方向知識處理與智能系統(tǒng)二○一八年五月四日ResearchonAutomaticImageAnnotationMethodBasedonDictionaryLearningCandidateXiaolingYangSupervisorAssociateProf.ZhiqingLiCollegeTheColl
2、egeofInformationEngineeringProgramComputerScienceandTechnologySpecializationKnowledgeProcessingandIntelligentSystemsDegreeMasterofEngineeringUniversityXiangtanUniversityDateMay4,2018摘要隨著計算機技術(shù)與移動互聯(lián)網(wǎng)的快速發(fā)展,大量的圖像信息每天以不同的方式產(chǎn)生并以數(shù)字的形式被上傳到互聯(lián)網(wǎng)上,這使得圖像成為目前互聯(lián)網(wǎng)時代中人們傳
3、遞信息的重要手段。面對日益繁多的圖像資源,如何方便快捷地組織和精準(zhǔn)地檢索目標(biāo)圖像顯得迫在眉睫。圖像自動標(biāo)注是當(dāng)前圖像處理領(lǐng)域中的研究熱點,其目的是為圖像分配若干能描述其圖像視覺內(nèi)容的標(biāo)簽(關(guān)鍵詞),它是當(dāng)前以文本為基礎(chǔ)的圖像檢索過程中一個關(guān)鍵性的步驟。圖像自動標(biāo)注在十多年的發(fā)展歷程中,取得了豐碩的研究成果,不但其精度在持續(xù)提高,而且標(biāo)注模型也在不斷完善。但是由于低層視覺特征與高層語義之間存在語義鴻溝的制約,使得圖像自動標(biāo)注的標(biāo)注性能和標(biāo)注效率仍然有待提升。本文在學(xué)習(xí)探索現(xiàn)有標(biāo)注方法的基礎(chǔ)上,以提高圖像自
4、動標(biāo)注性能和標(biāo)注效率為出發(fā)點,結(jié)合機器學(xué)習(xí)中的稀疏編碼技術(shù)和字典學(xué)習(xí)方法的高效性,提出基于Fisher字典學(xué)習(xí)的圖像自動標(biāo)注方法和基于判別字典學(xué)習(xí)的圖像自動標(biāo)注方法。具體工作內(nèi)容如下:(1)首先簡單介紹了圖像自動標(biāo)注的研究近況、當(dāng)前研究中存在的難點與不足。然后介紹了與圖像自動標(biāo)注研究過程相關(guān)的基本理論知識。(2)針對數(shù)據(jù)集中標(biāo)簽分布的不平衡性、圖像不同類型特征的有效組合后的維度問題,提出了一種結(jié)合核空間映射的Fisher判別字典學(xué)習(xí)圖像自動標(biāo)注方法。本方法在高斯核函數(shù)的作用下將最初的輸入數(shù)據(jù)映射到一個高
5、維的核空間進(jìn)行判別字典學(xué)習(xí)。實驗結(jié)果表明,基于核空間Fisher判別字典學(xué)習(xí)的圖像自動標(biāo)注方法在改善圖像標(biāo)注性能方面具有一定的有效性和可行性。(3)為了降低語義鴻溝對圖像自動標(biāo)注的影響,提高標(biāo)注效率,本文結(jié)合標(biāo)簽一致性判別字典的高效性提出一種多標(biāo)簽判別字典學(xué)習(xí)圖像自動標(biāo)注方法。該方法首先在字典學(xué)習(xí)的輸入特征空間中,為每幅圖像提取多種類型的特征,然后引入一個訓(xùn)練集標(biāo)簽相關(guān)正則化項,將樣本之間的標(biāo)簽相關(guān)性作為字典學(xué)習(xí)的部分輸入特征數(shù)據(jù),最后以得到的判別字典和系數(shù)矩陣為基礎(chǔ)設(shè)計相應(yīng)的標(biāo)簽預(yù)測算法來實現(xiàn)未知圖像
6、的語義標(biāo)注。最終實驗數(shù)據(jù)表明,使用這種方法可以較好地效提升標(biāo)注準(zhǔn)確度和標(biāo)注性能。關(guān)鍵詞:自動圖像標(biāo)注;圖像檢索;稀疏編碼;字典學(xué)習(xí)IAbstractWiththerapiddevelopmentofcomputertechnologyandmobileInternet,alargeamountofimageinformationisgeneratedindifferentwayseverydayanduploadedtotheInternetintheformofnumberseveryday.This
7、makesimagesbecomeanimportantmeansforpeopletotransmitinformationinthecurrentInternetage.Facedwithanever-increasingnumberofimageresources,itisextremelyurgentabouthowtoquicklyandeasilyorganizeandaccuratelyretrieveatargetimage.Automaticimageannotationisarese
8、archhotspotinthecurrentimageprocessingfield.Itspurposeistoassignanumberoftags(keywords)totheimagethatcandescribethevisualcontentoftheimage.Itisakeystepinthecurrenttext-basedimageretrievalprocess.Duringthepasttenyears,Autom