資源描述:
《圖像語義自動(dòng)標(biāo)注方法的研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、碩士論文圖像語義自動(dòng)標(biāo)注方法的研究摘要IIIMMUlnlUlIHIHIIIY2275984數(shù)碼相機(jī)、拍照手機(jī)等有成像功能的數(shù)碼產(chǎn)品的普及導(dǎo)致圖像的獲取越來越容易,同時(shí),計(jì)算機(jī)網(wǎng)絡(luò)的普及、微博的流行以及Flickr等圖像共享社區(qū)的成熟,使圖像數(shù)據(jù)的傳播越來越容易,這兩點(diǎn)最終導(dǎo)致了圖像數(shù)據(jù)的爆炸式增長(zhǎng),這就要求與之適應(yīng)的圖像數(shù)據(jù)的管理和理解能力。圖像語義自動(dòng)標(biāo)注技術(shù)就是圖像數(shù)據(jù)管理和理解的有效手段。本文在介紹了圖像語義自動(dòng)標(biāo)注的一些基礎(chǔ)知識(shí)和相關(guān)工作之后,主要圍繞圖像標(biāo)注如何縮減語義鴻溝、提升標(biāo)注效果和提高標(biāo)注效率開展研究。主要研究工作及創(chuàng)新如下:(1)深入研究了
2、圖像自動(dòng)標(biāo)注方法中的跨媒體相關(guān)模型(CrossMediaRelevanceModel’CMRM),在它的基礎(chǔ)上作了一定的改進(jìn):1)CMRM算法中,圖像僅使用一種基于圖像分割技術(shù)的blob表達(dá),為了避開在自動(dòng)標(biāo)注過程中使用圖像分割技術(shù),以及表達(dá)圖像不同方面的信息,我們使用了其他兩種圖像表達(dá)方式(基于圖像的柵格化劃分和圖像的顯著點(diǎn)檢測(cè))來共同表達(dá)圖像:2)考慮標(biāo)注詞與標(biāo)注詞之問的共現(xiàn)關(guān)系,稱這種共現(xiàn)關(guān)系為文本主題,使用標(biāo)注詞的多項(xiàng)式分布來描述文本主題,在圖像標(biāo)注過程中,聯(lián)合不同文本主題下標(biāo)注詞的概率來標(biāo)注測(cè)試圖像,通過實(shí)驗(yàn)證明了這種改進(jìn)提高了標(biāo)注準(zhǔn)確度。(2)提出
3、了一種融合支持向量機(jī)和多伯努利模型的分層圖像語義自動(dòng)標(biāo)注方法,該分層的圖像語義自動(dòng)標(biāo)注方法首先利用聚類算法對(duì)所有訓(xùn)練圖像進(jìn)行聚類,將視覺上相似的圖像聚為~類,每個(gè)聚類用SVM構(gòu)建一個(gè)分類器,然后對(duì)一幅待標(biāo)注圖像,用分類器給待標(biāo)注圖像加上類別標(biāo)簽,類別標(biāo)簽對(duì)應(yīng)的訓(xùn)練圖像集合作為待標(biāo)注圖像的相似圖像,作為MBRM模型的訓(xùn)練圖像,來給圖像作標(biāo)注。在研究該方法的過程中,為了使得后續(xù)的標(biāo)注結(jié)果更準(zhǔn)確,我們?cè)诰垲愡^程中,改進(jìn)了k均值聚類算法,考慮在聚類的每個(gè)類別中每維特征對(duì)該類別影響的不同,賦予不同的權(quán)值,最終提高聚類的準(zhǔn)確度。關(guān)鍵詞:圖像自動(dòng)標(biāo)注,跨媒體相關(guān)模型,支持向
4、量機(jī),多伯努利模型,k均值聚類AbstractWiththepopularityofdigitalcalileraandotherdigitalimagingpmdmts,maagesaIecre如dinacheaperandeasier強(qiáng)nr℃r.Withthepopularityofcomputernetwork,microblog.a(chǎn)ndsoImi11[1agesharingwebsites,suchasPicasaandFlickr,thesetechnologiesacceleratethespreadofimages.Itisurgenttoadv
5、ancetheresearchofimagesSOthatthecapabilityofimgesrmmgeroentandunderstandingcouldkeepconsistentwiththeexplodingofmlages·A刪幻maticimageannotationisthecoretechniqueforimagermmgementandunderstanding.Inthispaper,ourresearchisfocusedonnarrowingdownthesemantlcgap,maprovmgt地aIlmtalionper南r瓶∞
6、eandefficiency.Themainworksandinnovativepointsareasfollows:(1)CrossmediarelevancemodelinautomaticimageanrDtationlSstudied,andiI】鄧∞VemeI吐aremadetothermdel:1)Inthealgorithm,onlyimagesegmentationbasedblobrepresentationsusedtorepresenttheimage,avoidingimagesegmentationduringt№a1Jtonnt記a
7、nnotationprocessandrepresentinformationfromdifferentaspectsofthetrnage,tworepresentationmethods(imagemsterizationbasedpartitionandpointsofsl掣l吐lCamede白ectionlarecombinedtorepresenttheimage。2)Co-occulTcrlcerelationsbetweenlabelwords棚[econsidered,therelatioI塔arecalledthesubjectmatter.
8、Multinomialdistribu