資源描述:
《基于lda主題模型的圖像場景分類》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、代號10701學(xué)號1075190301分類號TP391密級公開UDC編號題(中、英文)目基于LDA主題模型的圖像場景分類ImageSceneClassificationbasedontheLDATopicModel作者姓名王敏學(xué)校指導(dǎo)教師姓名職稱王爽教授工程領(lǐng)域電子與通信工程企業(yè)指導(dǎo)教師姓名職稱強(qiáng)勇高工2013-2-27論文類型應(yīng)用研究提交論文日期西安電子科技大學(xué)學(xué)位論文創(chuàng)新性聲明秉承學(xué)校嚴(yán)謹(jǐn)?shù)膶W(xué)風(fēng)和優(yōu)良的科學(xué)道德,本人聲明所呈交的論文是我個人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文
2、中特別加以標(biāo)注和致謝中所羅列的內(nèi)容以外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果;也不包含為獲得西安電子科技大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中做了明確的說明并表示了謝意。申請學(xué)位論文與資料若有不實之處,本人承擔(dān)一切的法律責(zé)任。本人簽名:日期西安電子科技大學(xué)關(guān)于論文使用授權(quán)的說明本人完全了解西安電子科技大學(xué)有關(guān)保留和使用學(xué)位論文的規(guī)定,即:研究生在校攻讀學(xué)位期間論文工作的知識產(chǎn)權(quán)單位屬西安電子科技大學(xué)。學(xué)校有權(quán)保留送交論文的復(fù)印件,允許查
3、閱和借閱論文;學(xué)??梢怨颊撐牡娜炕虿糠謨?nèi)容,可以允許采用影印、縮印或其它復(fù)制手段保存論文。同時本人保證,畢業(yè)后結(jié)合學(xué)位論文研究課題再攥寫的文章一律署名單位為西安電子科技大學(xué)。(保密的論文在解密后遵守此規(guī)定)本學(xué)位論文屬于保密,在年解密后適用本授權(quán)書。本人簽名:日期
導(dǎo)師簽名:日期摘要I摘要隨著計算機(jī)通信技術(shù)和多媒體技術(shù)的迅猛發(fā)展,信息越來越多地以數(shù)字圖像的形式存儲與傳遞。圖像場景分類有助于圖像內(nèi)容的理解與分析,方便數(shù)據(jù)庫的組織與檢索。傳統(tǒng)技術(shù)主要通過提取圖像的全局或區(qū)域的底層特征,并結(jié)合有監(jiān)督的機(jī)器
4、學(xué)習(xí)方法來對圖像場景進(jìn)行分類。這樣計算相對簡單,但沒有利用圖像中的語義信息,對有高級語義的場景分類效果相對較差。主題生成模型能通過學(xué)習(xí)建模與概率推導(dǎo)發(fā)現(xiàn)圖像中隱含的中間語義分布情況,近年來受到了大量的關(guān)注。隱狄利克雷分配(LatentDirichletAllocation,LDA)模型就是主題模型中的代表,其利用多層次貝葉斯網(wǎng)絡(luò)以多個主題的概率混合表示圖像。本文將LDA模型用于圖像場景分類上,重點研究中間語義特征的提取與選擇,具體內(nèi)容如下:1)分別從提取描述特征和構(gòu)造分類器兩大方面,簡要分析了圖像場景分
5、類的研究現(xiàn)狀;著重介紹了LDA模型的構(gòu)成和參數(shù)推導(dǎo)方法。2)搭建了基于LDA模型的場景分類的基本框架;針對其中的中間語義基礎(chǔ)視覺詞典,結(jié)合已有的SIFT(ScaleInvariantFeatureTransform)、LBP(LocalBinaryPattern)幾種局部特征描述及空間金字塔組合,研究分析了不同特征對于使用LDA模型進(jìn)行場景分類時的效果,實驗結(jié)果表明LDA模型相比于直接使用詞袋特征或pLSA(ProbabilisticLatentSemanticAnalysis)模型更有利于進(jìn)行場景分類
6、,對不同大小和類型的數(shù)據(jù)要選擇合適的詞典、主題數(shù)大小和特征描述。3)在對多種局部特征描述研究的基礎(chǔ)上,實現(xiàn)了基于分層的場景分類框架,針對13類場景圖像,構(gòu)造了多層LDA分類框架,在不同的層次采用不同特征進(jìn)行描述,實驗結(jié)果表明這種分層分類框架可以更加靈活地選用對場景數(shù)據(jù)適合的特征,能夠獲得更好的分類效果。在此基礎(chǔ)上,對LDA模型中的詞典構(gòu)造進(jìn)行了簡單分析,發(fā)現(xiàn)只要詞典具有一定的完備性,具體構(gòu)造詞典的樣本與方法對場景分類結(jié)果的影響很小,使用隨機(jī)詞典能使時間大大減少。關(guān)鍵詞:場景分類LDA模型詞袋主題分層Ab
7、stractIIIAbstractWiththerapiddevelopmentofthetechnologyforcompunicationandmultimedia,therearemoreandmoreinformationstoredandtransmittedintheformofdigitalimages.Imagesceneclassificationishelpfulfortheunderstandingandanalysisofimages,andcansimplifytheorgan
8、izationandretrievalofimagedatabase.Traditionalwaystoclassifythescenesofimagesistousethesupervisedmachinelearningalgorithmswiththeglobalorregionalunderlying-featuresextractedfromtheimages.Thesemethodsarecomputationallysimpl