資源描述:
《基于深度學習的人體動作識別》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。
1、.:c-襄靖扛/I卷弓,:,W^密.單位篇1^#爾;'J.:一.—u'‘./?,:‘.;'.,-?..''禱s;K'-.嚴V.n:乃M若i’,M;■:脅^:.■:;V,*為-f竟V-參’;二,,.■:?:.:度^t緣訟A;,'.r-1',.■1.-H:0u矣C;'H.V;1V讀-/:;靡;導.;f餐Y.^rX弘;乃麻秦品'‘荀詩-巧一7.;一V:.’'.pvfi體別^k題i針封禱’,...'-、心‘.乾W7..、"夢
2、V、、-.V%.?。牐妫崳姡В郑觯牐ァ⑵妫榍桑骸饺敚矗?;.勢lr.唉:心‘,W葛?學號單,茸.'.盧.f..‘也^^■名■姓■1'.;身、」7^宋教-.導師V7.話‘學科專業(yè)S息g:、>K..-'.硏究方向艦媒i'/v品■:申請^^工古.T■:坤論5^^一仁-'p皆讀?詩f—".':-.-..:..:■0m,如?。椋?,聲'1m.:l巧u.:魯;H、娶Humanactionrecognition
3、basedondeeplearningThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfortheDegreeofMasterofEngineeringByGengchiSupervisor:Prof.SongJianxinFebruary2016南京郵電大學學位論文原創(chuàng)性聲明本人聲明所呈交的學位論文是我個人在導師指導下進行的研究工作及取得的研究成果。盡我所知,除了文中特別加標注和致謝的地方外,論文中不包含其他人己經(jīng)發(fā)表或撰寫過京郵電大學或其它教育機構的學
4、位或證書而使用過的材料。的研究成果,也不包含為獲得南一與我同工作的同志對本研究所做的任何貢獻均己在論文中作了明確的說明并表示了謝意。本人學位論文及涉及相關資料若有不實,愿意承擔切相關的法律責任。研巧生簽名:每K乏々,日期;南京郵電大學學位論文使用授權聲明本人授權南京郵電大學可W保留并向國家有關部口或機構送交論文的復印件和電子文可W將學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索;檔;;允許論文被查閱和借閱可W采用影印、縮印或掃描等復制手段保存、匯編本學位論文。本文電子文檔的內(nèi)容和紙質(zhì)一)致。論文的內(nèi)容相。
5、論文的公布(包括刊登授權南京郵電大學研巧生院辦理涉密學位論文在解密后適用本授權書。3目日期;W如肖研究生簽名:觀姊y導師簽名摘要人體動作識別因為其廣泛的現(xiàn)實應用前景,成為圖像處理、計算機視覺、機器學習等領域的研究熱點,但仍然是一個具有挑戰(zhàn)性的課題。在人腦視覺機理的啟發(fā)下,深度學習的提出使得機器學習取得突破性的進展,也為人體動作識別的研究帶來了新的方向。深度學習基于一系列算法,通過分層非線性轉(zhuǎn)換無監(jiān)督地獲取數(shù)據(jù)的高層抽象。不同于傳統(tǒng)的識別方法手工提取特征,深度學習能夠自動地從低層次的特征中學習出高層次的特征,解決了特征選取過于依賴任務
6、本身和調(diào)整過程耗費時間等問題。本文重點研究在復雜場景下的人體動作識別及運動視頻中時空特征的提取問題,克服環(huán)境差異和時間變化給識別造成的困難。本文在研究深度學習典型模型卷積神經(jīng)網(wǎng)絡和深度置信網(wǎng)絡的基礎上,提出了具有創(chuàng)新性的人體動作識別模型。本文的具體研究工作如下:(1)研究了復雜場景下RGB圖像中人體的動作識別問題。卷積神經(jīng)網(wǎng)絡由于局部權值共享和池化的特殊結(jié)構,對于特定的姿態(tài)、光照、環(huán)境雜亂變化均具有不變性,在圖像處理方面具有天然的優(yōu)越性。因此,本文提出一個改進的卷積神經(jīng)網(wǎng)絡模型,提取2D圖像序列中的動作特征,并經(jīng)過softmax回歸進行分類。
7、其中,為了更有效的預訓練卷積核權值,本文還利用卷積自動編碼器替代傳統(tǒng)的后向傳播算法進行初始化工作。試驗表明該模型有效地解決了復雜場景下動作識別問題,較傳統(tǒng)方法具有更高的識別率。(2)針對運動視頻中的時空特征進行研究。為了使識別方法更具實用價值,本文提出了一個多分辨率的3D卷積神經(jīng)網(wǎng)絡模型。在保留高分辨率的原始輸入流的前提下,增加一個包含動作的低分辨率輸入流,形成一個新的雙流3D卷積神經(jīng)網(wǎng)絡框架。這樣既能夠利用3D卷積核提取連續(xù)視頻幀中的時空信息,又加快了網(wǎng)絡的運算速度。實驗證明,此方法無需任何先驗信息取得了和傳統(tǒng)算法相近的結(jié)果。(3)前兩個研
8、究點均為基于RGB圖像序列的特征提取方法,第三個研究點則提出了一個基于RGB-D視頻數(shù)據(jù)的識別模型。該模型通過傳感器Kinect獲取深度圖像序列,并進行一定處理獲取