資源描述:
《基于異構(gòu)平臺(tái)的視頻圖像識(shí)別算法研究與實(shí)現(xiàn)》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、■...Sou化ChinaUniversitofTechnoloygy碩±學(xué)位論文基于異構(gòu)平臺(tái)的視頻圖像識(shí)別算法^硏究與實(shí)現(xiàn)作者姓名胡惠賢學(xué)科專(zhuān)業(yè)計(jì)算機(jī)科學(xué)與巧術(shù)指導(dǎo)教師陸髓教授所在學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院論文提交日期2016年05月??.--.■?TheResearchandImplementofVideoImageRecognitionBasedonHeterogeneousComputingPlatformADis
2、sertationSubmittedfortheDegreeofMasterCandidate:HuHuixianSupervisor:Prof.LuLuSouthChinaUniversityofTechnologyGuangzhou,China10561分類(lèi)號(hào):;TP311學(xué)校代號(hào)學(xué)號(hào):201420112643華南理工大學(xué)碩±學(xué)位論文基于異構(gòu)平臺(tái)的視頻圖像識(shí)別算法研究與實(shí)現(xiàn)、職:作者處名;胡惠巧指導(dǎo)教師姓名稱(chēng)陸城教授i計(jì)申請(qǐng)學(xué)恆級(jí)別:工學(xué)碩±學(xué)科專(zhuān)業(yè)名稱(chēng)算機(jī)科學(xué)與
3、技術(shù)研究方向:異構(gòu)計(jì)算論文捉交曰胡年巧日巧丈普辯曰期:月A曰5斗方I護(hù)6學(xué)泣巧予單位:年月曰:華南理工大學(xué)巧位授予日拙醫(yī)辯委員會(huì)成員:主席;礎(chǔ)劫化如說(shuō)負(fù)卷壺巧:悼礎(chǔ)^辟都作華南理工大學(xué)學(xué)位論文原創(chuàng)性聲明本人那重聲明:所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所取得的研究成果。驗(yàn)了文中特別加料標(biāo)注引用的內(nèi)容外,本論文不包含任何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫(xiě)的成果作品。對(duì)本文的研究做出重要貢已在文中明確方式標(biāo)明。本人完全意識(shí)到本聲明的獻(xiàn)的個(gè)人
4、和集體,均法律后果由本人承擔(dān)。|作者盛名:堿奢貨曰期;從4年《月曰學(xué)位論文版權(quán)使用授權(quán)書(shū)留,即:本學(xué)位論文作者完全了解學(xué)校有關(guān)保、使用學(xué)位論文的規(guī)定研究生在校攻讀學(xué)位期間論文工作的知識(shí)產(chǎn)權(quán)單位屬華南理工大學(xué)。學(xué)校有權(quán)保存并向國(guó)家有關(guān)部口或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許學(xué)位論文被査閱(除在保密期內(nèi)的保密論文外);學(xué)校可臥公布學(xué)化論文的全部用影印、匯編學(xué)位論、縮印或其它復(fù)制手段保存或部分內(nèi)容,可允許采一文。本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相致。本□學(xué)位論文婦
5、于:于保密(校保密賽員會(huì)審定為涉密。學(xué)位論文時(shí)間:_年^月_曰),__材年_月_日解密后適用本授權(quán)書(shū)木保密,同意在校園網(wǎng)上發(fā)布,供校內(nèi)師生和與學(xué)校有共享協(xié)議的志社全文單位瀏覽;同意將本人學(xué)位論文提交中國(guó)學(xué)播術(shù)期刊(光盤(pán)版)電子雜出版和編入CNKI《中圖知識(shí)資"源總庫(kù))),傳學(xué)位論文的全部或部分內(nèi)容。V"(譜在W上相應(yīng)方框內(nèi)打)作者簽名;棘容嚷、日期;如1自各‘7/指導(dǎo)教師簽名:曰期:awM-?巧??。荩壵陙?lái),深度神經(jīng)網(wǎng)絡(luò)的學(xué)術(shù)研究取得了喜人的突破,而如
6、何在實(shí)際應(yīng)用中發(fā)揮人工智能的潛力仍然是一項(xiàng)艱巨的挑戰(zhàn)。以計(jì)算機(jī)視覺(jué)為例,深度卷積神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別準(zhǔn)確率雖然在ImageNet數(shù)據(jù)集上表現(xiàn)卓越,但這些成果距實(shí)際的商用還有很大的距離。一方面由于圖像識(shí)別算法的復(fù)雜性,另一方面則由于圖像處理和計(jì)算帶來(lái)的算法復(fù)雜度對(duì)計(jì)算設(shè)備的性能的超高要求。后者催生了高性能計(jì)算在異構(gòu)平臺(tái)上的廣泛應(yīng)用,如使用GPU加速使深度神經(jīng)網(wǎng)絡(luò)的圖像訓(xùn)練時(shí)間控制在可接受的范圍之內(nèi)。與此同時(shí),視頻網(wǎng)站在版權(quán)、網(wǎng)絡(luò)帶寬、服務(wù)器等資源上的高昂成本需要新的廣告推薦模式平衡用戶(hù)體驗(yàn)和商業(yè)收入。
7、基于以上立題背景,本文對(duì)已有的視頻圖像識(shí)別算法與技術(shù)進(jìn)行研究分析,提出了一套用于解決垂直內(nèi)容類(lèi)的視頻圖像中的目標(biāo)物品的定位和識(shí)別任務(wù)的基于異構(gòu)平臺(tái)的可行性方案。該方案的設(shè)計(jì)與實(shí)現(xiàn)包括主要三大部分的工作內(nèi)容:(1)視頻圖像分割:對(duì)視頻源進(jìn)行預(yù)處理并獲取幀圖像,使用基于圖表示的像素合并算法獲取被分割區(qū)域后采取選擇搜索策略獲得可能存在目標(biāo)對(duì)象的矩形框位置;(2)改進(jìn)深度學(xué)習(xí)框架Caffe的跨平臺(tái)性:使用異構(gòu)編程語(yǔ)言O(shè)penCL實(shí)現(xiàn)原生的基于CUDA的GPU加速功能,從而克服已有的Caffe只能在NVID
8、IA平臺(tái)上進(jìn)行運(yùn)算加速的局限性;(3)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)執(zhí)行圖像識(shí)別:使用ImageNet數(shù)據(jù)集對(duì)該模型進(jìn)行訓(xùn)練得到能夠識(shí)別目標(biāo)對(duì)象的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),將圖像的識(shí)別結(jié)果與矩形框位置進(jìn)行回溯映射定位視頻中的目標(biāo)物體位置。論文的實(shí)驗(yàn)部分對(duì)提出的方案的可行性和有效性進(jìn)行了驗(yàn)證。為了實(shí)現(xiàn)識(shí)別的有效性實(shí)驗(yàn)的可視化,對(duì)圖像分割結(jié)果包含區(qū)域矩形框和對(duì)應(yīng)坐標(biāo)位置通過(guò)圖形編程對(duì)比神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別效果。實(shí)驗(yàn)還通過(guò)分析卷積神經(jīng)網(wǎng)絡(luò)不同神經(jīng)層的輸出結(jié)果理解卷積神經(jīng)網(wǎng)絡(luò)內(nèi)部對(duì)圖像特征的學(xué)習(xí)機(jī)制,印證了本文提出的