資源描述:
《基于深度學(xué)習(xí)的人臉表情識別算法研究》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、基于深度學(xué)習(xí)的人臉表情識別算法研究-->第1章緒論人臉表情是人類交流的重要載體和非語言交流的一種重要方式,它不僅能夠表達(dá)人類的情感狀態(tài)、認(rèn)知活動和人格特征,而且它所富含的人體行為信息與人的情感狀態(tài)、精神狀態(tài)、健康狀態(tài)等其他因素有著極為密切的關(guān)聯(lián)。心理學(xué)家Mehrabian提出[1],在人類交流過程中,只有7%的信息量通過語言來表達(dá),有38%通過輔助語言來傳達(dá),如節(jié)奏、語音、語調(diào)等,而人臉表情是占比重最大的一部分——能夠達(dá)到信息總量的55%。因此,通過對于人臉表情的研究可以獲得很多有價值的信息,從而分析人類的心理活動和精神狀態(tài)。表情識別技術(shù)能夠?qū)崿F(xiàn)通過計算機(jī)來理解人類的情感,是量化分析人類情感
2、的基礎(chǔ)和前提,對促進(jìn)人機(jī)交互的發(fā)展起到重要作用。隨著計算機(jī)技術(shù)和人工智能技術(shù)的水平不斷提高以及、機(jī)器人等相關(guān)領(lǐng)域的蓬勃發(fā)展,市場對于智能化人機(jī)交互的需求也與日俱增。與此同時,眾多的圖像開源框架和高性能的硬件設(shè)備為表情識別的研究與應(yīng)用在軟件與硬件上提供了強(qiáng)有力的技術(shù)支持。目前,表情識別作為計算機(jī)視覺和機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)已經(jīng)構(gòu)成了跨越生物學(xué)、心理學(xué)和計算機(jī)視覺等多領(lǐng)域的交叉性課題。......第2章深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)2.1深度學(xué)習(xí)研究表明,哺乳動物的大腦視覺皮層采用一種分層機(jī)制對輸入信息進(jìn)行處理[38]。信息從感知器官輸入后,在經(jīng)過每一層神經(jīng)元時,神經(jīng)元抽取能夠體現(xiàn)對象本質(zhì)的特征,再將這
3、些特征繼續(xù)傳遞到下一層,后繼的各層神經(jīng)元也都以類似的方式處理和傳遞信息,最后傳至大腦。深度神經(jīng)網(wǎng)絡(luò)受此啟發(fā),包含多層結(jié)點(diǎn)并使得信息得以逐層處理。一些淺層(指僅含一個隱含層)的算法層次較少,當(dāng)給定有限的訓(xùn)練樣本和神經(jīng)元時,淺層結(jié)構(gòu)難以有效地表示復(fù)雜的函數(shù),并且對于復(fù)雜分類問題的表現(xiàn)性能及泛化能力均顯不足,難以刻畫目標(biāo)對象的豐富含義。深度學(xué)習(xí)通過大量簡單神經(jīng)元組成的網(wǎng)絡(luò),利用輸入與輸出之間的非線性關(guān)系對復(fù)雜函數(shù)進(jìn)行近似,對觀測樣本進(jìn)行擬合,并在特征的抽取上體現(xiàn)了突出的能力。深度學(xué)習(xí)能夠廣泛普及有三個重要的原因,首先,計算機(jī)芯片的處理能力顯著提高了,例如,通用圖形處理單元(General-Purp
4、oseputingonGraphicsProcessingUnits,GPGPU)的出現(xiàn),大大提高了深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)和訓(xùn)練速度。其次,硬件計算的成本顯著降低,第三,機(jī)器學(xué)習(xí)和信號/信息處理研究的進(jìn)步。2.2多層前饋網(wǎng)絡(luò)其中參數(shù)ioid激活函數(shù),如公式(2.4)所示。第3章人臉表情識別的深度連續(xù)卷積神經(jīng)網(wǎng)絡(luò)模型........................223.1深度連續(xù)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建........223.2結(jié)構(gòu)分析及參數(shù)優(yōu)化..............................243.3實(shí)驗(yàn)與結(jié)果分析........273.第4章人臉表情識別系統(tǒng)的設(shè)計.......324.1
5、軟件設(shè)計方案....................324.2主要功能的詳細(xì)設(shè)計.................................354.3本章小結(jié)......................41第5章深度連續(xù)卷積神經(jīng)網(wǎng)絡(luò)模型的其它應(yīng)用實(shí)驗(yàn)...................425.1手寫數(shù)字識別...............425.2復(fù)雜彩色圖像分類....................455.3本章小結(jié).......46第5章深度連續(xù)卷積神經(jīng)網(wǎng)絡(luò)模型的其它應(yīng)用實(shí)驗(yàn)5.1手寫數(shù)字識別ModifiedNIST(MNIST)數(shù)據(jù)集[56]由NISTSpecialDataba
6、se3和SpecialDatabase1構(gòu)成,是NIST的一個子集,作為一個大型的手寫數(shù)字?jǐn)?shù)據(jù)庫,被廣泛應(yīng)用于機(jī)器學(xué)習(xí)等領(lǐng)域。NIST數(shù)據(jù)庫構(gòu)建之初使用SD-3作為訓(xùn)練數(shù)據(jù)集,SD-1作為測試數(shù)據(jù)集。但是由于SD-3的樣本數(shù)據(jù)于美國人口調(diào)查局(CensusBureau)的員工,而SD-1的樣本數(shù)據(jù)則于美國高中學(xué)生的手寫數(shù)據(jù)。故SD-3的樣本數(shù)據(jù)相比于SD-1的更加清晰且易于辨認(rèn)。為了使得訓(xùn)練結(jié)果和測試結(jié)果能更加獨(dú)立,免于所采用的數(shù)據(jù)集的影響,LeCun結(jié)合了這兩個數(shù)據(jù)集的特點(diǎn),構(gòu)建了MNIST數(shù)據(jù)集。MNIST中的訓(xùn)練集選用了SD-3和SD-1中的各30000個樣例,共60000個。抽選的6
7、0000個樣例來自于大約250個不同的個體的手寫數(shù)據(jù),并且保證了測試集和訓(xùn)練集的數(shù)據(jù)來自于不同的個體。同樣,測試集也選用了SD-3和SD-1中各5000個樣例。MNIST數(shù)據(jù)集中的所有樣本數(shù)據(jù)都經(jīng)過了尺寸標(biāo)準(zhǔn)化和中心化,每張圖片的尺寸為2828。數(shù)據(jù)集中部分?jǐn)?shù)字的圖像如圖5.1所示,通過對圖中樣本數(shù)據(jù)的比較可以看出,手寫數(shù)字中相同標(biāo)簽下不同圖像之間的差異還是很大的。5.2復(fù)雜彩色圖像分類CIFAR-10數(shù)據(jù)集