資源描述:
《基于深度學(xué)習(xí)的人臉識別技術(shù)綜述.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于深度學(xué)習(xí)的人臉識別技術(shù)綜述簡介:人臉識別是計算機視覺研究領(lǐng)域的一個熱點,同時人臉識別的研究領(lǐng)域非常廣泛。因此,本技術(shù)綜述限定于:一,在LFW數(shù)據(jù)集上(LabeledFacesintheWild)獲得優(yōu)秀結(jié)果的方法;二,是采用深度學(xué)習(xí)的方法。前言LFW數(shù)據(jù)集(LabeledFacesintheWild)是目前用得最多的人臉圖像數(shù)據(jù)庫。該數(shù)據(jù)庫共13,233幅圖像,其中5749個人,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。圖像為250*250大小的JPEG格式。絕大多數(shù)為彩色圖,少數(shù)為
2、灰度圖。該數(shù)據(jù)庫采集的是自然條件下人臉圖片,目的是提高自然條件下人臉識別的精度。該數(shù)據(jù)集有6中評價標(biāo)準(zhǔn):一,Unsupervised;二,Image-restrictedwithnooutsidedata;三,Unrestrictedwithnooutsidedata;四,Image-restrictedwithlabel-freeoutsidedata;五,Unrestrictedwithlabel-freeoutsidedata;六,Unrestrictedwithlabeledoutsidedat
3、a。目前,人工在該數(shù)據(jù)集上的準(zhǔn)確率在0.9427~0.9920。在該數(shù)據(jù)集的第六種評價標(biāo)準(zhǔn)下(無限制,可以使用外部標(biāo)注的數(shù)據(jù)),許多方法已經(jīng)趕上(超過)人工識別精度,比如face++,DeepID3,F(xiàn)aceNet等。圖一/表一:人類在LFW數(shù)據(jù)集上的識別精度表二:第六種標(biāo)準(zhǔn)下,部分模型的識別準(zhǔn)確率(詳情參見lfw結(jié)果)續(xù)上表本文綜述的人臉識別方法包括以下幾個篩選標(biāo)準(zhǔn):一,在上表中識別精度超過0.95(超過人類的識別準(zhǔn)確度);二,公布了方法(部分結(jié)果為商業(yè)公司提交,方法并未公布,比如Tencent-Be
4、stImage);三,使用深度學(xué)習(xí)方法;三,近兩年的結(jié)果。本文綜述的方法包括:1,face++(0.9950);2,DeepFace(0.9735);3,FR+FCN(0.9645);4,DeepID(0.9745);5,F(xiàn)aceNet(0.9963);6,baidu的方法(0.9977);7,pose+shape+expressionaugmentation(0.9807);8,CNN-3DMMestimation(0.9235,準(zhǔn)確率沒那么高,但是值得參考)。人臉識別方法1,face++(0.995
5、0)參考文獻(xiàn):Naive-DeepfaceRecognition:TouchingtheLimitofLFWBenchmarkorNot?face++從網(wǎng)絡(luò)上搜集了5million張人臉圖片用于訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型,在LFW數(shù)據(jù)集上準(zhǔn)確率非常高。該篇文章的網(wǎng)路模型很常規(guī)(常規(guī)深度卷積神經(jīng)網(wǎng)絡(luò)模型),但是提出的問題是值得參考的。問題一:他們的MegviiFaceRecognitionSystem經(jīng)過訓(xùn)練后,在LFW數(shù)據(jù)集上達(dá)到了0.995的準(zhǔn)確率。在真實場景測試中(ChineseID(CHID)),該
6、系統(tǒng)的假陽性率(FP=10-5)非常低。但是,真陽性率僅為0.66,沒有達(dá)到真實場景應(yīng)用要求。其中,年齡差異(包括intra-variation:同一個人,不同年齡照片;以及inter-variation:不同人,不同年齡照片)是影響模型準(zhǔn)確率原因之一。而在該測試標(biāo)準(zhǔn)(CHID)下,人類表現(xiàn)的準(zhǔn)確率大于0.90。圖1-1:在CHID中出錯的樣本問題二:數(shù)據(jù)采集偏差?;诰W(wǎng)絡(luò)采集的人臉數(shù)據(jù)集存在偏差。這些偏差表現(xiàn)在:1,個體之間照片數(shù)量差異很大;2,大部分采集的照片都是:微笑,化妝,年輕,漂亮的圖片。這些
7、和真實場景中差異較大。因此,盡管系統(tǒng)在LFW數(shù)據(jù)集上有高準(zhǔn)確率,在現(xiàn)實場景中準(zhǔn)確率很低。問題三:模型測試假陽性率假陽性率,英語名稱:falsepositiverate,F(xiàn)PR.通俗名稱:誤診率或第Ⅰ類錯誤的。解釋:即實際無病或陰性,但被判為有病或陽性的百分比。非常低,但是現(xiàn)實應(yīng)用中,人們更關(guān)注真陽性率真陽性率(truepositiverate,TPR),又稱敏感度(sensitivity,SEN),即實際有病而按該篩檢試驗的標(biāo)準(zhǔn)被正確地判為有病的百分比。它反映篩檢試驗發(fā)現(xiàn)病人的能力。。問題四:人臉圖片的
8、角度,光線,閉合(開口、閉口)和年齡等差異相互的作用,導(dǎo)致人臉識別系統(tǒng)現(xiàn)實應(yīng)用準(zhǔn)確率很低。因此,該文章提出未來進(jìn)一步研究的方向。方向一:從視頻中提取訓(xùn)練數(shù)據(jù)。視頻中人臉畫面接近于現(xiàn)實應(yīng)用場景(變化的角度,光照,表情等);方向二:通過人臉合成方法增加訓(xùn)練數(shù)據(jù)。因為單個個體不同的照片很困難(比如,難以搜集大量的單個個體不同年齡段的照片,可以采用人臉合成的方法(比如3D人臉重建)生成單個個體不同年齡段的照片)。該文章提出的方向在后續(xù)方法介紹中均有