資源描述:
《基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)綜述》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、基于深度學(xué)習(xí)的人臉識(shí)別技術(shù)綜述簡(jiǎn)介:人臉識(shí)別是計(jì)算機(jī)視覺研究領(lǐng)域的一個(gè)熱點(diǎn),同時(shí)人臉識(shí)別的研究領(lǐng)域非常廣泛。因此,本技術(shù)綜述限定于:一,在LFW數(shù)據(jù)集上(LabeledFacesintheWild)獲得優(yōu)秀結(jié)果的方法;二,是采用深度學(xué)習(xí)的方法。前言LFW數(shù)據(jù)集(LabeledFacesintheWild)是目前用得最多的人臉圖像數(shù)據(jù)庫。該數(shù)據(jù)庫共13,233幅圖像,其中5749個(gè)人,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。圖像為250*250大小的JPEG格式。絕大多數(shù)為彩色圖,
2、少數(shù)為灰度圖。該數(shù)據(jù)庫采集的是自然條件下人臉圖片,目的是提高自然條件下人臉識(shí)別的精度。該數(shù)據(jù)集有6中評(píng)價(jià)標(biāo)準(zhǔn):一,Unsupervised;二,Image-restrictedwithnooutsidedata;三,Unrestrictedwithnooutsidedata;四,Image-restrictedwithlabel-freeoutsidedata;五,Unrestrictedwithlabel-freeoutsidedata;六,Unrestrictedwithlabeledouts
3、idedata。目前,人工在該數(shù)據(jù)集上的準(zhǔn)確率在0.9427~0.9920。在該數(shù)據(jù)集的第六種評(píng)價(jià)標(biāo)準(zhǔn)下(無限制,可以使用外部標(biāo)注的數(shù)據(jù)),許多方法已經(jīng)趕上(超過)人工識(shí)別精度,比如face++,DeepID3,F(xiàn)aceNet等。圖一/表一:人類在LFW數(shù)據(jù)集上的識(shí)別精度表二:第六種標(biāo)準(zhǔn)下,部分模型的識(shí)別準(zhǔn)確率(詳情參見lfw結(jié)果)續(xù)上表本文綜述的人臉識(shí)別方法包括以下幾個(gè)篩選標(biāo)準(zhǔn):一,在上表中識(shí)別精度超過0.95(超過人類的識(shí)別準(zhǔn)確度);二,公布了方法(部分結(jié)果為商業(yè)公司提交,方法并未公布,比如T
4、encent-BestImage);三,使用深度學(xué)習(xí)方法;三,近兩年的結(jié)果。本文綜述的方法包括:1,face++(0.9950);2,DeepFace(0.9735);3,FR+FCN(0.9645);4,DeepID(0.9745);5,F(xiàn)aceNet(0.9963);6,baidu的方法(0.9977);7,pose+shape+expressionaugmentation(0.9807);8,CNN-3DMMestimation(0.9235,準(zhǔn)確率沒那么高,但是值得參考)。人臉識(shí)別方法1,
5、face++(0.9950)參考文獻(xiàn):Naive-DeepfaceRecognition:TouchingtheLimitofLFWBenchmarkorNot?face++從網(wǎng)絡(luò)上搜集了5million張人臉圖片用于訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型,在LFW數(shù)據(jù)集上準(zhǔn)確率非常高。該篇文章的網(wǎng)路模型很常規(guī)(常規(guī)深度卷積神經(jīng)網(wǎng)絡(luò)模型),但是提出的問題是值得參考的。問題一:他們的MegviiFaceRecognitionSystem經(jīng)過訓(xùn)練后,在LFW數(shù)據(jù)集上達(dá)到了0.995的準(zhǔn)確率。在真實(shí)場(chǎng)景測(cè)試中(Chi
6、neseID(CHID)),該系統(tǒng)的假陽性率(FP=10-5)非常低。但是,真陽性率僅為0.66,沒有達(dá)到真實(shí)場(chǎng)景應(yīng)用要求。其中,年齡差異(包括intra-variation:同一個(gè)人,不同年齡照片;以及inter-variation:不同人,不同年齡照片)是影響模型準(zhǔn)確率原因之一。而在該測(cè)試標(biāo)準(zhǔn)(CHID)下,人類表現(xiàn)的準(zhǔn)確率大于0.90。圖1-1:在CHID中出錯(cuò)的樣本問題二:數(shù)據(jù)采集偏差?;诰W(wǎng)絡(luò)采集的人臉數(shù)據(jù)集存在偏差。這些偏差表現(xiàn)在:1,個(gè)體之間照片數(shù)量差異很大;2,大部分采集的照片都是
7、:微笑,化妝,年輕,漂亮的圖片。這些和真實(shí)場(chǎng)景中差異較大。因此,盡管系統(tǒng)在LFW數(shù)據(jù)集上有高準(zhǔn)確率,在現(xiàn)實(shí)場(chǎng)景中準(zhǔn)確率很低。問題三:模型測(cè)試假陽性率假陽性率,英語名稱:falsepositiverate,F(xiàn)PR.通俗名稱:誤診率或第Ⅰ類錯(cuò)誤的。解釋:即實(shí)際無病或陰性,但被判為有病或陽性的百分比。非常低,但是現(xiàn)實(shí)應(yīng)用中,人們更關(guān)注真陽性率真陽性率(truepositiverate,TPR),又稱敏感度(sensitivity,SEN),即實(shí)際有病而按該篩檢試驗(yàn)的標(biāo)準(zhǔn)被正確地判為有病的百分比。它反映篩
8、檢試驗(yàn)發(fā)現(xiàn)病人的能力。。問題四:人臉圖片的角度,光線,閉合(開口、閉口)和年齡等差異相互的作用,導(dǎo)致人臉識(shí)別系統(tǒng)現(xiàn)實(shí)應(yīng)用準(zhǔn)確率很低。因此,該文章提出未來進(jìn)一步研究的方向。方向一:從視頻中提取訓(xùn)練數(shù)據(jù)。視頻中人臉畫面接近于現(xiàn)實(shí)應(yīng)用場(chǎng)景(變化的角度,光照,表情等);方向二:通過人臉合成方法增加訓(xùn)練數(shù)據(jù)。因?yàn)閱蝹€(gè)個(gè)體不同的照片很困難(比如,難以搜集大量的單個(gè)個(gè)體不同年齡段的照片,可以采用人臉合成的方法(比如3D人臉重建)生成單個(gè)個(gè)體不同年齡段的照片)。該文章提出的方向在后續(xù)方法介紹中均有