基于深度學(xué)習(xí)的人臉識別技術(shù)綜述.doc

ID：51409366

大小：4.12 MB

頁數(shù)：23頁

時間：2020-03-23

資源描述：

《基于深度學(xué)習(xí)的人臉識別技術(shù)綜述.doc》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、基于深度學(xué)習(xí)的人臉識別技術(shù)綜述簡介：人臉識別是計算機視覺研究領(lǐng)域的一個熱點，同時人臉識別的研究領(lǐng)域非常廣泛。因此，本技術(shù)綜述限定于：一，在LFW數(shù)據(jù)集上（LabeledFacesintheWild）獲得優(yōu)秀結(jié)果的方法;二，是采用深度學(xué)習(xí)的方法。前言LFW數(shù)據(jù)集（LabeledFacesintheWild）是目前用得最多的人臉圖像數(shù)據(jù)庫。該數(shù)據(jù)庫共13，233幅圖像，其中5749個人，其中1680人有兩幅及以上的圖像，4069人只有一幅圖像。圖像為250*250大小的JPEG格式。絕大多數(shù)為彩色圖，少數(shù)為

2、灰度圖。該數(shù)據(jù)庫采集的是自然條件下人臉圖片，目的是提高自然條件下人臉識別的精度。該數(shù)據(jù)集有6中評價標(biāo)準(zhǔn)：一，Unsupervised；二，Image-restrictedwithnooutsidedata；三，Unrestrictedwithnooutsidedata；四，Image-restrictedwithlabel-freeoutsidedata；五，Unrestrictedwithlabel-freeoutsidedata；六，Unrestrictedwithlabeledoutsidedat

3、a。目前，人工在該數(shù)據(jù)集上的準(zhǔn)確率在0.9427~0.9920。在該數(shù)據(jù)集的第六種評價標(biāo)準(zhǔn)下（無限制，可以使用外部標(biāo)注的數(shù)據(jù)），許多方法已經(jīng)趕上（超過）人工識別精度，比如face++,DeepID3，F(xiàn)aceNet等。圖一/表一：人類在LFW數(shù)據(jù)集上的識別精度表二：第六種標(biāo)準(zhǔn)下，部分模型的識別準(zhǔn)確率（詳情參見lfw結(jié)果）續(xù)上表本文綜述的人臉識別方法包括以下幾個篩選標(biāo)準(zhǔn)：一，在上表中識別精度超過0.95（超過人類的識別準(zhǔn)確度）；二，公布了方法（部分結(jié)果為商業(yè)公司提交，方法并未公布，比如Tencent-Be

4、stImage）；三，使用深度學(xué)習(xí)方法；三，近兩年的結(jié)果。本文綜述的方法包括：1，face++（0.9950）；2，DeepFace（0.9735）；3,FR+FCN（0.9645）；4，DeepID（0.9745）；5，F(xiàn)aceNet（0.9963）；6，baidu的方法（0.9977）；7,pose+shape+expressionaugmentation（0.9807）；8，CNN-3DMMestimation(0.9235，準(zhǔn)確率沒那么高，但是值得參考)。人臉識別方法1，face++(0.995

5、0)參考文獻(xiàn)：Naive-DeepfaceRecognition:TouchingtheLimitofLFWBenchmarkorNot?face++從網(wǎng)絡(luò)上搜集了5million張人臉圖片用于訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò)模型，在LFW數(shù)據(jù)集上準(zhǔn)確率非常高。該篇文章的網(wǎng)路模型很常規(guī)（常規(guī)深度卷積神經(jīng)網(wǎng)絡(luò)模型），但是提出的問題是值得參考的。問題一：他們的MegviiFaceRecognitionSystem經(jīng)過訓(xùn)練后，在LFW數(shù)據(jù)集上達(dá)到了0.995的準(zhǔn)確率。在真實場景測試中（ChineseID（CHID）），該

6、系統(tǒng)的假陽性率（FP=10-5）非常低。但是，真陽性率僅為0.66，沒有達(dá)到真實場景應(yīng)用要求。其中，年齡差異（包括intra-variation：同一個人，不同年齡照片；以及inter-variation：不同人，不同年齡照片）是影響模型準(zhǔn)確率原因之一。而在該測試標(biāo)準(zhǔn)(CHID)下，人類表現(xiàn)的準(zhǔn)確率大于0.90。圖1-1：在CHID中出錯的樣本問題二：數(shù)據(jù)采集偏差?；诰W(wǎng)絡(luò)采集的人臉數(shù)據(jù)集存在偏差。這些偏差表現(xiàn)在：1，個體之間照片數(shù)量差異很大；2，大部分采集的照片都是：微笑，化妝，年輕，漂亮的圖片。這些

7、和真實場景中差異較大。因此，盡管系統(tǒng)在LFW數(shù)據(jù)集上有高準(zhǔn)確率，在現(xiàn)實場景中準(zhǔn)確率很低。問題三：模型測試假陽性率假陽性率，英語名稱：falsepositiverate，F(xiàn)PR.通俗名稱：誤診率或第Ⅰ類錯誤的。解釋：即實際無病或陰性，但被判為有病或陽性的百分比。非常低，但是現(xiàn)實應(yīng)用中，人們更關(guān)注真陽性率真陽性率(truepositiverate，TPR)，又稱敏感度(sensitivity，SEN)，即實際有病而按該篩檢試驗的標(biāo)準(zhǔn)被正確地判為有病的百分比。它反映篩檢試驗發(fā)現(xiàn)病人的能力。。問題四：人臉圖片的

8、角度，光線，閉合（開口、閉口）和年齡等差異相互的作用，導(dǎo)致人臉識別系統(tǒng)現(xiàn)實應(yīng)用準(zhǔn)確率很低。因此，該文章提出未來進(jìn)一步研究的方向。方向一：從視頻中提取訓(xùn)練數(shù)據(jù)。視頻中人臉畫面接近于現(xiàn)實應(yīng)用場景（變化的角度，光照，表情等）；方向二：通過人臉合成方法增加訓(xùn)練數(shù)據(jù)。因為單個個體不同的照片很困難（比如，難以搜集大量的單個個體不同年齡段的照片，可以采用人臉合成的方法（比如3D人臉重建）生成單個個體不同年齡段的照片）。該文章提出的方向在后續(xù)方法介紹中均有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 23



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

基于深度學(xué)習(xí)的人臉識別技術(shù)綜述.doc

基于深度學(xué)習(xí)的人臉識別技術(shù)綜述.doc

相關(guān)文章

相關(guān)標(biāo)簽