資源描述:
《這13張圖告訴你深度學(xué)習(xí)到底有多火.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、這13張圖告訴你深度學(xué)習(xí)到底有多火 深度學(xué)習(xí)火熱不是假象,以下的十個指數(shù)級增長趨勢證明:深度學(xué)習(xí)在過去的一年內(nèi)獲得了極快的發(fā)展,已經(jīng)成為當(dāng)下人工智能的“頂梁柱”。本文從ImageNet、NIPS和CVPR等頂級學(xué)術(shù)會議,以及谷歌、英偉達等企業(yè)應(yīng)用,還有深度學(xué)習(xí)人才與投資、收購等角度分析,用13張圖解讀深度學(xué)習(xí)到底有多火?! D像識別準(zhǔn)確率的指數(shù)級增長 似乎一切都是從2015年的ImageNet挑戰(zhàn)賽開始的,當(dāng)年在圖像識別準(zhǔn)確率上,機器首次超過了人類,被認(rèn)為是一個里程碑式的突破?! D:I
2、LSVRCtop-5錯誤率 2010年算法的圖像識別錯誤率至少在25%左右,但到2015年,計算機圖像識別錯誤率已經(jīng)低于人類(人類水平大概是4%左右)。2015年是0.03567,也就是3.5%。2016年,ImageNet競賽,圖像識別錯誤率進一步下降,錯誤率今年的最好成績?yōu)椋浩骄e誤率0.02991,也就是2.99%左右?! 纳蠄D可以看到,在ImageNet競賽中,其實從2012年,開始,使用深度學(xué)習(xí)方法,錯誤率只有15.3%左右。這是Hinton教授和他的兩個研究生AlexKrizhe
3、vsky,IllyaSutskever的成果。據(jù)說,他們使用了兩個Nvidia的GTX580CPU(內(nèi)存3GB,計算速度1.6TFLOPS),讓程序接受一百二十萬個圖像訓(xùn)練,花了接近六天時間?! ∷阉鳠岫鹊闹笖?shù)級增長 “深度學(xué)習(xí)”在2012年開始嶄露頭角。下圖是GoogleTrends中“DeepLearning”的搜索趨勢?! ∩疃葘W(xué)習(xí)在近兩年來已經(jīng)成為名副其實的熱詞。 學(xué)術(shù)會議上深度學(xué)習(xí)影響力的指數(shù)級增長 現(xiàn)實表明,學(xué)術(shù)研究領(lǐng)域確實迎來爆發(fā)式增長 圖:NIPS增長趨勢 2016
4、年,作為學(xué)界頂級盛會的NIPS共收到投稿超過2500篇,最終接收了568篇——保守估計接收率22.7%。這個論文接收率并不算那么低(相較其他頂會)?! ≡倏磪藬?shù)及其近年來的增長趨勢(上圖右),2016參會人數(shù)已經(jīng)超過了5000人——尤其是近兩年,用“直線上升”形容毫不夸張?! VPR是計算機視覺領(lǐng)域的國際頂級會議。下面是CVPR的增長趨勢圖: 圖:CVPR參會人數(shù)趨勢 新智元在此前的報道曾統(tǒng)計過,本屆會議共收到論文2145篇,創(chuàng)下歷史記錄(有效1865篇)。會議接收論文643篇(接收率
5、29.9%)?! ?016CVPR會議接收的論文里,發(fā)表的論文中有80%到90%,口頭報告更是接近100%都來自深度學(xué)習(xí)領(lǐng)域。 深度學(xué)習(xí)技術(shù)在企業(yè)內(nèi)部應(yīng)用的指數(shù)級增長 以上能顯示深度學(xué)習(xí)理論的增長趨勢。但只有理論嗎?讓我們看看Google內(nèi)部對深度學(xué)習(xí)技術(shù)的使用情況?! D:Google使用深度學(xué)習(xí)的趨勢 從上圖可以看到,2014年到2015年間,谷歌內(nèi)部對深度學(xué)習(xí)技術(shù)的使用呈直線上升趨勢。應(yīng)用領(lǐng)域包括:APP、地圖、照片、郵箱、語音、安卓、Youtube、翻譯、機器人研究、圖像理解、自然
6、語言理解、毒品探測。 谷歌大腦負(fù)責(zé)人JeffDean在接受《福布斯》的采訪時曾提到,2011年到2012年間,公司使用深度神經(jīng)網(wǎng)絡(luò)技術(shù)的團隊只有十幾組,現(xiàn)在已經(jīng)超過200多組,有上千人在訓(xùn)練這類的模型,使用的就是谷歌大腦團隊搭建的軟件?! ∷f:“5年前,當(dāng)我們第一次開始組建機器學(xué)習(xí)研究組,調(diào)查使用大量的計算和深度卷積網(wǎng)絡(luò)處理問題的情況,當(dāng)時公司里還沒有多少人在使用這種方法。后來,我們發(fā)現(xiàn)少數(shù)看起來可以有效應(yīng)用的幾個地方,其中包括語音識別系統(tǒng),所以我們跟語音識別團隊的同事緊密合作,把深度神經(jīng)網(wǎng)絡(luò)加
7、入到語音識別系統(tǒng)中去,從而在識別精準(zhǔn)度上獲得了顯著的提升。然后,我們又與幾個計算機視覺相關(guān)的團隊合作,比如圖像識別和一些街景團隊,其中包括,用圖像中的原始像素去訓(xùn)練模型做一些有意思的事情,從圖像中提取文本或者理解圖像(是美洲豹,垃圾車或是別的什么東西)?! ∮腥さ氖牵S著時間的過去,更多的團隊開始采用這些方法,因為他們會聽到別的團隊說在嘗試一些別的東西,并且獲得了好的結(jié)果。不然就是,我們可以把他們與這些團隊聯(lián)系起來,或者我們可以提供一些在他們特定的問題語境下如何使用這些方法的建議。后來,我們把這些都
8、正規(guī)化,所以現(xiàn)在我們就有了一個團隊來做這些擴展工作。首先是聯(lián)系想要在產(chǎn)品中用到這些機器學(xué)習(xí)模型的團隊,他們會描述自己遇到的難題,一般情況下,我們團隊會說:“這似乎跟其他團隊所遇到的難題很像,我們的解決方案很有用,試試看我們的方案,然后給我們反饋”?! ∩疃葘W(xué)習(xí)人才需求的指數(shù)級增長 從2015年開始,市場對深度學(xué)習(xí)人才的需求直線上漲,2016年下半年開始更是以超大幅度上漲。另外,2015年開始,我們也看到了大量的學(xué)術(shù)界頂尖人才流向產(chǎn)業(yè)界?! ∩疃葘W(xué)習(xí)投資上的指