資源描述:
《人工智能芯片的爭(zhēng)奪 誰(shuí)將勝出?.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、人工智能芯片的爭(zhēng)奪誰(shuí)將勝出? 現(xiàn)在的深度學(xué)習(xí)系統(tǒng)依賴于軟件定義網(wǎng)絡(luò)和大數(shù)據(jù)學(xué)習(xí)產(chǎn)生的超大型運(yùn)算能力,并靠此來(lái)實(shí)現(xiàn)目標(biāo)。但很遺憾的是,這類型的運(yùn)算配置是很難嵌入到那些運(yùn)算能力、存儲(chǔ)大小、和帶寬都有限制的系統(tǒng)中(例如汽車、無(wú)人機(jī)和物聯(lián)網(wǎng)設(shè)備)?! ∵@就給業(yè)界提出了一個(gè)新的挑戰(zhàn),如何通過(guò)創(chuàng)新,把深度神經(jīng)網(wǎng)絡(luò)的運(yùn)算能力嵌入到終端設(shè)備中去?! ovidius公司的CEORemiEl-Ouazzane在幾個(gè)月前說(shuō)過(guò),將人工智能擺在網(wǎng)絡(luò)的邊緣將會(huì)是一個(gè)大趨勢(shì)。 RemiEl-Ouazzane 在問(wèn)到為什么人工智能會(huì)被“趕”到網(wǎng)絡(luò)邊緣的時(shí)候,CEAArchitectur
2、eFellowMarcDuranton給出了三個(gè)原因:分別是安全、隱私和經(jīng)濟(jì)。他認(rèn)為這三點(diǎn)是驅(qū)動(dòng)業(yè)界在終端處理數(shù)據(jù)的重要因素。他指出,未來(lái)將會(huì)衍生更多“將數(shù)據(jù)轉(zhuǎn)化為信息”的需求。并且這些數(shù)據(jù)越早處理越好,他補(bǔ)充說(shuō)?! EAArchitectureFellowMarcDuranton 攝像一下,假如你的無(wú)人駕駛汽車是安全的,那么這些無(wú)人駕駛功能就不需要長(zhǎng)時(shí)間依賴于聯(lián)盟處理;假設(shè)老人在家里跌倒了,那么這種情況當(dāng)場(chǎng)就應(yīng)該檢測(cè)到并判斷出來(lái)。考慮到隱私原因,這些是非常重要的,Duranton強(qiáng)調(diào)。 但這并不意味著收集家里十個(gè)攝像頭的所有圖片,并傳送給我,就稱作一個(gè)號(hào)
3、的提醒。這也并不能降低“能耗、成本和數(shù)據(jù)大小”,Duranton補(bǔ)充說(shuō)。 競(jìng)賽正式開啟 從現(xiàn)在的情景看來(lái),芯片供應(yīng)商已經(jīng)意識(shí)到推理機(jī)的增長(zhǎng)需求。包括Movidus(Myriad2),Mobileye(EyeQ4&5)和Nvidia(DrivePX)在內(nèi)的眾多半導(dǎo)體公司正在角逐低功耗、高性能的硬件加速器。幫助開發(fā)者更好的在嵌入式系統(tǒng)中執(zhí)行“學(xué)習(xí)”?! 倪@些廠商的動(dòng)作和SoC的發(fā)展方向看來(lái),在后智能手機(jī)時(shí)代,推理機(jī)已經(jīng)逐漸成為半導(dǎo)體廠商追逐的下一個(gè)目標(biāo)市場(chǎng)?! ≡诮衲暝缧r(shí)候,Google的TPU橫空出世,昭示著業(yè)界意圖在機(jī)器學(xué)習(xí)芯片中推動(dòng)創(chuàng)新的的意圖。在發(fā)布這個(gè)
4、芯片的時(shí)候,搜索巨人表示,TPU每瓦性能較之傳統(tǒng)的FPGA和GPU將會(huì)高一個(gè)數(shù)量級(jí)。Google還表示,這個(gè)加速器還被應(yīng)用到了今年年初風(fēng)靡全球的AlphaGo系統(tǒng)里面?! 〉菑陌l(fā)布到現(xiàn)在,Google也從未披露過(guò)TPU的具體細(xì)節(jié),更別說(shuō)把這個(gè)產(chǎn)品對(duì)外出售?! 『芏郤oC從業(yè)者從谷歌的TPU中得出了一個(gè)結(jié)論,他們認(rèn)為,機(jī)器學(xué)習(xí)需要定制化的架構(gòu)。但在他們針對(duì)機(jī)器學(xué)習(xí)做芯片設(shè)計(jì)的時(shí)候,他們又會(huì)對(duì)芯片的架構(gòu)感到懷疑和好奇。同時(shí)他們想知道業(yè)界是否已經(jīng)有了一種衡量不同形態(tài)下深度神經(jīng)網(wǎng)絡(luò)(DNN)性能的工具?! 」ぞ咭呀?jīng)到來(lái) CEA聲稱,他們已經(jīng)為幫推理機(jī)探索不同的硬件架
5、構(gòu)做好了準(zhǔn)備,他們已經(jīng)開發(fā)出了一個(gè)叫做N2D2,的軟件架構(gòu)。他們夠幫助設(shè)計(jì)者探索和聲稱DNN架構(gòu)?!拔覀冮_發(fā)這個(gè)工具的目的是為了幫助DNN選擇適合的硬件”,Duranton說(shuō)。到2017年第一季度,這個(gè)N2D2會(huì)開源。Duranton承諾。 N2D2的特點(diǎn)在于不僅僅是在識(shí)別精度的基礎(chǔ)上對(duì)比硬件,它還能從處理時(shí)間、硬件成本和能源損耗的多個(gè)方面執(zhí)行對(duì)比。因?yàn)獒槍?duì)不同的深度學(xué)習(xí)應(yīng)用,其所需求的硬件配置參數(shù)都是不一樣的,所以說(shuō)以上幾點(diǎn)才是最重要的,Duranton表示。 N2D2的工作原理 N2D2為現(xiàn)存的CPU、GPU和FPGA提供了一個(gè)參考標(biāo)準(zhǔn)?! ∵吘売?jì)算的
6、障礙 作為一個(gè)資深的研究組織,CEA已經(jīng)在如何把DNN完美的推廣到邊緣計(jì)算領(lǐng)域進(jìn)行了長(zhǎng)時(shí)間的深入研究。在問(wèn)到執(zhí)行這種推進(jìn)的障礙時(shí),Duranton指出,由于功耗、尺寸和延遲的限制,這些“浮點(diǎn)”服務(wù)器方案不能應(yīng)用。這就是最大的障礙。而其他的障礙包括了“大量的Mac、帶寬和芯片上存儲(chǔ)的尺寸”,Duranton補(bǔ)充說(shuō)。 那就是說(shuō)如何整合這種“浮點(diǎn)”方式,是最先應(yīng)該被解決的問(wèn)題?! uranton認(rèn)為,一些新的架構(gòu)是在所難免的,隨之而來(lái)的一些類似“spikecode”的新coding也是必然的?! 〗?jīng)過(guò)CEA的研究指出,甚至二進(jìn)制編碼都不是必須的。他們認(rèn)為類似spik
7、ecoding這類的時(shí)間編碼在邊緣能夠迸發(fā)出更強(qiáng)大的能量?! pikecoding之所以受歡迎,是因?yàn)樗苊鞔_展示神經(jīng)系統(tǒng)內(nèi)的數(shù)據(jù)解碼。往深里講,就是說(shuō)這些基于事件的的編碼能夠兼容專用的傳感器和預(yù)處理。 這種和神經(jīng)系統(tǒng)極度相似的編碼方式使得混合模擬和數(shù)字信號(hào)更容易實(shí)現(xiàn),這也能夠幫助研究者打造低功耗的硬件加速器?! EA也正在思考把神經(jīng)網(wǎng)絡(luò)架構(gòu)調(diào)整到邊緣計(jì)算的潛在可能。Duranton指出,現(xiàn)在人們正在推動(dòng)使用‘SqueezeNet取替AlexNet。據(jù)報(bào)道,為達(dá)到同等精度,使用前者比后者少花50倍的參數(shù)。這類的簡(jiǎn)單配置對(duì)于邊緣計(jì)算、拓?fù)鋵W(xué)和降低Mac的數(shù)量