資源描述:
《人工智能芯片的爭奪 誰將勝出?.doc》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、人工智能芯片的爭奪誰將勝出? 現(xiàn)在的深度學習系統(tǒng)依賴于軟件定義網絡和大數(shù)據(jù)學習產生的超大型運算能力,并靠此來實現(xiàn)目標。但很遺憾的是,這類型的運算配置是很難嵌入到那些運算能力、存儲大小、和帶寬都有限制的系統(tǒng)中(例如汽車、無人機和物聯(lián)網設備)?! ∵@就給業(yè)界提出了一個新的挑戰(zhàn),如何通過創(chuàng)新,把深度神經網絡的運算能力嵌入到終端設備中去。 Movidius公司的CEORemiEl-Ouazzane在幾個月前說過,將人工智能擺在網絡的邊緣將會是一個大趨勢?! emiEl-Ouazzane 在問到為什么人工智能會被“趕”到網絡邊緣的時候,CEAArchitectur
2、eFellowMarcDuranton給出了三個原因:分別是安全、隱私和經濟。他認為這三點是驅動業(yè)界在終端處理數(shù)據(jù)的重要因素。他指出,未來將會衍生更多“將數(shù)據(jù)轉化為信息”的需求。并且這些數(shù)據(jù)越早處理越好,他補充說?! EAArchitectureFellowMarcDuranton 攝像一下,假如你的無人駕駛汽車是安全的,那么這些無人駕駛功能就不需要長時間依賴于聯(lián)盟處理;假設老人在家里跌倒了,那么這種情況當場就應該檢測到并判斷出來??紤]到隱私原因,這些是非常重要的,Duranton強調?! 〉@并不意味著收集家里十個攝像頭的所有圖片,并傳送給我,就稱作一個號
3、的提醒。這也并不能降低“能耗、成本和數(shù)據(jù)大小”,Duranton補充說?! 「傎愓介_啟 從現(xiàn)在的情景看來,芯片供應商已經意識到推理機的增長需求。包括Movidus(Myriad2),Mobileye(EyeQ4&5)和Nvidia(DrivePX)在內的眾多半導體公司正在角逐低功耗、高性能的硬件加速器。幫助開發(fā)者更好的在嵌入式系統(tǒng)中執(zhí)行“學習”。 從這些廠商的動作和SoC的發(fā)展方向看來,在后智能手機時代,推理機已經逐漸成為半導體廠商追逐的下一個目標市場?! ≡诮衲暝缧r候,Google的TPU橫空出世,昭示著業(yè)界意圖在機器學習芯片中推動創(chuàng)新的的意圖。在發(fā)布這個
4、芯片的時候,搜索巨人表示,TPU每瓦性能較之傳統(tǒng)的FPGA和GPU將會高一個數(shù)量級。Google還表示,這個加速器還被應用到了今年年初風靡全球的AlphaGo系統(tǒng)里面?! 〉菑陌l(fā)布到現(xiàn)在,Google也從未披露過TPU的具體細節(jié),更別說把這個產品對外出售?! 『芏郤oC從業(yè)者從谷歌的TPU中得出了一個結論,他們認為,機器學習需要定制化的架構。但在他們針對機器學習做芯片設計的時候,他們又會對芯片的架構感到懷疑和好奇。同時他們想知道業(yè)界是否已經有了一種衡量不同形態(tài)下深度神經網絡(DNN)性能的工具?! 」ぞ咭呀浀絹怼 EA聲稱,他們已經為幫推理機探索不同的硬件架
5、構做好了準備,他們已經開發(fā)出了一個叫做N2D2,的軟件架構。他們夠幫助設計者探索和聲稱DNN架構?!拔覀冮_發(fā)這個工具的目的是為了幫助DNN選擇適合的硬件”,Duranton說。到2017年第一季度,這個N2D2會開源。Duranton承諾?! 2D2的特點在于不僅僅是在識別精度的基礎上對比硬件,它還能從處理時間、硬件成本和能源損耗的多個方面執(zhí)行對比。因為針對不同的深度學習應用,其所需求的硬件配置參數(shù)都是不一樣的,所以說以上幾點才是最重要的,Duranton表示?! 2D2的工作原理 N2D2為現(xiàn)存的CPU、GPU和FPGA提供了一個參考標準?! ∵吘売嬎愕?/p>
6、障礙 作為一個資深的研究組織,CEA已經在如何把DNN完美的推廣到邊緣計算領域進行了長時間的深入研究。在問到執(zhí)行這種推進的障礙時,Duranton指出,由于功耗、尺寸和延遲的限制,這些“浮點”服務器方案不能應用。這就是最大的障礙。而其他的障礙包括了“大量的Mac、帶寬和芯片上存儲的尺寸”,Duranton補充說。 那就是說如何整合這種“浮點”方式,是最先應該被解決的問題?! uranton認為,一些新的架構是在所難免的,隨之而來的一些類似“spikecode”的新coding也是必然的?! 〗涍^CEA的研究指出,甚至二進制編碼都不是必須的。他們認為類似spik
7、ecoding這類的時間編碼在邊緣能夠迸發(fā)出更強大的能量?! pikecoding之所以受歡迎,是因為它能明確展示神經系統(tǒng)內的數(shù)據(jù)解碼。往深里講,就是說這些基于事件的的編碼能夠兼容專用的傳感器和預處理?! ∵@種和神經系統(tǒng)極度相似的編碼方式使得混合模擬和數(shù)字信號更容易實現(xiàn),這也能夠幫助研究者打造低功耗的硬件加速器?! EA也正在思考把神經網絡架構調整到邊緣計算的潛在可能。Duranton指出,現(xiàn)在人們正在推動使用‘SqueezeNet取替AlexNet。據(jù)報道,為達到同等精度,使用前者比后者少花50倍的參數(shù)。這類的簡單配置對于邊緣計算、拓撲學和降低Mac的數(shù)量