英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc

英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc

ID:28135291

大?。?62.50 KB

頁數:7頁

時間:2018-12-08

英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc_第1頁
英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc_第2頁
英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc_第3頁
英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc_第4頁
英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc_第5頁
資源描述:

《英偉達GPU 對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地.doc》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。

1、英偉達GPU對戰(zhàn)谷歌TPU,英偉達是否還能堅守陣地  英偉達一直占據著深度學習數據中心業(yè)務上的主導地位,特別是它的K40是最先應用于深度學習的首批GPU之一,在時代的發(fā)展過程中,之前一直沒有人可以撼動它的地位,如今,谷歌推出TPU,是否會給英偉達造成俱到的威脅?! ∫荒甑臅r間,股價增長兩倍以上,創(chuàng)始人成為《財富》雜志2017年度商業(yè)人物,這家公司就是風頭正勁英偉達(NVIDIA)。在多年的耕耘之后,英偉達的憑借著先發(fā)優(yōu)勢和快速迭代在AI時代迅速崛起。如今,英偉達的GPU幾乎壟斷了AI芯片市場,著實讓人眼紅。不過

2、,大部分公司都不希望自己的命脈掌控在別人手中,于是谷歌推出了TPU,然后其他公司紛紛效仿,開始研發(fā)類似的深度學習專用芯片。那么類似TPU這種的專用芯片真的能對英偉達的GPU產生威脅嗎?  近日,ARKInvest的分析師JamesWang撰文對這個問題進行了全面剖析,AI科技大本營對全文進行了不改變原意的翻譯,希望能給讀者,給整個行業(yè)一點啟發(fā)。  過去兩年間,深度學習的熱潮使英偉達的數據中心業(yè)務增長了五倍,同時也催生了行業(yè)競爭。截至2017年,以打造深度學習專用芯片為目標的創(chuàng)業(yè)公司已有十幾家。除此之外,Alph

3、abet(谷歌母公司)、英特爾、高通、蘋果等一票大型上市科技公司也在計劃進入深度學習芯片市場?!   ≡谌找婕觿〉母偁幭?,英偉達還能在深度學習芯片市場中保持領先地位嗎?哪個新來者最有可能獲得成功?  GPUvs.TPU  目前的競爭主要集中在TPU(張量處理單元)領域,這是一種用于加速張量運算的新型芯片,深度學習算法的核心工作負載就是張量運算。Alphabet、英特爾、WaveCompuTIng聲稱,TPU在執(zhí)行深度學習算法時要比GPU快十倍。對此差距的一種解釋是,GPU主要是為處理圖像而設計的,芯片中的很大一

4、部分執(zhí)行單元并不參與深度學習運算。以英偉達最新的VoltaGPU為例,在GPU核心(如下圖所示)中,只有右側的兩個張量核心(TensorCores)負責執(zhí)行深度學習運算,左側的執(zhí)行單元要么很少使用,要么不太適合進行深度學習運算。而新成立的深度學習創(chuàng)業(yè)公司造出的芯片則似乎完全由張量核心和晶載內存(on-chipmemory)組成。理論上,這種TPU在利用率和性能上要優(yōu)于GPU?!    〔贿^目前看來,實際情況并非如此。在研發(fā)深度學習芯片的十幾家公司中,只有谷歌和WaveCompuTIng擁有能夠工作的芯片,并正在

5、進行客戶測試。雖然谷歌宣稱自家的TPU在性能和能效的表現上要比GPU好很多,但是這一說法并沒有經過獨立驗證。谷歌的第二代“CloudTPU”的功率大概為200多瓦,和英偉達的GPU處在同一范圍內。而WaveCompuTIng表示它的3U深度學習服務器可以在40分鐘內訓練完AlexNet,比英偉達的P100DGX-1服務器快3倍。如果這是真的,當然令人印象深刻,不過按照WaveCompuTIng的說法,其TPU的處理速度本來要快1000倍。奇怪的是,這兩家公司生產的新芯片都沒有被廣泛地使用,這或許表明TPU的實際

6、表現并不如GPU?! PU之所以沒能超越GPU,英偉達的GPU架構進化得非??焓瞧渲械囊粋€重要原因。在經歷了四代GPU的迭代之后,英偉達將其深度學習芯片的架構效率提升了約10倍。下方的圖表顯示了各代GPU每秒鐘執(zhí)行100萬次深度學習運算所需晶體管的數量。需要的晶體管數量越少,架構的效率就越高。如果將所有芯片廠商的晶體管數量限制在同一水平,那么誰設計的架構效率最高,誰的性能就最好?!   ∮ミ_的K40是最先應用于深度學習的首批GPU之一,它每秒執(zhí)行100萬次運算需要使用1400個晶體管。其繼任者M40移除了深

7、度學習算法不需要的硬件(FP64單元),它只需1000個晶體管就能實現和K40同樣的性能。英偉達在之后推出的P40GPU上添加了對FP16指令添加的支持,使得P40的效能達到M40的兩倍。新推出的V100芯片在每個數據通道上添加了兩個專用張量核心,在架構效能上是P40的3倍。在過去幾年間,英偉達將其GPU的架構性能提升了大概10倍,這就是TPU到現在還無法替代GPU的主要原因?! ≤浖苤匾 【退愠鮿?chuàng)公司在深度學習硬件上可能占有優(yōu)勢,但是在軟件上英偉達依舊遙遙領先。和主要使用兩大API(DirectX和Ope

8、nGL)的制圖任務不同,深度學習算法的軟件框架有十幾種之多。而且每種框架都有自己的擁護者:谷歌使用TensorFlow;Facebook使用Pytorch和Caffe;微軟使用CNTK;百度使用PaddlePaddle。由于英偉達最先入場,它的產品支持以上提到的所有框架,而其競爭對手大部分都只支持支持TensorFlow和Caffe。  如果深度學習編程是圍繞一個領先的框架進行整合的,

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯系客服。
3. 下載前請仔細閱讀文檔內容,確認文檔內容符合您的需求后進行下載,若出現內容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯系客服處理。