Nvidia與ARM共同合作打造AI芯片專用IP.doc

ID：27499644

大?。?60.50 KB

頁數(shù)：9頁

時間：2018-12-04

資源描述：

《Nvidia與ARM共同合作打造AI芯片專用IP.doc》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。

1、Nvidia與ARM共同合作打造AI芯片專用IP　　一年一度的GTC至今已經(jīng)迎來了第十個年頭，雖然它每年或多或少的給網(wǎng)友一些“失望”，但它也終究是代表著GPU行業(yè)的高水平技術(shù)大會。那么，今年的GTC大會，英偉達又給業(yè)界帶來了哪些驚喜呢？　　日前，英偉達公司創(chuàng)始人兼首席執(zhí)行官黃仁勛宣布了該公司在芯片、AI平臺、自動駕駛上的一系列新動作?！　　　∫?、光線追蹤（ray-tracing）　　開場介紹的第一個項目就是英偉達在前不久GDC上發(fā)布的NVIDIARTX光線追蹤技術(shù)（ray-tracing），這項技術(shù)是英偉達耗時10年打

2、造的，能夠提供電影級畫質(zhì)的實時渲染，渲染出逼真的反射、折射和陰影畫面，幾乎與真實世界的照片或視頻很難區(qū)分開來?，F(xiàn)場展示的視頻片段就是用光線追蹤技術(shù)實時渲染的，而且并不需要一個超級強大的超算電腦，只需要一臺DGX-Station?！　≡谡鎸嵤澜缰校覀兛吹降?D物體被光源照亮，且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術(shù)則是反過來，通過從我們的眼睛（觀景式照相機）反向追蹤光線捕捉這些效果，通過追蹤2D視表面上每個像素的光線的路徑，并應(yīng)用到場景的3D模型中。　　　　可想而知，這種技術(shù)的計算量非常

3、大，一般渲染復(fù)雜的特殊效果可能需要花上幾天甚至幾周的時間，所以此前該項技術(shù)一直僅限于高成本的電影制作中?！　〔贿^，目前，隨著GPU性能日益強悍，能夠支持光線追蹤的電腦也越來越多，通過Volta架構(gòu)的GPU配合英偉達的RTX技術(shù)，產(chǎn)品設(shè)計師、游戲設(shè)計師、建筑師們能夠在幾秒內(nèi)即可生成逼真的產(chǎn)品模型。二、新版QuadroGV100，首次采用Volta架構(gòu)　　QuadroGV100具有32GB內(nèi)存，且可借助NVIDIANVLink2互聯(lián)技術(shù)，通過并聯(lián)兩塊QuadroGPU擴展至64GB，在所有適用于此類應(yīng)用的平臺中其性能最高。

4、　　在性能方面，GV100基于NVIDIAVoltaGPU架構(gòu)，可提供每秒7.4萬億次浮點運算的雙精度性能、每秒14.8萬億次浮點運算的單精度性能、以及每秒118.5萬億次浮點運算的深度學(xué)習(xí)性能。NVIDIARTX內(nèi)置的NVIDIAOptiXAI-denoiser可實現(xiàn)實時的AI去噪，英偉達表示且其性能相當(dāng)于采用CPU時的100倍。　　　　三、醫(yī)療圖像處理超級電腦Clara　　黃仁勛在現(xiàn)場推出了第一款專用于醫(yī)療圖像處理的超級電腦Clara，它能夠支持CUDA、CUDNN、TensorRT、OGL、RTX技術(shù)?！　≡诂F(xiàn)場

5、，黃仁勛展示了一個醫(yī)療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設(shè)備拍攝而成，本來只能看到2D的黑白圖像。然而當(dāng)數(shù)據(jù)傳進Clara后，配合人工智能軟件，可以在2D圖像中分析出3D的腔膛形狀（圖中紅色部分）。因此，醫(yī)院可以在現(xiàn)有醫(yī)療設(shè)備上直接接入這臺電腦。　　　　目前，英偉達正在和眾多醫(yī)療廠商合作，除了GE通用電氣、三星電子等大廠外，還有像圖瑪深維、推想科技等AI醫(yī)療創(chuàng)業(yè)公司?！　∷?、新版TensorRT推理軟件TensorRT4，并將TensorRT集成至谷歌的TensorFlow框架。　　這是一款可編程應(yīng)

6、用平臺（ProgrammableInferencePlatform），當(dāng)你將一個神經(jīng)網(wǎng)絡(luò)訓(xùn)練好了之后，可以通過TensorRT可編程平臺，簡便快捷地將這個訓(xùn)練好了的神經(jīng)網(wǎng)絡(luò)部署（Deploy）到英偉達的GPU上?！　⌒掳鎀ensorRT4能夠支持INT8和FP16精度運算，能夠?qū)?shù)據(jù)中心的功耗降低70%?！　《遥ミ_還與谷歌進行了深度合作，將TensorRT整合進如今最廣泛應(yīng)用的AI開源框架谷歌TensorFlow1.7中。而且現(xiàn)在還能夠加速圖像、視頻、語言、NLP等AI應(yīng)用。　　英偉達表示，TensorRT4可用

7、于快速優(yōu)化、驗證及部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。相比CPU，針對計算機視覺、神經(jīng)網(wǎng)絡(luò)機器翻譯、自動語音識別、語音合成與推薦系統(tǒng)等常見應(yīng)用，該軟件最高可將深度學(xué)習(xí)推理的速度加快190倍。而且為了進一步精簡開發(fā)，英偉達與谷歌的工程師已將TensorRT集成至TensorFlow1.7，使得在GPU上運行深度學(xué)習(xí)推理應(yīng)用更加容易?！　∥濉I平臺新進展　　如同往屆，黃仁勛對英偉達AI平臺做了介紹，公布了其中的一系列重要進展，包括全新TeslaV10032GBGPU的2倍內(nèi)存、革命性的NV

8、Switch結(jié)構(gòu)、以及全面的軟件堆棧推動性能提升、深度學(xué)習(xí)工作站DGX-2成為首款性能高達每秒2千萬億次浮點運算的深度學(xué)習(xí)系統(tǒng)、發(fā)布深度學(xué)習(xí)引擎TensorRT4等。英偉達表示，相較于六個月前發(fā)布的上一代產(chǎn)品DGX-1，其深度學(xué)習(xí)工作負載性能實現(xiàn)了10倍提升?！　≡诖髸?，黃仁勛宣布，新版的TeslaV100內(nèi)存擴容了一倍。「5年

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 9



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

Nvidia與ARM共同合作打造AI芯片專用IP.doc

Nvidia與ARM共同合作打造AI芯片專用IP.doc

相關(guān)文章

相關(guān)標(biāo)簽