Nvidia與ARM共同合作打造AI芯片專用IP.doc

Nvidia與ARM共同合作打造AI芯片專用IP.doc

ID:27499644

大?。?60.50 KB

頁數(shù):9頁

時間:2018-12-04

Nvidia與ARM共同合作打造AI芯片專用IP.doc_第1頁
Nvidia與ARM共同合作打造AI芯片專用IP.doc_第2頁
Nvidia與ARM共同合作打造AI芯片專用IP.doc_第3頁
Nvidia與ARM共同合作打造AI芯片專用IP.doc_第4頁
Nvidia與ARM共同合作打造AI芯片專用IP.doc_第5頁
資源描述:

《Nvidia與ARM共同合作打造AI芯片專用IP.doc》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫

1、Nvidia與ARM共同合作打造AI芯片專用IP  一年一度的GTC至今已經(jīng)迎來了第十個年頭,雖然它每年或多或少的給網(wǎng)友一些“失望”,但它也終究是代表著GPU行業(yè)的高水平技術(shù)大會。那么,今年的GTC大會,英偉達又給業(yè)界帶來了哪些驚喜呢?  日前,英偉達公司創(chuàng)始人兼首席執(zhí)行官黃仁勛宣布了該公司在芯片、AI平臺、自動駕駛上的一系列新動作?!   ∫?、光線追蹤(ray-tracing)  開場介紹的第一個項目就是英偉達在前不久GDC上發(fā)布的NVIDIARTX光線追蹤技術(shù)(ray-tracing),這項技術(shù)是英偉達耗時10年打

2、造的,能夠提供電影級畫質(zhì)的實時渲染,渲染出逼真的反射、折射和陰影畫面,幾乎與真實世界的照片或視頻很難區(qū)分開來?,F(xiàn)場展示的視頻片段就是用光線追蹤技術(shù)實時渲染的,而且并不需要一個超級強大的超算電腦,只需要一臺DGX-Station?! ≡谡鎸嵤澜缰校覀兛吹降?D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術(shù)則是反過來,通過從我們的眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應(yīng)用到場景的3D模型中。    可想而知,這種技術(shù)的計算量非常

3、大,一般渲染復(fù)雜的特殊效果可能需要花上幾天甚至幾周的時間,所以此前該項技術(shù)一直僅限于高成本的電影制作中?! 〔贿^,目前,隨著GPU性能日益強悍,能夠支持光線追蹤的電腦也越來越多,通過Volta架構(gòu)的GPU配合英偉達的RTX技術(shù),產(chǎn)品設(shè)計師、游戲設(shè)計師、建筑師們能夠在幾秒內(nèi)即可生成逼真的產(chǎn)品模型。二、新版QuadroGV100,首次采用Volta架構(gòu)  QuadroGV100具有32GB內(nèi)存,且可借助NVIDIANVLink2互聯(lián)技術(shù),通過并聯(lián)兩塊QuadroGPU擴展至64GB,在所有適用于此類應(yīng)用的平臺中其性能最高。

4、  在性能方面,GV100基于NVIDIAVoltaGPU架構(gòu),可提供每秒7.4萬億次浮點運算的雙精度性能、每秒14.8萬億次浮點運算的單精度性能、以及每秒118.5萬億次浮點運算的深度學(xué)習(xí)性能。NVIDIARTX內(nèi)置的NVIDIAOptiXAI-denoiser可實現(xiàn)實時的AI去噪,英偉達表示且其性能相當(dāng)于采用CPU時的100倍。    三、醫(yī)療圖像處理超級電腦Clara  黃仁勛在現(xiàn)場推出了第一款專用于醫(yī)療圖像處理的超級電腦Clara,它能夠支持CUDA、CUDNN、TensorRT、OGL、RTX技術(shù)?! ≡诂F(xiàn)場

5、,黃仁勛展示了一個醫(yī)療圖像實時處理的影像片段。這個段影像是用十幾年的超聲波老設(shè)備拍攝而成,本來只能看到2D的黑白圖像。然而當(dāng)數(shù)據(jù)傳進Clara后,配合人工智能軟件,可以在2D圖像中分析出3D的腔膛形狀(圖中紅色部分)。因此,醫(yī)院可以在現(xiàn)有醫(yī)療設(shè)備上直接接入這臺電腦。    目前,英偉達正在和眾多醫(yī)療廠商合作,除了GE通用電氣、三星電子等大廠外,還有像圖瑪深維、推想科技等AI醫(yī)療創(chuàng)業(yè)公司?! ∷?、新版TensorRT推理軟件TensorRT4,并將TensorRT集成至谷歌的TensorFlow框架。  這是一款可編程應(yīng)

6、用平臺(ProgrammableInferencePlatform),當(dāng)你將一個神經(jīng)網(wǎng)絡(luò)訓(xùn)練好了之后,可以通過TensorRT可編程平臺,簡便快捷地將這個訓(xùn)練好了的神經(jīng)網(wǎng)絡(luò)部署(Deploy)到英偉達的GPU上?! ⌒掳鎀ensorRT4能夠支持INT8和FP16精度運算,能夠?qū)?shù)據(jù)中心的功耗降低70%?! 《遥ミ_還與谷歌進行了深度合作,將TensorRT整合進如今最廣泛應(yīng)用的AI開源框架谷歌TensorFlow1.7中。而且現(xiàn)在還能夠加速圖像、視頻、語言、NLP等AI應(yīng)用。  英偉達表示,TensorRT4可用

7、于快速優(yōu)化、驗證及部署在超大規(guī)模數(shù)據(jù)中心、嵌入式與汽車GPU平臺中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。相比CPU,針對計算機視覺、神經(jīng)網(wǎng)絡(luò)機器翻譯、自動語音識別、語音合成與推薦系統(tǒng)等常見應(yīng)用,該軟件最高可將深度學(xué)習(xí)推理的速度加快190倍。而且為了進一步精簡開發(fā),英偉達與谷歌的工程師已將TensorRT集成至TensorFlow1.7,使得在GPU上運行深度學(xué)習(xí)推理應(yīng)用更加容易?! ∥濉I平臺新進展  如同往屆,黃仁勛對英偉達AI平臺做了介紹,公布了其中的一系列重要進展,包括全新TeslaV10032GBGPU的2倍內(nèi)存、革命性的NV

8、Switch結(jié)構(gòu)、以及全面的軟件堆棧推動性能提升、深度學(xué)習(xí)工作站DGX-2成為首款性能高達每秒2千萬億次浮點運算的深度學(xué)習(xí)系統(tǒng)、發(fā)布深度學(xué)習(xí)引擎TensorRT4等。英偉達表示,相較于六個月前發(fā)布的上一代產(chǎn)品DGX-1,其深度學(xué)習(xí)工作負載性能實現(xiàn)了10倍提升?! ≡诖髸?,黃仁勛宣布,新版的TeslaV100內(nèi)存擴容了一倍。「5年

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。