如何使用FPGA加速機器學習算法.doc

如何使用FPGA加速機器學習算法.doc

ID:27872830

大?。?41.00 KB

頁數(shù):3頁

時間:2018-12-06

如何使用FPGA加速機器學習算法.doc_第1頁
如何使用FPGA加速機器學習算法.doc_第2頁
如何使用FPGA加速機器學習算法.doc_第3頁
資源描述:

《如何使用FPGA加速機器學習算法.doc》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在學術論文-天天文庫。

1、如何使用FPGA加速機器學習算法  當前,AI因為其CNN(卷積神經(jīng)網(wǎng)絡)算法出色的表現(xiàn)在圖像識別領域占有舉足輕重的地位。基本的CNN算法需要大量的計算和數(shù)據(jù)重用,非常適合使用FPGA來實現(xiàn)。上個月,RalphWitTIg(XilinxCTOOffice的卓越工程師)在2016年OpenPower峰會上發(fā)表了約20分鐘時長的演講并討論了包括清華大學在內(nèi)的中國各大學研究CNN的一些成果?! ≡谶@項研究中出現(xiàn)了一些和CNN算法實現(xiàn)能耗相關的幾個有趣的結論: ?、傧薅ㄊ褂闷螹emory; ?、谑褂酶〉某朔ㄆ鳎弧 、圻M行定點匹配:相

2、對于32位定點或浮點計算,將定點計算結果精度降為16位。如果使用動態(tài)量化,8位計算同樣能夠產(chǎn)生很好的結果?! ≡谘葜v中WitTIg還提到了CNN相關的兩款產(chǎn)品:CAPI-compaTIbleAlphaDataADM-PCIE-8K5PCIe加速卡和AuvizSystems提供的AuvizDNN(深度神經(jīng)網(wǎng)絡)開發(fā)庫?! DM-PCIE-8K5PCIe加速卡  AlphaDataADM-PCIE-8K5PCIe加速卡用于X86和IBMPower8/9數(shù)據(jù)中心和云服務,加速卡基于XilinxKintexUltraScaleKU11

3、5FPGA,支持XilinxSDAcess基于OpenCL、C/C++的開發(fā)和基于VivadoHLx的HDL、HLS設計流程?!   D1AlphaDataADM-PCIE-8K5PCIe加速卡  AlphaDataADM-PCIE-8K5PCIe加速卡片上帶32GBDDR4-2400內(nèi)存(其中16GB含ECC),雙通道SFP+支持雙通道10G以太網(wǎng)接入。提供包括高性能PCIe/DMA在內(nèi)的板級支持包(BSP)、OpenPOWER架構的CAPI、FPGA參考設計、即插即用的O/S驅動和成熟的API等設計資源。    AuvizD

4、NN開發(fā)庫  深度學習技術使用大量的已知數(shù)據(jù)來找出一組權重和偏置值來匹配預期結果。處理被稱之為訓練,訓練的結果是大量的模型,這一事實促使工程師們尋求使用GPU之類的專用硬件來進行訓練和分類計算?! ‰S著未來數(shù)據(jù)量的巨幅增長,機器學習將會搬到云端完成。這樣就急需一種既可以加速算法,又不會大規(guī)模增加功耗的處理平臺,在這種情況下,F(xiàn)PGA開始登場。  隨著一些列的先進開發(fā)環(huán)境投入使用,軟件開發(fā)工程師將他們的設計在XilinxFPGA上實現(xiàn)變得更加容易。AuvizSystems開發(fā)的AuvizDNN庫為用戶提供優(yōu)化的函數(shù)接口,用戶可以針

5、對不同的應用創(chuàng)建自定義的CNN。這些函數(shù)可以方便的通過XilinxSDAcess這樣的集成開發(fā)環(huán)境調用。在創(chuàng)建對象和數(shù)據(jù)池后,就會調用函數(shù)創(chuàng)建每一個卷積層、然后是致密層,最后是softmax層,如下圖2所示?!   D2實現(xiàn)CNN的函數(shù)調用順序

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。