amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)

ID：1471481

大?。?87.50 KB

頁(yè)數(shù)：4頁(yè)

時(shí)間：2017-11-11

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)_第1頁(yè)

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)_第2頁(yè)

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)_第3頁(yè)

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)_第4頁(yè)

資源描述：

《amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、AMD和NVIDIA的GPU特點(diǎn)及優(yōu)勢(shì)發(fā)表時(shí)間：2011-4-25?作者:熊東旭?來源:e-works關(guān)鍵字:?GPU?圖形處理器?AMDGPU?NVIDIAGPU?　　作為圖形工作站標(biāo)志性的配件，專業(yè)顯卡良好的抗鋸齒功能幫助圖形工作站處理復(fù)雜的三維模型，保證線條的光滑。除線條抗鋸齒功能，專業(yè)顯卡對(duì)重疊圖形、動(dòng)態(tài)光源、圖形剖切等操作的處理，與普通顯卡也有著非常大的不同。作為專業(yè)顯卡領(lǐng)域僅有的兩家廠商，AMD和NVIDIA的專業(yè)顯卡在性能和價(jià)格上都日益趨于同質(zhì)化，純粹的從性能和價(jià)格兩方面來討論兩家產(chǎn)品孰優(yōu)孰劣已不合適。為了更加深入的了解兩家廠商專業(yè)級(jí)顯卡產(chǎn)品的硬件特性，e-works將從

2、兩家廠商的GPU架構(gòu)著手來討論兩家產(chǎn)品的優(yōu)勢(shì)及不足?！　∫?、GPU與顯卡　　簡(jiǎn)單來說，GPU與顯卡的關(guān)系就好比CPU與主板的關(guān)系，主板有了CPU才有了動(dòng)力之源，利用CPU提供的動(dòng)能，主板才可以實(shí)現(xiàn)各種功能。同理，顯卡之所以能加速圖形圖像處理，也是因?yàn)镚PU為顯卡提供了強(qiáng)大的運(yùn)算能力。專業(yè)顯卡發(fā)展到今天，無論是AMD還是NVIDIA，功能上已經(jīng)日趨同質(zhì)化，NVIDIA專業(yè)顯卡能實(shí)現(xiàn)的功能，AMD也能實(shí)現(xiàn)，但從GPU運(yùn)算能力來講，兩家廠商還是有一定可比較性?！　《?、AMD與NVIDIA的GPU架構(gòu)　　對(duì)于像素的特點(diǎn)，相關(guān)的文章也討論的比較多。任何一個(gè)像素都包含著兩種不同的屬性信息，即色彩和

3、坐標(biāo)。色彩信息包括RGB三原色和一個(gè)信息通道Alpha；坐標(biāo)信息包括XYZ三維坐標(biāo)信息和一個(gè)重力元素W。為對(duì)像素完成一次色彩計(jì)算和坐標(biāo)轉(zhuǎn)換，GPU的頂點(diǎn)著色單元和像素著色單元從一開始就被設(shè)計(jì)成為一個(gè)周期內(nèi)具備4次運(yùn)算能力的邏輯運(yùn)算器，這便是4D矢量邏輯運(yùn)算器的由來?！　。?）AMD基于SIMD結(jié)構(gòu)的流處理器　　AMD的GPU采用的是SIMD架構(gòu)模式，SIMD即SingleInstructionMultipleData，單指令多數(shù)據(jù)，這種架構(gòu)能很好的對(duì)像素的色彩和坐標(biāo)所包含的四維數(shù)據(jù)進(jìn)行運(yùn)算。傳統(tǒng)的頂點(diǎn)單元和像素單元中的ALU都能在一個(gè)周期內(nèi)完成對(duì)4D矢量數(shù)據(jù)的運(yùn)算。因此，通常稱這種邏輯

4、運(yùn)算器為4DALU。圖1SIMD架構(gòu)　　圖1為SIMD架構(gòu)流處理器的運(yùn)算模式，通過唯一的指令發(fā)射端向所屬的ALU發(fā)送運(yùn)算需求，ALU在接收到運(yùn)算指令后開始并行計(jì)算。需要注意的是，4DSIMD架構(gòu)雖然很適合處理4D指令，但遇到1D指令的時(shí)候效率便會(huì)降為原來的1/4。此時(shí)的ALU，3/4的資源都被閑置。為了提高像素單元和頂點(diǎn)單元執(zhí)行1D2D3D指令時(shí)的資源利用率，從DirectX9時(shí)代開始，AMD的GPU通常采用1D+3D或2D+2DALU。這便是Co-issue技術(shù)。這種ALU對(duì)4D指令的計(jì)算時(shí)仍然效能與傳統(tǒng)的ALU相同，但當(dāng)遇到1D2D3D指令時(shí)效率則會(huì)高不少，例如如下指令：　　ADD

5、R0.xyz,R0,R1???　　//此指令是將R0,R1矢量的x,y,z值相加結(jié)果賦值給R0　　ADDR3.x,R2,R3?????　　//此指令是將R2R3矢量的w值相加結(jié)果賦值給R3　　對(duì)于傳統(tǒng)的4DALU，顯然需要兩個(gè)周期才能完成，第一個(gè)周期ALU利用率75%，第二個(gè)周期利用率25%。而對(duì)于1D+3D的ALU，這兩條指令可以融合為一條4D指令，因而只需要一個(gè)周期便可以完成，ALU利用率100%。但當(dāng)然，即使采用co-issue，ALU利用率也不可能總達(dá)到100%，這涉及到指令并行的相關(guān)性等問題，而且，更直觀的，上述兩條指令顯然不能被2D+2DALU一周期完成，而且同樣，兩條2D

6、指令也不能被1D+3DALU一周期完成。傳統(tǒng)GPU在對(duì)非4D指令的處理顯然不是很靈活。圖2AMD5DALU流處理器　　為進(jìn)一步改善流處理器的運(yùn)算性能，AMD推出了代號(hào)為R600的顯卡核心，該GPU采用了統(tǒng)一渲染架構(gòu)，采用了5路超標(biāo)量運(yùn)算單元，通過在流處理器內(nèi)部集成5個(gè)1D標(biāo)量運(yùn)算單元，每一個(gè)流處理器都能進(jìn)行1+1+1+1+1或1+4或2+3等方式搭配運(yùn)算。同時(shí)，為提升ALU運(yùn)算效率，AMD采用了VLIW體系設(shè)計(jì)，將多個(gè)短指令合并為一個(gè)超長(zhǎng)指令交給流處理器去執(zhí)行?！　?duì)于下述指令：　　ADDR0.xyz,R0,R1?//3D　　ADDR4.x,R4,R5?//1D　　ADDR2.x,R2

7、,R3???//1D　　R600也可以將其集成為一條VLIW指令在一個(gè)周期完成。　　綜上：R600的架構(gòu)可以用64X5D的方式來描述。圖3R600流處理器　　R600采用SIMD架構(gòu)，擁有64個(gè)SP，每個(gè)SP中有5個(gè)1DALU，因而通常聲稱R600有320個(gè)PSU，每個(gè)SP只能處理一條指令，ATI采用VLIW體系將短指令集成為長(zhǎng)的VLIW指令來提高資源利用率，例如5條1D標(biāo)量指令可以被集成為一條VLIW指令送入SP中在一個(gè)周期完成。（2）NVI

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 / 4



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè)，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請(qǐng)放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)

amd和nvidia的gpu特點(diǎn)及優(yōu)勢(shì)

相關(guān)文章

相關(guān)標(biāo)簽