資源描述:
《英特爾與MD的構(gòu)架分析.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、英特爾與AMD處理器系統(tǒng)架構(gòu)的分析、探討: 長(zhǎng)期以來(lái),我們討論計(jì)算機(jī)性能總是將注意力放在各個(gè)子系統(tǒng)的技術(shù)參數(shù)上。例如微處理器的速度、內(nèi)存規(guī)范、用何種等級(jí)的GPU等,而沒(méi)有意識(shí)到這些部件的協(xié)同效率會(huì)對(duì)系統(tǒng)產(chǎn)生怎樣的影響,對(duì)于系統(tǒng)連接的探討也僅限于總線技術(shù)層面。這種慣有的模式導(dǎo)致了人們對(duì)計(jì)算平臺(tái)的技術(shù)水準(zhǔn)難以產(chǎn)生明確的認(rèn)知,同時(shí)也產(chǎn)生了一個(gè)概念上的模糊空間,讓用戶在廠商的宣傳中無(wú)所適從。本文所要探討的對(duì)象便在于此:計(jì)算機(jī)的連接架構(gòu)?! ∫惠v法拉利跑車可以輕松達(dá)到300公里以上的時(shí)速,但在普通公路上它卻可能無(wú)法超過(guò)80公里英特爾與AMD處理器系統(tǒng)架構(gòu)的分析、探討:
2、 長(zhǎng)期以來(lái),我們討論計(jì)算機(jī)性能總是將注意力放在各個(gè)子系統(tǒng)的技術(shù)參數(shù)上。例如微處理器的速度、內(nèi)存規(guī)范、用何種等級(jí)的GPU等,而沒(méi)有意識(shí)到這些部件的協(xié)同效率會(huì)對(duì)系統(tǒng)產(chǎn)生怎樣的影響,對(duì)于系統(tǒng)連接的探討也僅限于總線技術(shù)層面。這種慣有的模式導(dǎo)致了人們對(duì)計(jì)算平臺(tái)的技術(shù)水準(zhǔn)難以產(chǎn)生明確的認(rèn)知,同時(shí)也產(chǎn)生了一個(gè)概念上的模糊空間,讓用戶在廠商的宣傳中無(wú)所適從。本文所要探討的對(duì)象便在于此:計(jì)算機(jī)的連接架構(gòu)?! ∫惠v法拉利跑車可以輕松達(dá)到300公里以上的時(shí)速,但在普通公路上它卻可能無(wú)法超過(guò)80公里—道路不夠?qū)掗?、路上的行車和彎道太多等都是影響速度的因素。如果想讓它發(fā)揮應(yīng)有的潛能,那么
3、就應(yīng)該提供一個(gè)專用的賽道。其實(shí)對(duì)于計(jì)算機(jī)系統(tǒng),情況同樣如此。計(jì)算機(jī)系統(tǒng)的性能取決于微處理器、內(nèi)存、圖形、硬盤(pán)等子系統(tǒng),但即便配備頂尖的硬件,也未必能保證它們以最高的效率運(yùn)行。事實(shí)上,微處理器、內(nèi)存、圖形、硬盤(pán)只能決定自身的性能,它們的協(xié)作效率則由總線技術(shù)以及連接架構(gòu)所掌管—總線技術(shù)決定帶寬,類似于道路的寬敞以及平整程度,允許數(shù)據(jù)在上面跑得多快;連接架構(gòu)則定義了兩點(diǎn)間的連接方式,是直道或者彎道,路徑最短則最優(yōu),數(shù)據(jù)傳達(dá)的效率自然最高?! ≌l(shuí)在說(shuō)謊?“微架構(gòu)”與“連接架構(gòu)”的迷思 英特爾宣稱Core架構(gòu)遠(yuǎn)遠(yuǎn)領(lǐng)先于對(duì)手,理由是指令性能更優(yōu)越;AMD也聲稱K8架構(gòu)更科
4、學(xué),理由是更高效的內(nèi)存調(diào)用和更富彈性的連接。雙方的宣傳都給出足夠多的理由,并且有充分的技術(shù)解釋。對(duì)于這種各執(zhí)一詞的說(shuō)法,如果你對(duì)處理器技術(shù)稍有了解,便會(huì)知道雙方的論點(diǎn)都沒(méi)錯(cuò),但這就導(dǎo)致一個(gè)矛盾的問(wèn)題:究竟哪一個(gè)平臺(tái)在架構(gòu)上更具優(yōu)勢(shì)? 事實(shí)上,英特爾與AMD都沒(méi)有對(duì)公眾做出詳盡的解釋,他們給用戶留下一個(gè)模糊的認(rèn)知空間,回避了對(duì)方之長(zhǎng),宣揚(yáng)自身的優(yōu)點(diǎn)。公正的說(shuō)法應(yīng)該是:英特爾“Core”處理器的微架構(gòu)勝于對(duì)手,而AMDK8處理器家族則擁有更勝一籌的連接架構(gòu)。在這里,你會(huì)發(fā)現(xiàn)處理器架構(gòu)的概念一分為二:其一是“微架構(gòu)”,其二就是“連接架構(gòu)”,兩者是完全不同的概念,它們
5、從不同的角度影響著系統(tǒng)的性能與擴(kuò)展性?! 拔⒓軜?gòu)”通常是我們?cè)诤饬课⑻幚砥髟O(shè)計(jì)細(xì)節(jié)時(shí)最先接觸到的概念,它描述的是處理器最基礎(chǔ)的指令執(zhí)行部分,包括執(zhí)行的方式和運(yùn)算單元的構(gòu)成等—它就好比是法拉利跑車的引擎和車體框架,引擎決定了跑車所具有的速度,車體框架則讓跑車能夠在高速狀態(tài)下保持穩(wěn)定?! ≌?lái)說(shuō),處理器的微架構(gòu)通常都是非常穩(wěn)定的,壽命可在5年以上,而每一種微架構(gòu)往往都對(duì)應(yīng)著一個(gè)處理器家族—例如PentiumⅡ~PentiumⅢ都基于P6微架構(gòu),Pentium4家族基于Netburst微架構(gòu),現(xiàn)行的Core2Duo/Quad則基于“Core”微架構(gòu);AMDAthl
6、on64/X2、Opteron系列、Turion64/X2系列則隸屬于K8微架構(gòu)。 在x86領(lǐng)域,英特爾的Core微架構(gòu)無(wú)疑是佼佼者,它的特點(diǎn)在于具有四發(fā)射能力,即每個(gè)周期可以同時(shí)對(duì)4條x86指令進(jìn)行解碼,Core微架構(gòu)還結(jié)合了微指令融合和宏指令融合兩項(xiàng)優(yōu)化技術(shù),同時(shí)可以對(duì)多達(dá)5~6條指令進(jìn)行處理。顯然,在頻率相同的情況下,處理器的指令并行度越高,實(shí)際性能就越強(qiáng)。正因?yàn)檫@方面的優(yōu)勢(shì),Core2Duo處理器才能夠在較低的頻率下保有超越高頻Pentium4的卓越性能?! ∠啾戎?,AMDK8微架構(gòu)實(shí)際上只是承襲于K7體系,它同時(shí)只能對(duì)3條指令進(jìn)行解碼,也沒(méi)有任何指
7、令優(yōu)化技術(shù),K8與K7的主要區(qū)別僅在于集成內(nèi)存控制器和64位支持—若單單從指令執(zhí)行的角度來(lái)衡量,我們可以認(rèn)為K8與K7隸屬于相同的技術(shù)體系,兩者都只能同時(shí)解碼3條指令,并行能力遠(yuǎn)遜于英特爾的“Core”以及PentiumM家族所采用的“P6增強(qiáng)”微架構(gòu)?! 〉牵珹MDK8家族擁有更出色的連接架構(gòu)—微架構(gòu)決定了芯片的指令執(zhí)行效能,而連接架構(gòu)則決定系統(tǒng)輸送指令的能力。如開(kāi)篇所述,連接架構(gòu)就好比是道路,車再好道路不行也跑不快;同理,倘若指令輸送能力無(wú)法跟上,處理器的執(zhí)行性能再高都無(wú)濟(jì)于事,因?yàn)樗坏貌焕速M(fèi)很多的時(shí)間在等待上面,導(dǎo)致有效工作時(shí)間的減少(類似于堵車等待,
8、拖慢了平均速度)。AMD