Remove ads
来自维基百科,自由的百科全书
推土機微架構[1][2][3](英語:AMD Bulldozer)是AMD繼K10微架構之後推出的中央處理器微架構[2],由 IBM Power4 的總工程師 Chuck Moore 操刀。該微架構主要應用於桌上型平台、伺服器平台乃至超級計算機的微處理器核心上。Bulldozer在歷經數次跳票後於2011年9月19日發布,其首發產品是核心代號為「Zambezi」的AMD FX。
產品化 | 2011年至2014年 |
---|---|
推出公司 | 超微半導體(AMD) |
設計團隊 | 超微半導體(AMD) |
生產商 | |
微架構 | CISC(x86-64) |
指令集架構 | AMD64/x86-64、x86、MMX、3DNow!、SSE(1、2、3、3S、4a、4.1、4.2、5(後拆分為XOP、FMA4、CVT16))、AVX、AES、NX bit、AMD-V等 |
製作工藝/製程 | 32奈米 |
核心數量 | 3至16(1.5模組至 8模組) |
一級快取 | 每整數排程單元16KB指令 每模組共享32KB指令 每模組64KB資料 |
二級快取 | 每模組2MB 16路 |
三級快取 | 全部模組共享8MB 16路 |
CPU主頻範圍 | 1.600 GHz 至 4.200 GHz |
HyperTransport速率 | 至 6.4 GT/s |
CPU插座 | |
封裝 | |
應用平台 | 伺服器、工作站、桌上型電腦、超級計算機 |
核心代號 |
|
使用的處理器型號 | |
上代產品 | AMD 10h處理器家族 |
繼任產品 | AMD Piledriver |
Bulldozer微架構從一個早期已擱置的微架構設計發展而來[3],主攻熱設計功耗為10瓦至125瓦的處理器平台。AMD預期認為,基於Bulldozer架構的處理器在實際應用中每個「推土機」(Bulldozer)核心每瓦效能可達到高效能計算(High-performance computing,HPC)的水準。屆時每個「推土機」核心會支援Intel絕大部分的指令集(包括SSE4.1、SSE4.2、AES、CLMUL以及AVX),以及AMD自有的指令集(包括由SSE5拆分而來的XOP、FMA4、CVT16)[4][5]。
2011年,AMD處理器開始匯入32奈米製程,推出APU(加速處理單元)新形態處理器,應用在桌上型電腦與筆記型電腦。超微的處理器架構有兩大關鍵的調整方向,依用途區分成兩種系列,其研發技術代號分別為Bulldozer與Bobcat。Bulldozer架構針對主流伺服器、桌上型電腦、筆電的應用,提供高存取效能與高負載多執行緒的架構,並選擇以APU組態的高延展性來連結圖形處理器;Bobcat主攻低耗電的超輕薄電腦應用。[6]
Bulldozer架構的處理器均使用格羅方德的32奈米HKMG SOI製程,重新使用類似DEC的多任務計算的設計。根據AMD的發布說明,「平衡專用和共享的處理器運算資源,來提供一個易於成倍提升計算效能的,高度緊湊的單晶片多核心的設計」。[7]換句話說,透過精簡處理器核心一些「冗餘」部分,輔以多核心/多執行緒的設計,超微希望籍此以更少的能耗,來充分發揮這些核心的特性和效能來提升整塊微處理器乃至整個平台的效能。AMD研究員Tim Fischer表示,Bulldozer採用全新的控制結構和運算單元,其效能體現於整數運算、浮點運算、L1快取、電源管理,和時脈產生器等……均是開發重點,主要意義在於降低功耗並提升單位功耗的效能。[8]
Bulldozer微架構的設計早在2003年已出現,由於AMD忙於K8微架構處理器的研發和推出而擱置,後來Bulldozer架構在該微架構的基礎上重新設計。可合併為1個256位的2個128位元並且可進行融合乘法運算的浮點運算單元,這個主要特性在2003年的設計中已出現;一個Bulldozer核心單元中,除了前述的浮點運算單元外,還擁有兩個整數排程運算單元,每個整數排程運算單元各自擁有4條管線(另外的讀取、解碼這兩級管線為兩個整數運算單元所共享);L1快取為每整數排程運算單元獨占,但L2快取則為兩個整數排程運算單元所共享。AMD稱這樣的一個單元為一個「模組」,一個16執行緒的Bulldozer處理器中包含8個這樣的模組,但一個模組並不會被辨認為一個物理核心,而是根據一個模組中的2個整數排程運算單元的數量辨認為兩個邏輯核心(即作業系統會將1個模組辨認為兩個邏輯核心/執行緒)。[9]一個「模組」包含2個邏輯核心,和Intel的超執行緒技術中1個物理核心被辨認為2個邏輯核心的做法似乎有類似之處,但事實上,兩者大相徑庭:AMD Bulldozer的「模組」為每條執行緒提供了各自的整數運算排程單元和一級指令快取,而英特爾的超執行緒則是兩條執行緒共享核心內所有可用的運算資源。[10]
基於Bulldozer微架構,32奈米SOI HKMG製程的處理器產品於2011年9月率先於桌上型平台上發布,是為核心代號「Zambezi」(Socket AM3+,4至8執行緒)之AMD FX系列;緊接著的是10月12日發布伺服器平台,核心代號「Interlagos」(Socket G34,16執行緒)、「Valencia」(Socket C32,4至8執行緒)之AMD Opteron系列[11][12]重新啟用了AMD少有的「FX」品牌。首發的桌面級產品FX-8150,將有四個Bulldozer模組;伺服器級微處理器,代號Interlagos,是由兩個包含4個Bulldozer模組的MCM、共八個Bulldozer模組所構成。[13]
基於Bulldozer微架構的桌上型平台處理器為AMD FX,於2011年9月19日正式上市[39]。使用GlobalFoundries 32nm SOI工藝,支援Turbo Core 2.0、Cool'n'Quiet、HyperTransport 3.1等技術。使用新的Socket AM3+(942)插座,支援DDR3-1866雙連結主記憶體,分為8核、6核、4核三種版本,主頻從2.8GHz~4.2GHz不等。配套晶片組為AMD 900系列晶片組。
Bulldozer與Fusion APU「Llano」兩個系列處理器的上市時間定案,分別是2011年9月19日跟2012年第一季。[40]最初有4個Bulldozer處理器在2011年9月19日發佈,分別是:四核心FX-4100、六核心FX-6100、八核心FX-8150、FX-8120。[41]三核心型號(1.5個模組,微軟KB2592546修補程式的定義為「1.5核心」)只供OEM市場。[42]
2011年11月14日,AMD宣佈推出針對伺服器等級效能的Opteron 6200與4200系列處理器(先前代號分別為:Interlagos與Valencia),主要將提供其擴充性,並且提供高出73%的記憶體頻寬,以對應更高階的虛擬化技術應用,同時在整體耗電量部份也讓每組核心減少原有一半,同時也讓主機使用空間減少三分之二,進而節省更多電力、空間等成本支出。[43][44]
AMD也同步透露2012年將加入全新AMD Opteron 3000伺服器平台,主要鎖定超高密度、超低功耗的1路網路主機代管(Web Hosting)、網路伺服器(Web Serving),以及微型伺服器(Microserver)等應用領域。其中將會先推出代號為「Zurich」的4至8核心架構的處理器系列,同樣採用推土機(Bulldozer)架構且對應AM3+插槽,並且預計將於2012上半年間出貨。[43][44]
首款基於Bulldozer微架構的消費級處理器AMD FX上市後,在微架構的設計上、效能上和能耗上飽受爭議。首發的頂級型號FX-8150,在倚重單執行緒的基準效能測試中,測試結果顯示FX-8150不僅落後於基於Nehalem、Sandy Bridge等微架構的Intel Core i系列,還不如基於K10微架構的AMD Phenom II系列;[45]不過在倚重多執行緒的效能測試中,結果顯示勉強可以追平Phenom II X6 1100T和Intel Core i7-2600K。縱觀各媒體的效能測試結果,FX-8150綜合效能強於Intel Core i5 2500K,而零售價格則在其之下,這個結果並沒給市場預期留下好印象。[46][47]在效能測試中,FX-8150在廠方預設時脈頻率下運作,無論待機抑或滿負荷運作,能耗比與Intel基於SandyBridge的處理器不相上下,但是進行較大幅度的超頻後,FX-8150儘管效能提昇明顯但處理器會變得極其耗電,能耗比變得相當低下。[48][49][50][51]
Tom's Hardware的網站評論認為,這種在多執行緒負載下仍然不如預期的效能表現,是由於目前Windows 7的執行緒和處理器核心一一對應的執行緒排程方式。他們指出,如果Windows首先把一條執行緒分配給一個Bulldozer模組,並在模組內分為兩條子執行緒以充分利用該模組內的整數排程運算單元,這將會效能最大化地使處理器同時處理四條執行緒。這種執行緒排程方式和帶有超執行緒的Intel微處理器的類似——Windows 7會在利用邏輯核心(超執行緒得到的)前把執行緒安排至物理核心上。[52]
對於處理器在超頻狀態時誇張的功耗水平,業界相信由於格羅方德的32奈米SOI HKMG製程仍舊不成熟,這個導致了處理器核心在更高時脈下運作時,漏電現象嚴重,使耗電量飆升以及核心發熱量大增。[53][54]而且有效能測評指出,AMD為壓低FX系列的功耗,有意壓低部分型號處理器的最高工作溫度,而這個溫度的設定值,實際還低於處理器在預設時脈頻率下滿負荷運作時的最高溫度,這樣一來在處理器過熱保護機制下,效能受到了不小的影響,從而使處理器效能不如預期。[55]
而AMD FX的較低階的型號中,FX-4100系列與Intel Core i3系列之間的比較以及FX-6100系列與Intel Core i5系列(Core i5 2500K除外)之間的比較中,除了某些倚重單執行緒的應用程式和基準效能測試項目以外,其餘的差距不大。不過功耗方面仍然有些偏高,尤其是超頻以後功耗仍然大幅增加。[56][57][58][59]
2011年10月13日,AMD在其官方部落格中回應了AMD FX系列處理器的效能、功耗表現不如市場預期的問題,除了指出由於微架構不同於以往的x86處理器的微架構,現行的應用程式以及基準效能測試程式沒有對Bulldozer微架構的特點進行充分優化,以至效能不如預期以外,也承認FX-8150效能不濟的事實:不少效能測試成績不如Intel的Core i7-2600K/2700K,甚至比不過AMD上一代的消費級頂級產品Phenom II X6 1100T。AMD同時表示,在2012年以後的發展規劃中,將提升Bulldozer微架構的效能,並降低功耗,目標是每一瓦電功率的效能提升10%至15%。格羅方德也表示繼續改進其32奈米SOI HKMG製程。[45][60]根據目前一些基於AMD Piledriver微架構的AMD Fusion(核心代號「Trinity」)的工程樣品的效能測試,結果顯示和AMD的預期效能一致。[61][62]
AMD於2011超級電腦展(Supercomputing 2011)上,宣布基於Bulldozer微架構的新款AMD Opteron 6200系列處理器已被HPCwire雜誌的編輯與讀者評選為2012年最受矚目的五款新產品之一,並被美國國家科學基金會(National Science Foundation)的Blue Waters計畫採用,將在伊利諾州的國家超級電腦應用中心(NCSA)建置此部超級電腦。[63]
超過235部,搭載近5萬顆AMD Opteron 6200系列處理器的Cray XE6機櫃,使Blue Waters超級電腦能提供超過每秒千兆次(petaflop)的充裕效能,在各種現象研究上的獲得突破性進展,包括:宇宙大爆炸(Big Bang)之後的演進、龍捲風的形成、病毒侵入細胞的機制,與其他眾多科學工程方面的應用。
2012年12月,搭載18,688顆8模組16核心的AMD Opteron 6274為任務分配單元,18,688顆NVIDIA Tesla運算加速卡(GK110通用圖形處理器)的泰坦超級電腦以17.59petaFLOPS的記錄榮登TOP500第一名,Green500(超級電腦效能功耗比前500強)第三名。[64][65]
2011年12月16日,微軟發布了KB2592546[66],即傳說中的推土機執行緒排程修補程式。而當天上午微軟就已經撤下了修補程式,對於這一點BSN網站[67]聯絡了微軟和AMD,得到了AMD方面的官方回應:
“ | AMD表示對於微軟突然發布這一形式的修補程式感到很驚訝,因為修補程式根本還沒有完成。推土機Windows 7/Windows Server 2008 R2作業系統的執行緒排程修補程式分為兩個部分,微軟昨天發布的只是第一個。[68]
AMD稱自己也不相信使用者能從單獨第一部分的修補程式中得到好處,原本的修補程式發布計劃是在2012年第一季度時才能看到推土機在Win7/Server 2008 R2最佳化後的效能表現。[68] |
” |
——Theo Valich,Bright Side Of News |
微軟在KB2592546之後,針對以Win7、Windows Server 2008 R2的電腦為基礎,進行最佳化。目前,AMD推土機處理器比預期的慢。因為在該兩種作業系統的執行緒邏輯,只對同步多執行緒(Simultaneous Multithreading, SMT)的排程特色進行優化,而沒對叢集多執行緒(CMT,Clustered Multithreading)一類的多執行緒設計的處理器進行特別優化,來讓效能最有效地運行。[67][52][69]
後來完整版的修補程式(KB2646060以及KB2645594更新檔)發布,不少效能測試結果顯示這些效能優化修補程式效用有限,無論是伺服器平台還是桌面平台,最多僅在某些項目上有15%的效能增長。[69]
2012.09.21 AMD的驅動程式已有內建修補無需安裝微軟的修正程式
AMD全球副總裁暨終端產品事業群總經理Chris Cloran表示,等級最高的FX-8150八核心處理器,在2011年8月31日,由AMD團隊超頻達到8.429GHz,超越同廠處理器先前的被「Team AMD FX」締造的8.308 GHz成績,榮登金氏世界紀錄「最高時脈的電腦處理器」。[70][71]
AMD在2011年發布2012年的財政預算以及2012年的產品路線圖時宣布,在2012年的第三季度發布Bulldozer微架構的改進版Piledriver。首批基於Piledriver的處理器是核心代號「Trinity」的AMD A系列處理器(APU)行動版本和電腦版本;新FX和Opteron在2012年9月發布。[72][73]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.