Remove ads
品牌 来自维基百科,自由的百科全书
安騰(英語:Itanium),是英特爾安騰架構(通常稱之為IA-64)的64位元處理器。英特爾推出了兩個安騰的家族:其一是安騰,另一個是安騰2。在2007年11月1日,安騰2的家族又再一次稱為安騰。該處理器的市場定位是在於企業伺服器與高效能運算系統。該架構由惠普創始,後來則是惠普與英特爾共同開發。
此條目翻譯品質不佳。 |
安騰的微架構是徹底的不同於其他英特爾處理器採用的x86(包含x86-64)架構。這個架構是建基於顯性的指令並行,由編譯器來決定哪些指令並行處理。這種方式允許處理器在每個週期最多可以執行6個指令。與超純量架構的不同點,安騰在並行處理中並沒有複雜的線路來判斷指令依賴性,所以編譯器必須要在編譯的時候就已經處理妥當。
在一系列的拖延開發進度後,第一款安騰於2001年推出,效能更強的安騰處理器在之後則是有週期性的持續推出。採用安騰處理器的製造商之中,以惠普的製造量最多。在2007年,安騰在企業界系統採用的架構之中是位於第四名,而前三名則是x86-64、IBM POWER與SPARC。英特爾於2007年11月推出最新的安騰處理器為Montvale核心,2012年推出安騰9500(Poulson)。[1]2017年推出最後一代Itanium處理器,但是在技術上較同時代Xeon低級,且停止開發Itanium。
在1989年,惠普認為RISC架構將來會遇到每週期只能執行一個指令的瓶頸。而惠普的研究員在研究一個稱之為顯式並行指令運算(EPIC)的新架構,該架構允許處理器在一個週期內執行多條指令。EPIC是一種超長指令字(VLIW)架構,每個這種指令即包含多條小指令。使用EPIC技術後,編譯器就能決定讓這些小指令同時執行於單一週期,因此處理器能夠簡單的執行這些指令而不需要很複雜的架構去決定哪些指令能夠並行執行[2]。[3]
惠普認為它對個別企業系統公司不具有足夠的成本效益來自行開發自己的處理器,所以惠普在1994年與英特爾結為合作夥伴來開發EPIC為基礎的IA-64架構。而英特爾預測IA-64微處理器將會被使用多數的企業系統製造業採用而給予大量的開發資源。在1998年,惠普與英特爾發表共同的大規模合作開發的成品,內部代號為Merced。[3]
在開發期間,英特爾、惠普還有工業分析家預測IA-64將會支配伺服器、工作站、高階電腦,甚至取代RISC與CISC架構的所有既有產品。此預測導致Compaq與Silicon Graphics決定放棄Alpha與MIPS架構的未來開發計畫而偏愛轉移至IA-64架構。[4]
數個集團分別開始為該架構開發作業系統,包含Microsoft Windows、Linux與Unix的衍生版本像是HP-UX、Solaris、Tru64 UNIX與Project Monterey[5](後三者在進入市場之前就已被取消)。在1997年發現IA-64架構與該編譯器的開發難度比預期還要高,所以Merced的推出時間就一再順延。[6]該技術困難包含需要非常大量的電晶體才能處理超長指令與大量快取。在該架構的專案還有一些結構性的問題,在兩部分的整合團隊使用不同的演算法而有些微不同的優先度。自從第一顆EPIC架構的處理器Merced推出後,開發團隊也陸續遭遇更多之前未預料到的問題。除此之外,EPIC的概念依賴於編譯器的處理能力,而之前完全沒有實作過,所以許多未預測到的研究也出現。
英特爾在1999年10月4日發表該處理器的官方名稱安騰。[7]幾小時之後觀察家指出該處理器參考Itanic,[8]源自於Titanic,在1912年沉沒的號稱「不可能」沉沒的遠洋郵輪。不少評論媒體暗示安騰像是個大白象耗資億元的產物卻無法達到既定效能與銷售量。但此時RISC與CISC的架構長足的增強超純量的效能,能夠不使用EPIC的技術來破除單一週期只能執行一個指令的魔咒。
第一代安騰在2001年6月推出,但是卻不優於同時代的RISC與CISC處理器。安騰與x86的低階伺服器(小於4 CPU的系統)競爭,還有跟高階的IBM POWER架構與SPARC架構競爭市場。而英特爾重新定位安騰指向高階商務與高效能運算系統,嘗試去複製x86架構中非常成功的橫向市場發展(單一架構,多個系統製造廠)。不過卻被侷限在業界不想更換惠普製造的PA-RISC與Alpha,還有SGI製MIPS架構的高效能運算系統。因為當x86架構切入商用市場上,POWER與SPARC架構還算是很強健的。以預算為主的考量,x86在商用運算的橫向發展中是非常優秀的選擇。惠普與英特爾此時發現安騰無法與其他系統相提並論,就在一年後就推出安騰2來取代舊有的安騰。由於缺乏足夠的產額、差勁的效能,還有高售價,第一代安騰只有售出幾千組系統。不過這些系統在開發安騰2的軟體時是相當有用的。不過既使如此,IBM還是有製造出搭載此處理器的超級電腦。[9]
英特爾有龐大的安騰指令集與微架構的紀錄檔案,[10]而且技術檔案也提供瀏覽。[11][6]該微架構在歷史上曾幾度更名。惠普稱之為EPIC,後來改為PA-WideWord,後來英特爾稱之IA-64,之後又改為安騰處理器架構(IPA),[12]在提出英特爾安騰架構之前,該架構通常稱為IA-64。這是明確且並行的64位元暫存器架構。基礎的資料長度為64個位元,並能提供定址,邏輯定址空間為264位元組。該架構並能提供分支預測與預測執行。它使用硬體暫存器更名結構而不是簡單的暫存器對映。這相同的結構也用於判斷允許並行執行迴圈。這些能力是可以被編譯器控制的:每個指令字包含許多此動作。這就是該架構的特點之一。
此架構提供128個整數暫存器、128個浮點數暫存器、64個單位元預測器與8個分支暫存器。而浮點數暫存器的長度高達82個位元而能夠提供精確的運算結果。
每個128位元的指令字就包含三個小指令,預讀機制可以在每個週期中從L1 快取中讀取兩個指令到管線。當編譯器能夠在這個機制上獲得最大優勢,處理器就能在每個週期中執行六條指令。該處理器在11個群組中有30個功能性執行單位。每一個單位能夠執行指令集中的特殊子集,除非為了等候資料中止執行,否則每個單位就會每個週期執行一個指令。且並不是在一個群組的所有單位執行指令集的相同子集,而是共同的指令能在多個單位中被執行。這些群組包括:
因此,編譯器能時常聚集指令進入同時能執行的六個的群組。因為浮點單位執行一次乘積累加運算,當應用程式需要將相加數值做乘積,一個浮點指令就能執行二個指令的工作:這在科學處理中非常常見。當這種情況發生後,處理器就能在每個週期執行四個指令(4 FLOPS)。比方來說,800 MHz的安騰理論運算能力為3.2 GFLOPS,然後最快的安騰2,時脈為1.67 GHz的運算能力則達6.67 GFLOPS。
安騰2處理器階層式的使用共享的快取。等級1(L1)有16KB的指令快取與16KB的資料快取。等級2(L2)是256KB的統一型(指令與資料共享)快取。L3也是統一型的快取,不過大小從1.5MB至24MB不等。在256KB的L2快取中包含了足夠的邏輯電路來處理訊號標就不需要使用到算術邏輯單元(ALU)。
主記憶體則是透過匯流排聯繫至晶片組來存取。安騰2的匯流排最初稱之為McKinley bus,不過現在通常直接稱之為安騰匯流排。該匯流排的速度會因為新處理器的發佈而顯著提升。匯流排在每個週期傳輸2×128個位元,所以200 MHz匯流排的傳輸率達6.4 GB/s,而533 MHz的匯流排的傳輸率則是高達17.056 GB/s。[13]
在2006年之前推出的安騰處理器一概支援IA-32架構來支援舊有的伺服器應用程式,但是與同世代的原生x86來比效能是相當糟糕的。而在2005年英特爾開發出IA-32 EL軟體模擬器來提供更好的效能。在Montecito,英特爾移除了IA-32的硬體支援。
雖然Montecito沒有IA-32的能力,但是英特爾也在增強了一些功能在這顆核心上。[14]該架構支援硬體多執行緒,也就是一顆處理器能夠處理兩個執行緒。當其中一個執行緒要去讀寫記憶體時,另一個執行緒就執行指令。英特爾為了區分在x86處理器的超執行緒,在安騰稱之為「稀疏執行緒」(Coarse multithreading)。稀疏執行緒搭配安騰架構所得的效能增進是顯而易見的。英特爾也在該核心上支援硬體的虛擬化技術。虛擬化技術能夠在效能損失降到最低時同時執行多個作業系統。除此之外Montecito也具備了分離式L2快取,新增專用的1 MB L2指令快取,原本256 KB的L2快取則是變成資料快取。
公司 | 最新產品 | |||
---|---|---|---|---|
名稱 | 始於 | 直到 | 伺服器名 | CPUs |
惠普 | 2001 | - | Integrity | 1-128 |
康柏 | 2001 | 2001 | Proliant 590 | 1-4 |
戴爾 | 2004 | 2005 | PowerEdge 7250 | 1-4 |
IBM | 2001 | 2005 | x455 | 1-16 |
富士通 | 2005 | - | PRIMEQUEST | 1-32 |
NEC | 2002 | - | Express5800 /1000 |
1-32 |
SGI | 2001 | now | Altix 4000 | 1-1024 |
日立 | 2001 | - | BladeSymphony 1000 |
1-8 |
Bull | 2002 | - | NovaScale | 1-32 |
Unisys | 2002 | - | ES7000/one | 1-32 |
在2007年,部分製造廠商提供搭載安騰2的系統,包含惠普,SGI、NEC、Fujitsu、Unisys、Hitachi與Groupe Bull。除此之外,英特爾也有提供機架[15]提供給系統組裝員建造安騰系統。惠普則是業界前四大伺服器製造廠中唯一一家提供安騰方案的系統供應商,超過80%的安騰2系統是由惠普製造出來的。在2006年第一季惠普售出多達7200組安騰系統。[16]左右系統的售價是取決於企業伺服器與技術性運算的規模,平均一組系統造價約200,000美元。一般的安騰系統會搭載8顆以上的處理器。
安騰的匯流排介面是靠晶片組來聯繫的。企業伺服器製造廠區分系統的不同點,是在於開發設計不同的晶片組來連結處理器到記憶體、內部連結還有週邊控制器。這些晶片組在每個系統架構的設計中是非常重要的。目前而言,安騰的晶片組有惠普、Fujitsu、SGI、NEC、Hitachi與Unisys分別開發。IBM與英特爾分別於2003與2002年也有推出晶片組,但是他們並沒有支援比較新的技術,像是DDR2或是PCI Express。[17]
為了讓更多的軟體可以執行在安騰上,英特爾支援開發安騰平台的有效的編譯器,特別是自身套件的編譯器英特爾Compiler。[18][19] GCC、[20][21] Open64與MS Visual Studio 2008(及後來版本)[22]也都能夠編譯出安騰的程式。直到2007年,安騰支援的作業系統有Windows Server 2003、好幾種的Linux版本(包括Debian、Red Hat與SUSE)、FreeBSD[23]、HP-UX、OpenVMS與惠普的NonStop。它也支援主機環境的GCOS還有一些IA-32的作業系統也能透過指令集模擬器在安騰執行。使用QuickTransit就能經由「動態位元轉換」讓IRIX(MIPS架構)與Solaris(SPARC架構)執行於安騰的Linux上。根據安騰解決方案聯盟指出,在2007年初有超過一萬個應用程式可以執行於安騰系統上,[24]但是昇陽對此數字保持懷疑態度。[25]而該協會也支援Gelato,一個安騰高效能運算使用者群組與開發者社群之園開放原始碼的安騰。[26]但到了後來,微軟和Red Hat等軟體廠商宣布不再開發Itanium作業系統/軟體,許多Linux發行版也不再推出Itanium版本。
安騰2主要是面向大型企業伺服器的市場,所以主要競爭對手如下:
綜觀安騰的歷史,相較於一般處理器的固定小數點運算效能,它具有相當優秀的浮點運算處理效能。這項優勢對高效能運算系統是很有幫助的,但是在大多數的企業伺服器的負載上是較不注重這方面的效能。
搭載安騰架構的電腦第一次出現在TOP500的超級電腦列表是在2001年11月。搭載著安騰2的超級電腦在該列表中最佳紀錄是在2004年6月的Thunder以Rmax為19.94TFLOPS獲得第二名。在2004年11月Columbia超級電腦以51.8TFLOPS的運算速度再次獲得第二名,而且直到2007年6月為止至少有一台超級電腦進入前十名。而在此名單中在2004年11月的名單中有高達16.8%的電腦是搭載安騰系列,而在2010年11月則是降到1%。[27]
安騰處理器在效能上顯現出長足的進步。Merced是實做對架構的概念。而McKinley顯著的提升快取的等級而且讓安騰能夠與其他架構平起平坐。Madison則是藉由轉移到130奈米製程,能夠增加快取大小來克服主要效能的瓶頸。Montecito使用的是90奈米製程,允許實作雙核心並且在能源效率上取得進步。Montvale加入了3個新功能:Core-level lockstep、demand-based switching與前端匯流排頻率提升到667 MHz。
內部代號 製程 |
推出時間 | 時脈 | L2 快取/ 每核心 |
L3 快取/ 每核心 |
前端匯流排 | 晶片數/ 每裝置 |
核心數/ 每晶片 |
瓦特/ 每裝置 |
附註 | |
---|---|---|---|---|---|---|---|---|---|---|
安騰 | ||||||||||
Merced 180奈米 |
2001-06 | 733 MHz | 96 KB | 2 MB* | 266 MHz | 1 | 1 | 116 | 外部L3快取 | |
2001-06 | 800 MHz | 96 KB | 4 MB* | 266 MHz | 1 | 1 | 130 | |||
安騰2 | ||||||||||
McKinley 180奈米 |
2002-07-08 | 900 MHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 130 | HW branchlong, on-die L3 cache | |
2002-07-08 | 1 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
Madison 130奈米 |
2003-06-30 | 1.3 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | ||
2003-06-30 | 1.4 GHz | 256 KB | 4 MB | 400 MHz | 1 | 1 | 130 | |||
2003-06-30 | 1.5 GHz | 256 KB | 6 MB | 400 MHz | 1 | 1 | 130 | |||
2003-09-08 | 1.4 GHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 130 | |||
2004-04 | 1.4 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
2004-04 | 1.6 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
Deerfield 130奈米 |
2003-09-08 | 1.0 GHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 62 | 低電壓 | |
Hondo 130奈米 |
2004-Q1 | 1.1 GHz | 256 KB | 4 MB | 400 MHz | 2 | 1 | 260 | 32 MB L4快取 | |
Fanwood 130奈米 |
2004-11-08 | 1.6 GHz | 256 KB | 3 MB | 533 MHz | 1 | 1 | 130 | ||
2004-11-08 | 1.3 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 62? | 低電壓 | ||
Madison 9M 130奈米 |
2004-11-08 | 1.6 GHz | 256 KB | 9 MB | 400 MHz | 1 | 1 | 130 | ||
2005-07-05 | 1.67 GHz | 256 KB | 6 MB | 667 MHz | 1 | 1 | 130 | |||
2005-07-18 | 1.67 GHz | 256 KB | 9 MB | 667 MHz | 1 | 1 | 130 | |||
Montecito 90奈米 |
2006-07-18 | 1.4 GHz | 256 KB+ 1 MB |
12 MB | 400 MHz | 1 | 2 | 104 | 虛擬化技術、 多執行緒、 沒有硬體IA-32支援 | |
2006-07-18 | 1.6 GHz | 256 KB+ 1 MB |
12 MB | 533 MHz | 1 | 2 | 104 | |||
安騰2 9000系列 | ||||||||||
Montecito 90奈米 |
2006-07-18 | 1.4 GHz | 256 kB (D)+ 1 MB (I) |
6-24 MB | 400 MHz | 1 | 2 | 104 | Virtualization, Multithread, no HW IA-32 | |
1.6 GHz | 533 MHz | |||||||||
安騰2 9100系列 | ||||||||||
Montvale 90奈米 |
2007-10-31 | 1.42–1.66 GHz | 256 kB (D)+ 1 MB (I) |
8-24 MB | 400–667 MHz | 1 | 1–2 | 75–104 | Core-level lockstep,按需切換技術 | |
安騰9300系列 | ||||||||||
Tukwila 65奈米 |
2010-02-08 | 1.33-1.73 GHz | 256 kB (D)+ 512 kB (I) |
10-24 MB | QPI,速率為4.8 GT/s | 1 | 2–4 | 130–185 | 新的核心間通訊方式, 快速通道互聯,代替了前端匯流排。睿頻加速 | |
安騰9500系列 | ||||||||||
Poulson 32奈米 |
2012-11-08 | 1.73-2.53 GHz | 256 kB (D)+ 512 kB (I) |
20-32 MB | QPI,速率為6.4 GT/s | 1 | 4–8 | 130–170 | Doubled issue width (from 6 to 12 instructions per cycle), Instruction Replay technology, Dual-domain hyperthreading |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.