安腾(英语:Itanium),是英特尔安腾架构(通常称之为IA-64)的64位处理器。英特尔推出了两个安腾的家族:其一是安腾,另一个是安腾2。在2007年11月1日,安腾2的家族又再一次称为安腾。该处理器的市场定位是在于企业服务器与高性能运算系统。该架构由惠普创始,后来则是惠普与英特尔共同开发。
此条目翻译品质不佳。 |
安腾的微架构是彻底的不同于其他英特尔处理器采用的x86(包含x86-64)架构。这个架构是建基于显性的指令并发,由编译器来决定哪些指令并发处理。这种方式允许处理器在每个周期最多可以执行6个指令。与超标量架构的不同点,安腾在并发处理中并没有复杂的线路来判断指令依赖性,所以编译器必须要在编译的时候就已经处理妥当。
在一系列的拖延开发进度后,第一款安腾于2001年推出,性能更强的安腾处理器在之后则是有周期性的持续推出。采用安腾处理器的制造商之中,以惠普的制造量最多。在2007年,安腾在企业界系统采用的架构之中是位于第四名,而前三名则是x86-64、IBM POWER与SPARC。英特尔于2007年11月推出最新的安腾处理器为Montvale核心,2012年推出安腾9500(Poulson)。[1]2017年推出最后一代Itanium处理器,但是在技术上较同时代Xeon低级,且停止开发Itanium。
历史
在1989年,惠普认为RISC架构将来会遇到每周期只能执行一个指令的瓶颈。而惠普的研究员在研究一个称之为显式并发指令运算(EPIC)的新架构,该架构允许处理器在一个周期内执行多条指令。EPIC是一种超长指令字(VLIW)架构,每个这种指令即包含多条小指令。使用EPIC技术后,编译器就能决定让这些小指令同时执行于单一周期,因此处理器能够简单的执行这些指令而不需要很复杂的架构去决定哪些指令能够并发执行[2]。[3]
惠普认为它对个别企业系统公司不具有足够的成本效益来自行开发自己的处理器,所以惠普在1994年与英特尔结为合作伙伴来开发EPIC为基础的IA-64架构。而英特尔预测IA-64微处理器将会被使用多数的企业系统制造业采用而给予大量的开发资源。在1998年,惠普与英特尔发表共同的大规模合作开发的成品,内部代号为Merced。[3]
在开发期间,英特尔、惠普还有工业分析家预测IA-64将会支配服务器、工作站、高阶电脑,甚至取代RISC与CISC架构的所有既有产品。此预测导致Compaq与Silicon Graphics决定放弃Alpha与MIPS架构的未来开发项目而偏爱转移至IA-64架构。[4]
数个集团分别开始为该架构开发操作系统,包含Microsoft Windows、Linux与Unix的派生版本像是HP-UX、Solaris、Tru64 UNIX与Project Monterey[5](后三者在进入市场之前就已被取消)。在1997年发现IA-64架构与该编译器的开发难度比预期还要高,所以Merced的推出时间就一再顺延。[6]该技术困难包含需要非常大量的晶体管才能处理超长指令与大量缓存。在该架构的项目还有一些结构性的问题,在两部分的集成团队使用不同的算法而有些微不同的优先度。自从第一颗EPIC架构的处理器Merced推出后,开发团队也陆续遭遇更多之前未预料到的问题。除此之外,EPIC的概念依赖于编译器的处理能力,而之前完全没有实现过,所以许多未预测到的研究也出现。
英特尔在1999年10月4日发表该处理器的官方名称安腾。[7]几小时之后观察家指出该处理器参考Itanic,[8]源自于Titanic,在1912年沉没的号称“不可能”沉没的远洋邮轮。不少评论媒体暗示安腾像是个大白象耗资亿元的产物却无法达到既定性能与销售量。但此时RISC与CISC的架构长足的增强超标量的性能,能够不使用EPIC的技术来破除单一周期只能执行一个指令的魔咒。
第一代安腾在2001年6月推出,但是却不优于同时代的RISC与CISC处理器。安腾与x86的低端服务器(小于4 CPU的系统)竞争,还有跟高阶的IBM POWER架构与SPARC架构竞争市场。而英特尔重新定位安腾指向高阶商务与高性能运算系统,尝试去复制x86架构中非常成功的横向市场发展(单一架构,多个系统制造厂)。不过却被局限在业界不想更换惠普制造的PA-RISC与Alpha,还有SGI制MIPS架构的高性能运算系统。因为当x86架构切入商用市场上,POWER与SPARC架构还算是很强健的。以预算为主的考量,x86在商用运算的横向发展中是非常优秀的选择。惠普与英特尔此时发现安腾无法与其他系统相提并论,就在一年后就推出安腾2来取代旧有的安腾。由于缺乏足够的产额、差劲的性能,还有高售价,第一代安腾只有售出几千组系统。不过这些系统在开发安腾2的软件时是相当有用的。不过既使如此,IBM还是有制造出搭载此处理器的超级计算机。[9]
架构
英特尔有庞大的安腾指令集与微架构的纪录文件,[10]而且技术文件也提供浏览。[11][6]该微架构在历史上曾几度更名。惠普称之为EPIC,后来改为PA-WideWord,后来英特尔称之IA-64,之后又改为安腾处理器架构(IPA),[12]在提出英特尔安腾架构之前,该架构通常称为IA-64。这是明确且并发的64位寄存器架构。基础的资料长度为64个比特,并能提供寻址,逻辑寻址空间为264字节。该架构并能提供分支预测与预测执行。它使用硬件寄存器更名结构而不是简单的寄存器映射。这相同的结构也用于判断允许并发执行循环。这些能力是可以被编译器控制的:每个指令字包含许多此动作。这就是该架构的特点之一。
此架构提供128个整数寄存器、128个浮点数寄存器、64个单比特预测器与8个分支寄存器。而浮点数寄存器的长度高达82个比特而能够提供精确的运算结果。
每个128位的指令字就包含三个小指令,预读机制可以在每个周期中从L1 缓存中读取两个指令到流水线。当编译器能够在这个机制上获得最大优势,处理器就能在每个周期中执行六条指令。该处理器在11个组群中有30个功能性执行单位。每一个单位能够执行指令集中的特殊子集,除非为了等候资料中止执行,否则每个单位就会每个周期执行一个指令。且并不是在一个组群的所有单位执行指令集的相同子集,而是共同的指令能在多个单位中被执行。这些组群包括:
- 六个一般的ALU、两个整数单位与一个移位单位
- 四个资料缓存单位
- 六个多媒体单位、两个平行移位单位、一个平行乘法器与一个组群计数器
- 两个浮点乘积累加器,两个“杂项的”浮点单位
- 三个分支单位
因此,编译器能时常聚集指令进入同时能执行的六个的组群。因为浮点单位执行一次乘积累加运算,当应用程序需要将相加数值做乘积,一个浮点指令就能执行二个指令的工作:这在科学处理中非常常见。当这种情况发生后,处理器就能在每个周期执行四个指令(4 FLOPS)。比方来说,800 MHz的安腾理论运算能力为3.2 GFLOPS,然后最快的安腾2,主频为1.67 GHz的运算能力则达6.67 GFLOPS。
安腾2处理器层次结构式的使用共享的缓存。等级1(L1)有16KB的指令缓存与16KB的资料缓存。等级2(L2)是256KB的统一型(指令与资料共享)缓存。L3也是统一型的缓存,不过大小从1.5MB至24MB不等。在256KB的L2缓存中包含了足够的逻辑电路来处理信号标就不需要使用到算术逻辑单元(ALU)。
主存储器则是透过总线联系至芯片组来访问。安腾2的总线最初称之为McKinley bus,不过现在通常直接称之为安腾总线。该总线的速度会因为新处理器的发布而显著提升。总线在每个周期传输2×128个比特,所以200 MHz总线的传输率达6.4 GB/s,而533 MHz的总线的传输率则是高达17.056 GB/s。[13]
在2006年之前推出的安腾处理器一概支持IA-32架构来支持旧有的服务器应用程序,但是与同世代的原生x86来比性能是相当糟糕的。而在2005年英特尔开发出IA-32 EL软件模拟器来提供更好的性能。在Montecito,英特尔移除了IA-32的硬件支持。
虽然Montecito没有IA-32的能力,但是英特尔也在增强了一些功能在这颗核心上。[14]该架构支持硬件多线程,也就是一颗处理器能够处理两个线程。当其中一个线程要去读写存储器时,另一个线程就执行指令。英特尔为了区分在x86处理器的超线程,在安腾称之为“稀疏线程”(Coarse multithreading)。稀疏线程搭配安腾架构所得的性能增进是显而易见的。英特尔也在该核心上支持硬件的虚拟化技术。虚拟化技术能够在性能损失降到最低时同时执行多个操作系统。除此之外Montecito也具备了分离式L2缓存,新增专用的1 MB L2指令缓存,原本256 KB的L2缓存则是变成资料缓存。
硬件支持
公司 | 最新产品 | |||
---|---|---|---|---|
名称 | 始于 | 直到 | 服务器名 | CPUs |
惠普 | 2001 | - | Integrity | 1-128 |
康柏 | 2001 | 2001 | Proliant 590 | 1-4 |
戴尔 | 2004 | 2005 | PowerEdge 7250 | 1-4 |
IBM | 2001 | 2005 | x455 | 1-16 |
富士通 | 2005 | - | PRIMEQUEST | 1-32 |
NEC | 2002 | - | Express5800 /1000 |
1-32 |
SGI | 2001 | now | Altix 4000 | 1-1024 |
日立 | 2001 | - | BladeSymphony 1000 |
1-8 |
Bull | 2002 | - | NovaScale | 1-32 |
Unisys | 2002 | - | ES7000/one | 1-32 |
在2007年,部分制造厂商提供搭载安腾2的系统,包含惠普,SGI、NEC、Fujitsu、Unisys、Hitachi与Groupe Bull。除此之外,英特尔也有提供机架[15]提供给系统组装员建造安腾系统。惠普则是业界前四大服务器制造厂中唯一一家提供安腾方案的系统供应商,超过80%的安腾2系统是由惠普制造出来的。在2006年第一季惠普售出多达7200组安腾系统。[16]左右系统的售价是取决于企业服务器与技术性运算的规模,平均一组系统造价约200,000美元。一般的安腾系统会搭载8颗以上的处理器。
安腾的总线接口是靠芯片组来联系的。企业服务器制造厂区分系统的不同点,是在于开发设计不同的芯片组来链接处理器到存储器、内部链接还有周边控制器。这些芯片组在每个系统架构的设计中是非常重要的。目前而言,安腾的芯片组有惠普、Fujitsu、SGI、NEC、Hitachi与Unisys分别开发。IBM与英特尔分别于2003与2002年也有推出芯片组,但是他们并没有支持比较新的技术,像是DDR2或是PCI Express。[17]
软件支持
为了让更多的软件可以执行在安腾上,英特尔支持开发安腾平台的有效的编译器,特别是自身包的编译器英特尔Compiler。[18][19] GCC、[20][21] Open64与MS Visual Studio 2008(及后来版本)[22]也都能够编译出安腾的程序。直到2007年,安腾支持的操作系统有Windows Server 2003、好几种的Linux版本(包括Debian、Red Hat与SUSE)、FreeBSD[23]、HP-UX、OpenVMS与惠普的NonStop。它也支持主机环境的GCOS还有一些IA-32的操作系统也能透过指令集模拟器在安腾执行。使用QuickTransit就能经由“动态比特转换”让IRIX(MIPS架构)与Solaris(SPARC架构)执行于安腾的Linux上。根据安腾解决方案联盟指出,在2007年初有超过一万个应用程序可以执行于安腾系统上,[24]但是昇阳对此数字保持怀疑态度。[25]而该协会也支持Gelato,一个安腾高性能运算用户组与开发者社群之园开放源码的安腾。[26]但到了后来,微软和Red Hat等软件厂商宣布不再开发Itanium操作系统/软件,许多Linux发行版也不再推出Itanium版本。
竞争对手
安腾2主要是面向大型企业服务器的市场,所以主要竞争对手如下:
综观安腾的历史,相较于一般处理器的固定小数点运算性能,它具有相当优秀的浮点运算处理性能。这项优势对高性能运算系统是很有帮助的,但是在大多数的企业服务器的负载上是较不注重这方面的性能。
超级计算机
搭载安腾架构的电脑第一次出现在TOP500的超级计算机列表是在2001年11月。搭载着安腾2的超级计算机在该列表中最佳纪录是在2004年6月的Thunder以Rmax为19.94TFLOPS获得第二名。在2004年11月Columbia超级计算机以51.8TFLOPS的运算速度再次获得第二名,而且直到2007年6月为止至少有一台超级计算机进入前十名。而在此名单中在2004年11月的名单中有高达16.8%的电脑是搭载安腾系列,而在2010年11月则是降到1%。[27]
处理器
安腾处理器在性能上显现出长足的进步。Merced是实做对架构的概念。而McKinley显著的提升缓存的等级而且让安腾能够与其他架构平起平坐。Madison则是借由转移到130纳米制程,能够增加缓存大小来克服主要性能的瓶颈。Montecito使用的是90纳米制程,允许实现双核心并且在能源效率上获取进步。Montvale加入了3个新功能:Core-level lockstep、demand-based switching与前端总线频率提升到667 MHz。
内部代号 制程 |
推出时间 | 主频 | L2 缓存/ 每核心 |
L3 缓存/ 每核心 |
前端总线 | 芯片数/ 每设备 |
核心数/ 每芯片 |
瓦特/ 每设备 |
附注 | |
---|---|---|---|---|---|---|---|---|---|---|
安腾 | ||||||||||
Merced 180纳米 |
2001-06 | 733 MHz | 96 KB | 2 MB* | 266 MHz | 1 | 1 | 116 | 外部L3缓存 | |
2001-06 | 800 MHz | 96 KB | 4 MB* | 266 MHz | 1 | 1 | 130 | |||
安腾2 | ||||||||||
McKinley 180纳米 |
2002-07-08 | 900 MHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 130 | HW branchlong, on-die L3 cache | |
2002-07-08 | 1 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
Madison 130纳米 |
2003-06-30 | 1.3 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | ||
2003-06-30 | 1.4 GHz | 256 KB | 4 MB | 400 MHz | 1 | 1 | 130 | |||
2003-06-30 | 1.5 GHz | 256 KB | 6 MB | 400 MHz | 1 | 1 | 130 | |||
2003-09-08 | 1.4 GHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 130 | |||
2004-04 | 1.4 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
2004-04 | 1.6 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 130 | |||
Deerfield 130纳米 |
2003-09-08 | 1.0 GHz | 256 KB | 1.5 MB | 400 MHz | 1 | 1 | 62 | 低电压 | |
Hondo 130纳米 |
2004-Q1 | 1.1 GHz | 256 KB | 4 MB | 400 MHz | 2 | 1 | 260 | 32 MB L4缓存 | |
Fanwood 130纳米 |
2004-11-08 | 1.6 GHz | 256 KB | 3 MB | 533 MHz | 1 | 1 | 130 | ||
2004-11-08 | 1.3 GHz | 256 KB | 3 MB | 400 MHz | 1 | 1 | 62? | 低电压 | ||
Madison 9M 130纳米 |
2004-11-08 | 1.6 GHz | 256 KB | 9 MB | 400 MHz | 1 | 1 | 130 | ||
2005-07-05 | 1.67 GHz | 256 KB | 6 MB | 667 MHz | 1 | 1 | 130 | |||
2005-07-18 | 1.67 GHz | 256 KB | 9 MB | 667 MHz | 1 | 1 | 130 | |||
Montecito 90纳米 |
2006-07-18 | 1.4 GHz | 256 KB+ 1 MB |
12 MB | 400 MHz | 1 | 2 | 104 | 虚拟化技术、 多线程、 没有硬件IA-32支持 | |
2006-07-18 | 1.6 GHz | 256 KB+ 1 MB |
12 MB | 533 MHz | 1 | 2 | 104 | |||
安腾2 9000系列 | ||||||||||
Montecito 90纳米 |
2006-07-18 | 1.4 GHz | 256 kB (D)+ 1 MB (I) |
6-24 MB | 400 MHz | 1 | 2 | 104 | Virtualization, Multithread, no HW IA-32 | |
1.6 GHz | 533 MHz | |||||||||
安腾2 9100系列 | ||||||||||
Montvale 90纳米 |
2007-10-31 | 1.42–1.66 GHz | 256 kB (D)+ 1 MB (I) |
8-24 MB | 400–667 MHz | 1 | 1–2 | 75–104 | Core-level lockstep,按需切换技术 | |
安腾9300系列 | ||||||||||
Tukwila 65纳米 |
2010-02-08 | 1.33-1.73 GHz | 256 kB (D)+ 512 kB (I) |
10-24 MB | QPI,速率为4.8 GT/s | 1 | 2–4 | 130–185 | 新的内核间通信方式, 快速通道互联,代替了前端总线。睿频加速 | |
安腾9500系列 | ||||||||||
Poulson 32纳米 |
2012-11-08 | 1.73-2.53 GHz | 256 kB (D)+ 512 kB (I) |
20-32 MB | QPI,速率为6.4 GT/s | 1 | 4–8 | 130–170 | Doubled issue width (from 6 to 12 instructions per cycle), Instruction Replay technology, Dual-domain hyperthreading |
时间线
- 1989:
- 惠普开始研究EPIC。[3]
- 1994:
- 6月:惠普与英特尔宣布结为合作伙伴。[28]
- 1995:
- 9月:惠普、Novell与SCO发布了一项使用“惠普/英特尔架构的64位网络运算”的“大量资料的UNIX操作系统”项目。[29]
- 1996:
- 1997:
- 1998:
- 1999:
- 2000:
- 2001:
- 2002:
- 3月:IDC再次预测在2004年安腾系统的年销量为50亿美元。[31]
- 6月:推出安腾2。
- 2003:
- 2004:
- 2月:英特尔发布正在实做x86-64指令集(市场名称则是“Intel 64”、“EM64T”等等),并于x86处理器Xeon上采用,而Itanium则继续采用Itanium特有的IA-64架构。IA-64和x86-64不兼容,而且x86-64的特点是能较好的支持原有的x86程序及操作系统(即32位程序)
- 6月:英特尔推出第一颗搭载x86-64的自家处理器Xeon,代号为“Nocona”
- 6月:位于LLNL的Thunder,搭载4096颗安腾2处理器在TOP500名列第2。[38]
- 11月:位于NASA Ames研究中心的哥伦比亚,SGI的Altix 3700搭载10160颗安腾2处理器在TOP500名列第2。[39]
- 12月:2004年安腾系统销量为14亿美元。
- 2005:
- 2006:
- 2007:
- 10月:英特尔推出Montvale安腾2
- 11月:英特尔将该系列处理器重命名为最初的安腾。
- 2008:
- 8月:惠普放弃AdvFS集成到惠普-UX,反而把程序码开源。
- 2009:
- 12月:Red Hat放弃安腾软件开发[50]
- 2010
- 2011
- 2017
- 5月:停止与慧与(Hewlett-Packard Enterprise,HPE)的合作,项目告终。目前仅有HPE一家坚持采用安腾处理器。
参考文献
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.