AMD Piledriver中文:“AMD 打桩机[1])是超微半导体研发微处理器架构的代号,是为第一代Bulldozer微架构的改进版。[2][3]首发产品是2012年5月发布的基于Piledriver微架构的AMD Fusion之移动版本A10、A8系列(核心代号“Trinity”)。Piledriver在架构上不会与Bulldozer有太大的差别,而部分国外科技媒体则称它为“New Stepping of Bulldozer”,是步进比较新的Bulldozer[4]。给人一种“只对耗电问题解决,并在某些方面的改良当中让时脉变得更好提升。[5]

Quick Facts 产品化, 推出公司 ...
Piledriver
产品化2012年至现今
推出公司超微半导体(AMD
设计团队超微半导体(AMD)
生产商
微架构CISC(x86-64/AMD64)
指令集架构MMXSSESSE2
SSE3SSSE3SSE4.1
SSE4.2SSE4ax86
x86-64/AMD64F16CNX-bit
AES-NIAVXAVX1.1
XOPFMA3、FMA4、AMD-V
制作工艺/制程32纳米
核心数量2至16(1模块至8模块)
一级缓存每整数调度运算单元16KB(指令)
每模块64KB(资料)
二级缓存每模块1~2MB
三级缓存共享8MB(AMD FX系列)
CPU主频范围1.8 GHz 至 5.0 GHz
HyperTransport速率至 6.4 GT/s
CPU插座
封装
应用平台伺服器工作站台式电脑手提电脑超级电脑
核心代号
  • Trinity(台式电脑、手提电脑)
  • Vishera(台式电脑)
  • Abu Dhabi(伺服器)
  • Seoul(伺服器)
  • Delhi(伺服器)
使用的处理器型号
上代产品AMD Bulldozer
继任产品AMD Steamroller
Close

2010年超微半导体的财务分析日上,公布了2012年第二代Bulldozer微架构的计划事宜[6],指出它是“增强型Bulldozer”微架构;后来这个微架构被赋予了代号“Piledriver”。Piledriver相对于第一代Bulldozer微架构的主要改进在于提升每时钟周期指令执行性能、提升时钟频率、提高性能功耗比率和降低发热量。[7]和Bulldozer微架构不同的是,Piledriver微架构还将会有移动平台型号的处理器,部分型号还内建显示核心。 同频率下宏内核性能约Phenom II(K10.5架构)的0.8~0.85之间。

特性

微架构设计、制作工艺

  • 延续AMD Bulldozer微架构的“M-SPACE”模块化设计,AMD FX的高阶型号FX-8350共计12亿左右的晶体管数量;[8]
  • 采用格罗方德改进的32纳米SOI HKMG制程;
  • Piledriver把所谓的FPU(浮点运算单元)从2个合成1个,于是128位的FPU因为2合1变成了256位元。因此说它是双核心不太对,因为FPU只剩下1个而不是2个,而架构上看起来是有点怪的宏内核,但比较确切来说是变成2个逻辑核心。[5]

指令集

缓存

  • 和Bulldozer架构一样,每整数调度运算单元独占4路16KB一级资料缓存,每模块共享2路64KB一级指令缓存;每模块1~2MB二级缓存;FX系列和Opteron系列分别拥有最高8MB和16MB的三级缓存,但改进了一级缓存的转译后备缓冲器(TLB)和缓存分支预测器。[8]

电源管理

  • 加入Cyclos半导体公司最新的共振时钟网络/振谐时钟网络(Resonant Clock Mesh,RCM)技术,透过最大限度地回收晶片时钟电路运作时损耗的能量,来为时钟电路产生更多的时钟信号,以此来提升晶片运作时的电能利用效率,降低发热量。[10][11]Cyclos指出,相同的架构的处理器,加入共振时钟网络技术的可以在降低5%至10%的耗电量的同时提升5%至30%的性能,AMD认为该技术可使Piledriver微架构的晶片降低24%每时钟周期的能耗,相较于Bulldozer微架构的晶片相同的性能而言。[12][13][14]
  • Turbo Core 3.0,与Turbo Core 2.0相比,可以同时动态调整CPU和内建GPU的时钟频率;[15]
  • 处理器的热设计功耗最低17[15],最高140瓦,一些特别型号更达到220瓦;[16][17]

存储器界面、晶片组、处理器插座、总线

内建显示核心(仅限AMD Fusion)

处理器

桌面型性能级处理器

基于AMD Piledriver微架构的第二代AMD FX处理器,核心代号“Vishera”,单片机最高4模块8核心,支持TurboCore 3.0,无集成显示核心,使用既有的900系列晶片组和Socket AM3+插座,支持双通道DDR3存储器界面,大体上和第一代基于AMD Bulldozer微架构的AMD FX的规格相差不大。超微称第二代FX系列处理器可以在多媒体任务的处理性能上提供20%至30%的性能增长幅度,得益于共振时钟网络技术带来的更低的能耗、更高的时钟频率和更低的发热量。[19][20][10]

第二代AMD FX在2012年10月23日正式上市。其后,首发的性能评测媒体普遍表示基于Piledriver架构的AMD FX系列性能上比Bulldozer的强13%至15%,但仍不敌对手英特尔的Core i7-3770K,部分项目甚至只和Core i5-3570K持平,功耗上Vishera核心的FX比Zambezi核心的稍有下降但降幅不大,低负载时(浏览网页为例)的功耗水平优于对手但满负载时依然和对手存在差距。[25][26][27][28][29][30]不过首发FX-8350的官方售价却不超过200美元[31]

2013年6月11日,AMD发布基于Piledriver架构的FX-9590和FX-9370,其中FX-9590更以5.0GHz的默认加速时脉、220瓦的热设计功耗创下市售处理器(包括OEM)的时脉以及发热功率记录。[32][33][34]处理器本身是FX-8350的晶片中挑选过“过硬体质”的结果,但功耗仍巨大,部分多线程性能可与对手英特尔的旗舰级型号Core i7-4770K抗衡。[17]

桌面型主流级处理器

第二代AMD Fusion A系列APU,主要面向桌面型主流平台,AMD也推出了“Virgo”(处女星座)平台:由第二代A系列APU、A系列晶片组和可选的AMD Radeon HD 7000系列显卡组成。[35]针对Intel Core i3Core i5之间的市场领域。

基于AMD Piledriver微架构的AMD Fusion A系列APU,核心代号“Trinity”(三位一体),诸多规格都与现时基于K10/K10.5的“Llano”核心的APU大相径庭:除了支持双通道DDR3-800至2133、以及可以沿用现有的晶片组和无L3缓存外,使用全新的Socket FM2插座、支持TurboCore3.0、内建性能更强的显示核心、CPU部分使用1至2个Piledriver模块(2至4核心)。[36][37]

值得注意的是和第一代A系列Fusion APU一样,会有无显示核心的晶片以Athlon II(速龙2)的品牌推出。“Trinity”核心的Athlon II有Athlon II X4 730、740和750K,和A10、A8系列一样均为2模块4核心,但屏蔽了内建显示核心,730更将Turbo Core功能删减。[38][39][37]

  • Athlon II X4 750K,CPU核心同A10/A8,默认时脉3.4GHz,加速时钟频率4.0GHz,采用不锁倍频设计,热设计功耗100瓦;
  • Athlon II X4 740,CPU核心同A10/A8,默认时脉3.2GHz,加速时脉3.7GHz,最高倍频锁定,热设计功耗65瓦;[37]
  • Athlon II X4 730,CPU核心同A10/A8,但支持的存储器时脉最高只到1600MHz。

在一些基准性能测试中,CPU核心的性能依旧不敌对手Intel Core i5,但要优于Core i3,而内建GPU核心的性能继续大幅抛离对手Intel的HD Graphics以及一众入门级独立显示核心。[40][41][37]而且有高时脉DDR3存储器的加入也可使第二代A系列APU的性能有所提升。[42]

移动型性能/主流级处理器

第二代AMD Fusion A系列APU移动版本,主要针对主流级和性能级的手提电脑市场,AMD相应地推出了“Comal”移动平台。[43]AMD也籍此推行自己的超轻薄手提电脑平台“Ultrathin”。[44][45][46][47]

和桌面型主流级平台一样,AMD Fusion A系列APU移动版本的核心代号为“Trinity”(三位一体),也分为A10、A8、A6和A4四大系列。其中A10、A8的CPU部分均为双模块四核心,4MB L2缓存,主要区别在于内建GPU部分:A10的为Radeon HD 7660G/7620G,而A8的则为Radeon HD 7640G;A6和A4的CPU部分为单模块双核心,2MB L2缓存,A6的内建显示核心为Radeon HD 7500G/7520G。A10、A8和A6均在2012年4月发布,不少性能测评媒体也收到了测试样机。[48]

在2011年AMD Fusion开发者论坛上,超微称移动平台上“Trinity”核心AMD Fusion APU的计算能力会比“Llano”核心的快50%。[49][50][51] 实际上是借着拉频率来比旧的Llano核心快30% (宏内核同频下只有 0.8~0.9的性能)。

企业级处理器

对于伺服器市场,超微在2012年财政分析日上(2012年2月2日)表示,将和基于AMD Bulldozer微架构的AMD Opteron一样,分为三大系列:[24]

  • 针对单路伺服器市场(单CPU,用于Web伺服器、Web网站托管以及小型伺服器、小型工作站)的AMD Opteron 3300系列,核心代号“Delhi”,拥有2模块4核心或4模块8核心,和桌面型性能级的AMD FX一样采用Socket AM3+插座,以及支持双通道DDR3 ECC存储器;[16]
  • 针对单路至双路伺服器市场(单CPU或双CPU,用于高效益、高能效比的伺服器、中型工作站)的AMD Opteron 4300系列,核心代号“Seoul”,拥有3模块6核心或4模块8核心,继续沿用旧有的Socket C32插座,支持双通道DDR3 ECC存储器。[16]
  • 针对双路至四路伺服器市场(双CPU至四CPU,用于主流企业级伺服器、大型工作站)的Opteron 6300系列,核心代号“Abu Dhabi”,拥有双模块四核心、4模块8核心、6模块12核心、8模块16核心等型号,继续沿用旧有的Socket G34插座,支持四通道DDR3 ECC存储器。4模块以上的型号不再采用多晶片模块的封装,而是统一集成至一块晶片上,即单片机最高可容纳8模块16核心。[16]

超微认为Piledriver架构的Opteron相比Bulldozer架构的会有15%的性能增长,得益于每时钟周期指令数的优化和高20%的处理器时钟频率。[52]

未来发展

超微在发布AMD Bulldozer微架构时表示Bulldozer架构实现“一年一改进”,2011年发布首代Bulldozer架构,2012年发布第二代‘增强型’Bulldozer架构(即Piledriver架构),2013年/2014年推出第三代Bulldozer架构(即Steamroller架构),2015年/2016年推出第四代Bulldozer架构(即Excavator架构)。[53][54]

Piledriver Bug

  • 2016年2月,AMD Piledriver核心处理器被发现非管理员权限的用户,可以接管整台伺服器的漏洞。AMD已发布新微代码修正此一漏洞。被发现此一漏洞的是AMD Opteron 6300系列处理器,执行微代码版本为 0x6000832 及 0x6000836 的产品。一旦漏洞被执行,这个漏洞会干扰处理器核心的执行资料,可能导致现在运转中的处理器当机。使得虚拟机中的非管理者权限用户可以利用这个漏洞,接管整个主机系统或者诱导主机的处理器执行被用户控制的恶意程序。

参见

参考资料

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.