加速处理器(英语:Accelerated Processing Unit,缩写APU)是AMD一个处理器品牌,包括E1/E2/A4/A6/A8/A10/Athlon/Sempron/FX与Ax-PRO等多个子系列。[1][2][3][4][5]

Quick Facts 产品化, 推出公司 ...
AMD APU
Thumb
AMD A6-3650 APU
产品化2011年
推出公司超微半导体
设计团队超微半导体
生产商
微架构10h/12h
Piledriver
Jagaur
Puma
Steamroller
Excavator
指令集架构CISC(x86-64)、RISCARMv7,仅限于Kaveri架构的TrustZone IP)
制作工艺/制程0.032或0.040 至 0.028
产品编码10h/12h
Llano
Bobcat
Ontario
Zacate
Piledriver
Trinity
Richland
Jagaur
Kabini
Temash
Steamroller
Kaveri
Puma
Beema、Mullins
Excavator
Carrizo
核心数量1至4个(Bulldozer/Piledriver架构的为1至2个模块)
一级缓存64KB指令+64KB资料
二级缓存1至4MB
CPU主频范围1.0 GHz 至 4.4 GHz
HyperTransport速率至 6.4 GT/s
CPU插座
Close

APU以往以Fusion作为其项目代号。AMD Ryzen以后,APU指的是集成了显示核心的AMD处理器。

历史

超威(AMD)在并购ATI以后,随即公布了代号为“AMD Fusion”(融聚计划)。简要地说,这个项目的目标是在一块晶片上,集成传统中央处理器和图形处理器,并且内建最少16通道、可与外部PCI-E装置链接的PCI-E控制器,存储器控制器等。而这种设计会将北桥晶片从主板上移除,集成到中央处理器中,CPU核心还可以将原来依赖CPU核心处理的任务(如浮点运算)交给为运算进行过优化的GPU处理(如处理浮点数运算)。AMD认为这是加速处理单元(APU)的一类,[6]是为AMD加速处理器(AMD Accelerated Processing Units,AMD APU)。

首款市售的AMD APU在2011年1月4日于拉斯维加斯举行的消费电子展CES-2011)上发布,核心代号“Llano”。[7]2010年超微的财政分析日公布了2012年第二代Fusion APU的存在,核心代号为“Trinity”,[8]2011年5月底超微公布了更多关于2012年Fusion APU的产品线,[9]2012年5月“Trinity”正式发布,首发的是行动型号,CPU核心基于AMD Piledriver架构,GPU核心基于Radeon HD 7000系列(实际为Radeon HD 6900系列的4-VLIW SIMD设计),采用新的Socket FM2插座和A85晶片组。[10][11][12]

除了硬件规格的提升,超威也发布了多个AMD Catalyst驱动程式更新,用于提升内建的Radeon HD显示核心的性能表现。[13][14][15][16]

2013年,超威取消了基于Bobcat 2.0架构的Fusion APU,[17]取而代之的是Jaguar架构,核心代号分别为“Kabini”和“Temash”,对应超低功耗装置和平板装置,晶片采用台积电的28纳米制程制造。[18][19]

商标争议

开始“AMD Fusion”只是超威的项目代号,后来成为超威的一个商标,然而这样却引起争议。欧盟商标持有者的 Boost Up国际有限公司和Arctic Switzerland AG称它们早在2006年首先使用了“Fusion”作为它们一系列电源供应器的产品商标。[20]为避免争议进一步发展成商业诉讼,超微在2012年初期,计划将放弃“Fusion”商标,而倾向于改用“HSA”(Heterogeneous System Architecture,异构系统架构)作为AMD加速处理器的新商标。[21]然而,由于AMD和Arctic公司在谈判中无法就法律费用和许可费用达成妥协,最终还是失败了。

2013年1月23日,Arctic宣布和AMD达成最终私人协议。[22]为消除争议,在2013年1月31日前,超威产品的制造商(包括搭载AMD处理器的品牌电脑和手提电脑、以及OEM制品)和代理商被要求立即终止“Fusion”和“AMD Fusion”商标的使用。[23]

大略技术特性

与传统的x86中央处理器相比,超微着重强调AMD APU的“异构系统架构”(Heterogeneous System Architecture,HSA),即单片机上两个不同的架构进行协作,然而超微认为这个体系结构仍未成熟,但是未来将会使它变得更易于编程、更易于进行性能优化、负载资源更易于平衡、更高的性能以及更低的能耗。[24]2006年10月25日,AMD完成对ATi的收购后,公司就公布了“Fusion”项目,初期预计在2009年底或2010年初发布。它亦是Torrenza英语Torrenza统一加速计算平台的一部分,配合FireStream流处理器进行协同运算。内建显示核心性能较一般的入门级独立显示核心和以往的集成显示核心强劲,能支持实时光线跟踪运算。

以往集成图形核心一般是内建于主板的北桥中。而AMD Fusion项目则是结合现时的处理器和绘图核心,即是将处理一般事务的CPU核心、处理3D几何任务以及图形核心之扩展功能的现代GPU核心、以及主板的北桥融合到一块晶片上。[25]目前的阶段里,AMD Fusion的硅晶片上有两个独立的核心,一个负责处理器,另一个负责绘图核心,两个核心并不是融合在一起,处理器有自己独立的缓冲存储器,绘图核心部分同样如此。两个核心会透过CrossBar互相连接。此外,Fusion亦会集成存储器控制器,后期与PCI-E控制器、HT总线控制器集成到一起并称为“统一北桥”(Unified Northbridge)。Fusion APU中的各个组件之间使用HyperTransport连接,使各个组件连接成一个整体。这种设计允许一些应用程式或其相关链接界面来调用图形处理器来加速处理进程,例如OpenCL。[26]处理器和绘图核心共享存储器控制器,可以直接访问存储器,但绘图核心没有独立的显示内存,需要占用系统存储器的部分容量来充当之。南桥暂不会集成在Fusion APU晶片中,除了低功耗的、要求高集成度的SoC制品以外。未来AMD将会在AMD APU上实现存储器统一寻址空间,使CPU和GPU进一步结合。最终的目标是要将图形处理器和中央处理器“深度集成”/“完全融合”,可根据任务类别自动分配运算任务予不同的运算单元中。[27]无论是当前还是未来,如此的设计可有效降低一般PC平台的功耗和发热量,尤其是对功耗发热敏感的HTPC和手提电脑来说更具吸引力。

Thumb
采用AMD C系列APU的Acer Aspire522上网本

纵使处理器和绘图核心二合为一,但AMD会继续设计中端以上级别的独立显示核心,因为高端用户和物理计算仍然依赖独立显卡的强大运算性能。

无论是桌面型平台还是行动平台,部分AMD的中端和中低端的独立显示核心可与处理器的内建显示核心进行“交火”(CrossFire)互联,对于中高阶以及高阶的独立显示核心由于和内建显示核心交火互联的性能提升效果不明显而没有支持。此技术亦可配合增强的AMD PowerNow!电源管理技术,使笔记本电脑更节省电量。例如一部笔记本电脑同时配置了Fusion APU处理器和AMD的独立显卡。当流动使用时,独立显示核心会被关闭,只使用Fusion APU处理器内的显示核心,以节省电量。当接驳了外置式电源时,可以根据图形处理负载,决定内建显示核心和独立显卡的开与关,较低的图形资料负载时也只开启内建显示核心,而在较重的图形资料处理时,独立显示核心开启或两个显示核心协作,以提供更强大的显示性能。类似的设计也延伸到搭载非AMD处理器的手提电脑上,功效也和搭载AMD APU的一样,在内建显示核心和独立显示核心之间根据负载进行切换,但无法使用交火功能使两个显示核心协作。

目前AMD APU中已内建的模块单元

More information 片上系统(SoC)模块单元, 集成到性能级APU的年份 ...
片上系统SoC)模块单元 集成到性能级APU的年份 集成到低/超低功耗APU的年份 被取代的片上系统模块单元 备注
AMD K10处理器核心 2011年
AMD Bobcat处理器核心 2011年
AMD Radeon HD 6000显示核心 2011年 2011年 是为5-VLIW SIMD架构
北桥[24][28] 2011年 2011年
PCIe控制器[24][28] 2011年 2011年
DDR3存储器控制器[24][28] 2011年 2011年 仲裁存储器一致性和非一致性请求。[29] 系统主存储器被划分为图形核心使用的显示专用存储器(最多2GB容量)和CPU核心使用主存储器。[29]
UVD单元[24][28] 2011年 2011年
显示控制器 2011年 2011年
AMD Piledriver处理器核心 2012年 AMD K10处理器核心
AMD Radeon HD 6900显示核心 2012年 AMD Radeon HD 6000 4-VLIW SIMD架构而非Radeon HD 7000系列的GCN架构,但品牌命名上属于AMD Radeon HD 7000[30]
AMD 高清晰度媒体加速器(AMD HD Media Accelerator)[31] 2012年 UVD单元 相比旧有的UVD单元,新的媒体加速器包括AMD 高清晰度完美画面技术(AMD Perfect Picture HD)、AMD Quick Stream技术(类似对手英特尔的Quick Sync Video技术),以及AMD Steady Video技术[31]
HDMI, DisplayPort 1.2, DVI控制器 2012年
统一北桥 2012年 北桥 新的统一北桥与旧有的集成北桥相比,内建处理器电源管理和新的C6电源状态,新增Turbo Core 3.0(可根据负载需要和功耗状态动态调整CPU核心和GPU核心的电压和时脉,允许一段时间内实际时脉和电压高于默认值但不超过热设计功耗)[32]
AMD Jaguar处理器核心 2013年 AMD Bobcat处理器核心
AMD Steamroller处理器核心 2013年 AMD Piledriver
AMD Radeon HD 7000显示核心 2013年 2013年 AMD Radeon HD 6900系列显示核心 新的GCN(Graphics Core Next)显示核心架构:RISC SIMD取代4/5-VLIW SIMD
南桥 2013年
ARM Cortex-A5 MP-Core 2013年 ARM授权AMD作为TrustZone IP使用
AMD Radeon HD 8000显示核心 AMD Radeon HD 7000显示核心
AMD Excavator处理器核心[33] AMD Steamroller处理器核心
Close

AMD异构系统结构发展时程

More information 类型, HSA特性 ...
类型 HSA特性 首次实现时间 备注
优化平台 图形处理器运算支持C++语言 2012年
“Trinity” APU
支持OpenCL C++指令和微软公司即将公布的C++ AMP语言。这样做可以更容易为CPU和GPU进行程序编写,使它们两者更好地协作,来处理并发运算负载。
HSA MMU GPU可以透过HSA MMU的转译服务和标签页故障管理来存取主系统存储器。
统一电源管理 GPU和CPU的供电由单一电源管理单元统一管理,可根据当前系统负载需要来决定各个单元的电源供应,以提高运算单元的复用率和能耗比。
架构集成 统一虚拟寻址空间[24][28] 2013年
“Kaveri” APU
GPU 能直接使用 CPU 的虚拟寻址存取系统存储器,并允许 CPU 与 GPU 之间指针为指针 (pointer-is-a-pointer)。统一寻址空间将让异构运算程序的编程难度大大减少,并允许 CPU 与 GPU 之间更多高级的存储器共享运用。
一致性系统存储器 GPU 运算单元能直接以统一虚拟寻址空间的指针,存取位于一致性区城的系统存储器,同时亦窥探 CPU 的缓存,实现 GPU 与 CPU 的缓存一致性。
GPU 存取标签页式系统存储器 借由统一虚拟寻址空间及 HSA MMU,GPU 亦能存取可标签页的系统存储器统标签页存储器(即虚拟内存)。目前的 GPU 要存取可标签页存储器,必须先行复制副本,或是钉选标签页 (pinning)。
系统集成 GPU 运算上下文切换 2014年 进行中的 GPU 与运算任务可以进行上下文切换,因而在多任务环境下系统能更快速地处理应用程式、运算任务以及图形处理,为用户提供无缝的性能体验。
GPU 图形处理优先权 在可以进行上下文切换的同时,图形处理将会被给予更高的优先权,以使图形处理的延时未免受多任务处理影响。长时间运行的图形处理任务将会被中断并暂时切换。
服务质量控制(QoS)[24] 除了多任务切换以及优先权控制以外,硬件资源可以在多用户和应用程式之间平衡分配或进行优先权调度。
Close

类似设计

超微的竞争对手英特尔英伟达也有类似的设计。

  • 英特尔最早在超微宣布“Fusion”项目不久后也宣布其处理器未来将集成图形核心,其首发产品是2009年底基于Intel Westmere架构的Core i5Core i3,它们是将包含图形处理器的北桥以及CPU核心两个独立的晶片一同封装在同一处理器基板[34],而后来的Sandy Bridge以后除极致性能和部分企业级产品以外均采用类似AMD Fusion的设计:三级缓存也是CPU核心和内建GPU核心共享;显示核心也支持OpenCL以使得可以和CPU核心进行协同运算,尽管性能上仍然受制于英特尔当前还比较孱弱的图形核心处理能力,而且许多异构运算的特性仍然缺乏支持;CPU核心新增的AVX(高级矢量扩展)等新指令集也加强了其内部各单元的并发处理能力。

然而NVIDIA片上系统产品“Tegra”虽然也是显示核心和ARM CPU核心集成到一块晶片上,但GPU并不会协助CPU核心处理运算任务,仍然只负责图形处理,和当下其它移动设备的系统晶片一般。而NVIDIA也表明,“Project Denver”和“Tegra”的目标本身就有很大的不同,在当下两者之间完全无关系。丹佛计划的目标是使图形处理器作为和当下的中央处理器一般的通用处理器使用,以性能为主要导向;而“Tegra”面向移动设备SoC,再者,省电是其设计主要导向之一。[36]

客制化APU

2013年5月1日,AMD公布将会提供半客制化APU服务。[37] 这些APU专为各间公司的不同要求而定制,种类包括一般的消费级APU到特定用途APU。其中最广为人知的例子就是PS4Xbox One所采用的客制化APU。[38]

处理器列表

下列世代分法源自AMD ComputeX 2015演示稿,其他Refresh核心以时间轴排序。

第一代AMD APU于2011年6月推出,核心代号Llano,采用Socket FM1,包括A4、A6和A8,搭配晶片组为A55/A75。

第二代AMD APU于2012年6月推出,核心代号Trinity,采用Socket FM2,包括E1、E2、A4、A6、A8和A10,晶片组为A55/A75/A85X。

第三代AMD APU于2013年5月推出,核心代号Kabini,采用Socket AM1以及Socket FT3,前者包括Athlon和Sempron后者包括E1、E2、A4、A6,为Soc设计。

AMD APU于2013年6月推出第二代APU Refresh版,核心代号Richland,采用Socket FM2,包括E1、E2、A4、A6、A8和A10以及Ax PRO系列,晶片组为A55/A75/A85X。

第四代AMD APU于2014年1月推出,核心代号Kaveri,采用Socket FM2+,包括A6到A10(A4为Richland refresh而来),晶片组为A58/A78/A88X。

第五代AMD APU于2014年5月推出,核心代号Beema,采用Socket FT3b,包括E1到A8,为Soc设计。

第六代AMD APU于2015年6月推出,核心代号Carrizo,采用Socket FP4,包括E1到A10、FX以及Ax PRO系列。

AMD APU于2015年6月推出第四代APU Refresh版,核心代号Godavari,采用Socket FM2+,包括A4到A10,晶片组为A58/A78/A88X。

第七代AMD APU于2016年4月发表,核心代号Bristol Ridge,采用Socket AM4,包括A6到A12,晶片组为B350/A320。

2017年2月22日发表代号“Summit Ridge”的第一代Ryzen系列,取代AMD FX系列

2017年10月发表代号“Raven Ridge”的Ryzen APU产品线

2018年4月发表了代号“Pinnacle Ridge”的第二代Ryzen系列,是第一代Ryzen系列的小幅改良版

于2019年消费电子展中宣布将于同年年中发表代号“Matisse”,采用7纳米制程及支持PCIe 4.0之第三代Ryzen处理器(集成Vega内显的第三代Ryzen仍然是PCIe 3.0)。

2020年7月21日台湾地区代号“Renoir”的4000 PRO系列APU开卖,采用全7纳米集成单晶圆,使用Vega核心,仍然使用PCIe 3.0,但为OEM版本,能透过特定管道DIY组装机或是套装机购买,适用晶片组为A520/B550/X570,其余目前(2020/10/08)不适用

媒体谈论

参考资料

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.