Intel Haswell是英特尔的中央处理器架构,由英特尔的俄勒冈团队负责研发,用以取代Intel Ivy Bridge和Intel Sandy Bridge微架构。[1] 和Ivy Bridge微架构一样,Haswell采用22纳米制程。[2] 根据英特尔的“Tick-Tock”策略和产品路线图,基于Intel Haswell微架构的处理器定于2013年6月发布。[3][4]Intel曾于2011年的IDF上展示出基于Haswell微架构的芯片。[5]2012年的英特尔开发者论坛上,英特尔公布了更多关于Haswell架构的工程样品处理器和技术说明。[6]在2013年6月4日至6月8日的台北国际电脑展上,英特尔正式推出Haswell微架构以及其处理器产品。[7]
此条目需要更新。 (2013年12月21日) |
产品化 | 2013年上半年 |
---|---|
推出公司 | 英特尔(Intel) |
设计团队 | 英特尔俄勒冈团队 |
生产商 |
|
指令集架构 | x86、x86-64、MMX、SSE(1、2、3、3S、4.1、4.2)、XD bit、AES、RDRAND、AVX(1、2)、FMA(3、4)、Intel-VT |
制作工艺/制程 | 22纳米 |
核心数量 | 2至4个(主流) 4至8个(高端桌面) 2至18个(Xeon) |
一级缓存 | 64KB(每核心) |
二级缓存 | 256KB(每核心) |
三级缓存 | 所有核心共享最多 32MB |
QPI速率 | 4.8 GT/s 至 6.4 GT/s |
DMI速率 | 2.5 GT/s 至 5.0 GT/s |
CPU插座 |
|
封装 | |
应用平台 | 服务器、工作站、台式机、笔记本电脑等 |
使用的处理器型号 | |
上代产品 | Sandy Bridge Ivy Bridge |
继任产品 | Broadwell Skylake |
技术特性
作为英特尔“Tick-Tock”策略下的产物,在“Tick-Tock”时间表上,Haswell架构属于“Tock”阶段,是为架构改进换代。根据Fudzilla的消息,“英特尔透露给合作伙伴的消息指同主频下与Ivy Bridge架构的产品相比,Haswell架构的产品其性能至少有10%的提升”。[8]而英特尔宣称Haswell整体性能将比Ivy Bridge快两倍。[4] 英特尔称在某些工作负荷上Haswell架构的效率比上代产品的提升了20%。
- 14级流水线(从Intel Core微架构开始一直沿用至今);[10]
- 和以往一样,整数运算、浮点运算和SIMD运算作业同样通过指令端口进行分配;[6]
- 每核心4个算术逻辑单元(ALU)和3个地址生成单元(AGU,2个位于加载流水线,1个位于存储流水线);[6]
- 每核心8指令发射端口,可同时执行8条内部指令(uOPs),以实现4倍整数运算(Intel Sandy Bridge/Ivy Bridge为6uOPs/3倍整数运算)。[6]
- 2个256比特的SIMD单元,以便支持Larrabee/Knight系列的512位SIMD;[6]
- 类似于X79芯片组平台(使用LGA2011插座)的可调节外频/基准时钟频率(处理器外频与基准主频异步),意味着Haswell平台的超频限制放宽。[11][12]实际上,由于QPI环形链路的设计使得核心电源和主频管理出现这样的混乱:由于三级缓存是CPU核心和GPU核心共享,但三级缓存的电压控制以及主频控制是和CPU核心的同步的,当CPU核心处于低负载而内置GPU核心处于高负载时,三级缓存需要处于全速运作状态,连带CPU核心也需要全速运作,这样不利于处理器的功耗控制。英特尔要解决这个问题,需要CPU核心的基准主频与非CPU核心的异步。[13]
- 主流级处理器产品全线均为原生四核心,[14]但实际上,英特尔公布的技术说明已表明下一代的酷睿 i3(Core i3)、奔腾(Pentium)系列仍维持双核心的设计。[6]
- 英特尔事务性同步扩展 (TSX),大幅改善多线程执行效率。[15][6]
- AVX2指令集(或称Haswell新指令集,包括矢量聚集散射、比特处理以及对FMA3的支持)[16][9]
- 改善AES-NI指令的执行性能;[9]
- 每核心拥有独立的64KB的L1缓存(32KB资料缓存+32KB指令缓存);[17];每核心拥有独立的256KB L2缓存;[17]所有核心可共享最高32MB的L3缓存.[10]
- 新的处理器缓存设计,旨在提升缓存带宽,L1、L2缓存带宽由原来的每时钟周期32位组(256比特),提升至每时钟周期64位组(512位),提升L2 TLB命中率。以提升大规模高负载运算任务的资料访问表现;[6]
- 原生支持双通道DDR3-1600;[18][9]企业级的Haswell-EP/EX核心还会支持八通道DDR4;[19][20][21]
- 原生支持PCIe 3.0 x16总线(H81芯片组除外)。
- 处理器内部仍然使用QPI总线,单向资料发送性能有4.8GT/s、5.2GT/s、6.4GT/s等三种规格,较低端型号的处理器在芯片组和处理器之间仍然采用DMI总线,单向资料发送性能有2.5GT/s和5.0GT/s两种规格;[19]QPI总线的布局延续Intel Sandy Bridge以来的环形链路设计,设计简单而且效率更高,更容易推出派生产品。[6]
- 新处理器插座:桌面版本的是LGA 1150,移动版本的是rPGA 947和BGA 1364。[22]英特尔的技术说明已表示Intel Haswell不会向下兼容于现有的英特尔处理器平台。[9]
- 除了部分极致性能/服务器平台以外,所有处理器型号均融合Intel HD Graphics显示核心。
- 内置显示核心将支持 DirectX 11.1以及 OpenGL 4.0;[23]通用运算方面支持Open CL 1.2;[24]继续强化3D图形处理性能,支持HDMI、DisplayPort、DVI、VGA连接端口标准;支持三屏幕显示信号独立输出(最高清晰度为4096像素×3072像素)或是4K分辨率输出;[9][4]
- 新的英特尔HD图形显示核心(Intel HD Graphics)有三种不同型号,代号分别为GT1、GT2和GT3。GT1拥有10个执行单元和1组纹理单元,定位入门级;GT2拥有20个执行单元和2组纹理单元,定位主流级;最高阶的GT3则拥有40个执行单元和4组纹理单元,但只用于移动平台。[25]而现任的Intel Ivy Bridge集成显示核心HD4000最多只有16个执行单元,但显示核心架构仍旧一样,[26]由于在架构、制程不变的情形下大幅提升显示核心的规模和规格,可能会使内置显示核心的Intel Haswell架构的处理器的发热量急升,桌面型版本可以突破100瓦,移动版本更达57瓦。[27]
- 在相同的功耗水准Haswell能提供两倍于Intel Ivy Bridge的图像性能,英特尔称Haswell的内置GPU的性能可媲美售价50$至70$的独立显示核心。
- 不再支持Windows XP,也不支持Windows Vista。如需在Haswell平台上运行Windows XP,须另行购买独立显卡[28]。
- 处理器芯片将内置完整的电压调节模块,Intel又一次把主板上的组件集成至处理器上,[29]此举可令主板的供电设计变得简单,降低主板厂商的制造主板的制造成本。[9]但同时也令主板厂商的产品卖点减少,趋于同质化,竞争加剧。[30][31]英特尔的这种设计并非是电压调节模块和处理器芯片完全融合,电压调节模块是一块独立的供电芯片,英特尔称‘集成稳压器’(IVR),和处理器芯片共享一块处理器基板。芯片采用22纳米制程,内置20个‘供电单元’(Power Cell),具有可编程特性,可为处理器各单元模块提供独立稳定的电压控制,理论上最多可以为处理器内各个模块单元提供一共320相供电。[32]
- 新的高级电源管理,除了传统的EIST和Turbo Boost以外,新增了几个电力控制状态,对于CPU核心和内置GPU核心将会有更明确精细的电压控制,类似于对手超微半导体(AMD)的Turbo Core 3.0;[9][6]
- 移动版本的处理器将有热设计功耗为25瓦、37瓦、47瓦以及57瓦的型号[14];而桌机版本的预期则有热设计功耗为35瓦、45瓦、55瓦、65瓦、77瓦、95瓦以及极致性能(包括高阶服务器平台的)高达100瓦以上TDP的型号[14],最高达到了Haswell-EP/EX的160瓦,最大通过电流190安培[33][34],不过有消息指出,由于增大的显示核心,主流级和性能级桌面版本处理器的热设计功耗有可能上扬至105瓦[35];除了移动平台、桌面平台以及服务器平台以外,Intel还专门为超极本设计了TDP只有15W、10W的版本,而且还将采用多芯片模块的设计,将芯片组和处理器集成到一块处理器基板上,类似于Intel Westmere中显示核心和CPU核心集成于一块处理器基板的形式。[14][9][36][37][6]
- 支持Thunderbolt技术,最高能支持到Thunderbolt 2.0。[38][39]
Haswell Refresh
英特尔在2014年5月发布Haswell的改进版,称为Haswell Refresh。同时,发布新一代9系芯片组。
Haswell/Haswell Refresh与8/9系芯片组互相兼容。Haswell Refresh K系列处理器原先只能在Z97或H97主板上使用。[40]后来英特尔宣布Haswell Refresh K系列处理器也可在8系主板上使用。[41]
i7-4790用以取代i7-4771而非i7-4770。
芯片组
- 支持USB3.0并最多提供6个连接端口
- 支持SATA 6.0Gb/s并提供最多6个连接端口
- 优化硬盘资料发送性能,提高资料访问和响应能力,特别是固态盘
- 优化英特尔智能响应技术及其支持驱动程序
- 为固态盘组建的硬盘阵列提供完整的TRIM支持
- Intel Lake Tiny技术(动态硬盘加速)改善固态盘和机械硬盘混合组合的发送性能
- 采用32nm制程
- 秏电量4.1W(上代为6.7W)
- 于2013年第二季上市[42],不兼容旧有处理器。[9]
消费级平台上,最高阶型号为Z87,支持所有特性;H87不支持动态硬盘加速以及3路PCI-E显卡互联;而最低端的H81取代旧有的H61,仅支持单路PCIe 2.0 x16+六条PCIe 2.0 x1、两个USB 3.0连接端口+八个USB 2.0连接端口、两个SATA 6Gbps连接端口+两个SATA 3Gbps连接端口(无RAID),以及每通道存储器只支持一个DIMM(亦即每通道仅能插入一条DDR3存储器)。除此以外,B85也会取代B75,规格和H87相近但不支持高级硬盘特性。[43][44]一些有一定研发实力的厂商,如华硕电脑、华擎科技、技嘉科技等,推出的H87、B85芯片组的主板支持一些处理器型号的倍频调整或是基准频率的调整以实现处理器的超频。[45][46][47][48]
商务平台由Q87、Q85分别取代Q77、Q75。[49][43]
然而在2013年3月份,有消息指8系列芯片组工程样品中的USB 3.0控制器存在缺陷,会影响S3休眠电源状态以及USB 3.0的使用。[50]尽管离正式发布仍有三个月的时间,但是英特尔当时却没有修复这个硬件电路BUG的打算,所以销售的C1步进的产品是存在瑕疵的。[51][52]后来英特尔于2013年4月份突然宣布这个硬件电路的BUG已修复完成,但仅限于2013年8月份以后推出的C2步进的版本,此前出货的有缺陷的C1步进版本仍然继续销售,只是要注意USB3.0的使用。[53]有消息称该缺陷只会在Windows 8系统下碰到。[54]据称该缺陷无法透过更新驱动程序或BIOS/EFI修复,但有网友称在Windows 8和Windows Server 2012下可以透过安装KB2811660和KB2822241修复该缺陷。[55][56][57]
- 支持M.2接口
- 于2014年第二季上市,将兼容后续的Broadwell处理器。
处理器
首批上市的基于Haswell架构的消费级桌面型处理器有Core i7系列、Core i5系列,标准电压版的Core i7-4770K/4770、Core i5-4670K/4670/4570/4430的热设计功耗为84瓦(其中带“K”的型号不锁定倍频),节能版的Core i7-4770S、Core i5-4670S/4570S/4430S的为65瓦,低电压版的Core i7-4770T、Core i5-4670T的为45瓦,超低电压版的Core i7-4765T、Core i5-4570T(双核心四线程)的则为35瓦。全部型号内置英特尔HD图形(HD Graphics 4600)。[58]移动版处理器全部为四核心Core i7,分别为i7-4930MX(TDP 57瓦,8MB三级缓存)、i7-4900MQ(TDP 47瓦,8MB三级缓存)、i7-4800MQ(47瓦,6MB三级缓存),均为rPGA封装。[59][60]面向主流市场的Core i3以及Pentium型号则于2013年8月后陆续推出,有Core i3-4130/4330/4340、Pentium G3220/G3420/G3430/G3450等型号。[61][62][63]
2014年,为纪念英特尔‘Pentium’(奔腾)品牌诞生20周年,英特尔已于2014年中期推出无倍频锁定的Pentium20周年纪念版(PENTIUM G3258),英特尔8系列和9系列的芯片组均可支持。[64]除此以外,还将发布英特尔首款消费级八核心处理器,支持DDR4存储器。而且还改进处理器顶盖中的导热材料,缓解haswell架构处理器中部分型号的过热问题。[65][66]
Intel为在高性能计算和高性能数据中心领域对抗NVIDIA“Project Denver”的新形态处理器(基于ARM的指令集架构的处理器并集成NVIDIA基于“Maxwell”架构的GPGPU),将推出极致性能的x86处理器核心Haswell-EP/EX,最高支持八通道DDR4-4266,热设计功耗高达160瓦,往下还有145瓦、135瓦、120瓦等几个层次结构。[20][34][33]
性能表现
与上一代Sandy Bridge/Ivy Bridge架构相比:
过热问题
内置显示核心的运行单元(EU)由上代Ivy Bridge的6组大幅增加到20组,同时也将电源控制模块集成到CPU上,四核心型号耗电量由77W上升到84W,使得处理器电压调节模块的热量都集中至CPU上,运行时的温度比上代更高,超频能力亦有所下降。[69][70] 因为发热升高,性能没有太多提升,使得Haswell微架构在超频玩家中也被戏称‘hotwell’。[71][72]
制程改进版:Intel Broadwell
根据Intel的“Tick-Tock”策略路线,Intel Haswell微架构的制程改进版代号为Intel Broadwell[73][74],采用14纳米制程,于Haswell发布后一年发布。[73][74]Intel Broadwell将会采用系统单片机(SoC)或多芯片模块(MCM)的设计,将PCH芯片组内置于处理器芯片上或处理器基板上[42]。这个将意味着Intel Haswell平台的主板和处理器无法与Intel Broadwell的处理器/主板互相兼容,因为Haswell平台的主板仍保留芯片组的设计。Broadwell一部分处理器型号兼容LGA1150接口,这符合一代接口用两代的惯例。
2012年11月末,有不实传言谣传指英特尔在Broadwell以后将统一采用BGA封装,摒弃插槽,届时将和主板捆绑贩售[75],此言一出,立刻在个人电脑DIY市场上引起强烈反对的声音,而英特尔发言人Daniel Snyder则出面澄清,“英特尔将继续在可以预见的未来为用户提供LGA封装的处理器制品”。[76][77]对手AMD也表示,尽管它们有BGA封装的制品大量生产,但不会放弃插槽式的处理器制品。[78]
英特尔也会在Broadwell中加入新指令:[79]
- ADOC/ADCX指令,用于任意精度整数操作[80]
继任微架构
Intel Skylake微架构将会是Intel Haswell微架构及其制程改进版Intel Broadwell微架构的继任者。
参见
参考文献
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.