Intel Nehalem (发音:/nəˈheɪləm/[1]) ,是Intel研发的中央处理器微架构之代号,该架构取代了前代的Core微处理器架构[2] 使用Nehalem架构的微处理器采用45纳米制程(后期改用32纳米制程),在2007年的Intel开发者论坛上Intel官方展示了一个采用两颗Nehalem微架构的处理器的系统平台。首款采用Intel Nehalem架构的处理器是2008年11月正式发售的桌上型处理器Intel Core i7[3]

Quick Facts 产品化, 设计团队 ...
Nehalem
产品化2008年11月11日,​16年前​(2008-11-11
设计团队Intel
生产商
指令集架构MMXSSESSE2SSE3
SSSE3SSE4.1SSE4.2x86
x86-64EM64TEIST
XD bitAES
制作工艺/制程45nm
核心数量2 个至 8 个
一级快取64KB(每核心)
二级快取256KB(每核心)
三级快取4MB~12MB(各核心共享)
CPU主频范围至 3.33 GHz
QPI速率4.8 GT/s 至 6.4 GT/s
DMI速率2.5 GT/s 至 5.0 GT/s
CPU插座
封装
  • LGA(桌面平台、伺服器平台)
  • PGA(流动平台)
应用平台伺服器工作站桌上型电脑笔记型电脑超级计算机
核心代号
  • 伺服器平台:
    Beckton
  • 伺服器平台:
    Gainestown、Jasper Forest
  • 伺服器平台:
    Bloomfield、Jasper Forest、Lynnfield
  • 桌面平台/伺服器平台:
    Bloomfield、Lynnfield、Jasper Forest 、Havendale(已取消)
  • 流动平台:
    Clarksfield、Auburndale(已取消)
使用的处理器型号
上代产品Core
继任产品Westmere
Close

Intel在Pentium 4时代也使用过“Nehalem”的代号,该代号曾使用于NetBurst微架构的10Ghz版本之Pentium 4微处理器,后来改计划取消。Nehalem微架构尽管与Netburst架构不是同一个时代的产物,但是两者之间有一些共同的技术和特点,如超执行绪、较高的预设时脉等。尽管Nehalem架构的微处理器预设时脉普遍较高,但能效比依然比Core微架构的制程改进版Penryn微架构的微处理器要高。2011年1月,Intel Nehalem微架构由其下一代微架构Intel Sandy Bridge所取代。

Intel Nehalem的架构设计有不少地方与AMD K10类似(譬如每核心独立电压及时脉等),但要比AMD K10的效能更佳、能耗更低。AMD后来也推出K10的改进版K10.5来与Intel的Nehalem竞争。

技术特点

Thumb
原生四核心的Nehalem微架构

整合北桥

全部型号的微处理器核心都整合了记忆体控制器,一般支援双通道DDR3 SDRAM,消费级产品最高支援三通道DDR3 SDRAM,而伺服器平台则可以支援四通道DDR3 SDRAM;除此以外还处理器核心还整合了PCI Express 2.0控制器。

直连式总线

从Nehalem微架构开始,Intel改用QPI/DMI直连式总线,放弃了传统的FSB。首发的Core i7使用了新的“Quick Path Interconnect”直连式总线,与AMD的HyperTransport相似。

相比FSB,每一个处理器都可以有独立的QPI通道与其他处理器连接,处理器之间不用再共享FSB频宽,并绕路到北桥才能通讯。此外,QPI是双向传输[4]

后来发布的Core i5i3,处理器内部仍使用QPI,但与外部晶片组连接则使用与QPI类似但较QPI的频宽小的DMI(Direct Media Interface)总线。

随著FSB的‘卸任’,一般意义上的‘外频’概念由‘基准时钟频率’(BLCK)所取代。[5]

模组化的多核心设计

处理器采用模组化设计[6]。例如核心、记忆体控制器、以至输入输出介面控制器,都能够以不同的数量配搭,而且都能做到原生多核心设计。这样使得Nehalem架构的处理器产品线可以做成双核心、四核心、六核心乃至八核心、十核心(仅见于Xeon E7[7],可以使到产品更容易针对不同市场。与AMD K10微架构类似,每一个模组都可以有独立的电压和独立的时脉,让处理器在不同负载水平的效能最大化的同时更省电。

二级分支预测器和新的转译后备缓冲区(Translation Lookaside Buffer,TLB)。

超执行绪

超执行绪技术回归:部分处理器型号支援超线程的技术。消费级市场发售的最高六核心,十二执行绪,企业级的更达到八核心,十六执行绪甚至到后期的十核心,二十执行绪。不仅多执行绪处理能力加强,Intel认为该技术还能最多提升处理器30%的效能。

快取

多级快取:每核心64KB的L1快取(32KB指令快取+32KB资料快取);每核心256KB的L2快取,虽容量大小较Core微架构的小但拥有更低的读写延迟值;与AMD K10一样,Intel Nehalem微架构的处理器都内建L3快取,每一个处理器共享最小4MB至最大12MB(企业级处理器更达到30MB)。

效能、电源管理

效能动态调节和电源管理:中高阶型号的处理器会支援Turbo Boost港澳地区没有正式官方中文名称,台湾官方中文名称为‘涡轮加速’,中国大陆官方中文名称为‘睿频’。其后该技术更名为Dynamic Speed,动态时脉[8])动态时脉调整技术,倘若有程式使用较多的处理器负载,处理器的频率可以按步骤提升,此外,可以自动往上提升倍频[9]该功能基本不需要作业系统的支援,完全由硬体监控[10]。除了时脉管理,电源管理方面引入Power Gates技术,核心闲置的时候可被关闭。对比上一代的Core架构,的核心电阻可以被关闭,电流可以完全不通过核心。各个处理器核心可运作于不同的频率电压[11]。Turbo Boost及Power Gates功能都是由同一个单元提供,占去大约一百万个晶体管[12]。而AMD K10及后来的改进版K10.5,核心必须手动才能关闭。

指令集

指令集更新:SIMD指令SSE4的版本会提升为SSE 4.2,SSE4.2在SSE4.1(于Core架构上)的基础上新增了7条指令[13];引入第二代Intel虚拟化技术,支援EPT(Extended Page Table,扩展分页表)、VPIDs(virtual processor identifiers,虚拟处理器标识)以及非屏蔽中断窗口退出(non-maskable interrupt-window exiting)。[14]Intel Nehalem架构的原子操作延时降低了50%,在试图限制原子的开销上。[15]

搭配晶片组

晶片组方面,Intel推出了5系列晶片组与之搭配,桌面平台有P5*、H5*、X5*等系列型号,其中P5*、H5*系列型号采用LGA1156插座,X5*采用LGA1366插座。代号Bloomfield的Core i7和后期第二批的Intel X58晶片组(允许更变倍频)的组合再次提升Intel平台的超频极限。核心代号Lynnfield的Core i5所使用的晶片组,更名为“PCH”(Platform Controller Hub,PCH,整合了一部分北桥和整个南桥),取代以往分离的北桥晶片和南桥晶片,成为单晶片组。[16]早期,处理器核心的电压与系统记忆体同步。此前,Intel官方表示首批处理器产品会支持DDR3-800和DDR3-1066规格的记忆体。对于DDR3-1333,由于处理器只可以接受较低的电压水平(限制在1.65V或以下),高速的记忆体意味著需要较高的电压,所以此规格的官方支援仍然存在疑问[17]。后来第二批X58晶片组主机版上,处理器核心电压与系统记忆体电压可以实现异步,方便用家超频[18]。另外,原先只有XE版本处理器可以调整记忆体频率。后来Intel修改为所有上市的Core i7处理器,均可以修改记忆体和QPI总线的频率[19]

效能和能耗之改进

尽管核心面积比Core架构要大不少,性能较Core架构系列则仍大幅提升,并没有令市场期望失望。[20]

与Core架构的45纳米制程版本Core相比,Nehalem架构:

  • 在相同的能耗下比Core架构的单执行绪效能高出10%至100%;
  • 同样的效能下的能耗平均比Core架构的低30%;
  • 每核心每时钟周期的效能平均比上代架构高12%至20%。

核心及其步进

More information 核心数量(记忆体通道数量、其他总线), 制程 ...
核心数量(记忆体通道数量、其他总线) 制程 晶片面积 CPUID Model 步进 流动平台 桌面平台、 UP Server DP Server MP Server
八核心(四通道) 45 nm 684 mm² 206E6 46 D0 Beckton (80604)
四核心(三通道) 45 nm 263 mm² 106A4
106A5
26 C0
D0
Bloomfield (80601) Gainestown (80602)
四核心(双通道、PCIe) 45 nm 296 mm² 106E4
106E5
30 B0
B1
Clarksfield (80607) Lynnfield (80605) Jasper Forest (80612)
双核心(双通道、PCIe、内建显示核心) 45 nm Auburndale (已取消) Havendale (已取消)
十核心(四通道)[21] 32 nm 513 mm² 206F2 47 A2 Westmere-EX (80615)
六核心(三通道) 32 nm 248 mm² 206C2 44 B1 Gulftown (80613) Westmere-EP (80614)
双核心(双通道、PCIe、内建显示核心) 32 nm
45 nm
81+114 mm² 20652
20655
37 C2
K0
Arrandale (80617) Clarkdale (80616)
Close
  • 极致效能级别的处理器无倍频限制;
  • 全部微处理器使用133MHz的基准时钟频率

处理器列表

继任微架构

Intel遵循Tick-Tock策略,于2011年第一季度发布了Intel Sandy Bridge微架构,正式取代Intel Nehalem微架构以及其制程改进版Intel Westmere微架构。

Thumb
Intel的微处理器架构路线图,从 NetBurst以及P6Tigerlake

参考

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.