NVIDIA GeForce 800系列,是英伟达研发的图形处理器产品系列,用于手提电脑平台。此代显示核心将采用新的Maxwell微架构(晶片代号将以‘GM’开头),以苏格兰理论物理学詹姆士·克拉克·麦克斯韦的名字命名。2014年初悄然发表的行动型显示核心GeForce 820M,尽管列入GeForce 800系列,但仍采用GeForce 500系列‘Fermi’架构的GF117显示核心,因此仅仅是旧型号显示核心更名而已。[1][2]首款基于Maxwell微架构的显示核心实际为GeForce 700系列上的GeForce GTX 750以及750 Ti。[3][4][5]后来,NVIDIA也陆续发布移动平台的GeForce 800M系列的其他型号,除GeForce 830M、840M、GTX 850M以及GTX 860M的部分批量以外,其余的均使用旧有显示核心。NVIDIA宣布新一代Maxwell核心的首发两款产品将被命名为NVIDIA GeForce 900系列,分别为GTX 970和GTX 980。[6][7]而预计GeForce 800系列将使用在OEM市场,就像之前的GeForce 100GeForce 300系列。

Quick Facts 发布日期, 代号 ...
NVIDIA GeForce 800系列
发布日期2014年
代号Fermi (28nm)
GF117
Kepler(28nm)
GK104
Maxwell (28nm/20nm)
GM107
GM108
显卡
入门GPU移动平台:820M、830M、840M
中端GPU移动平台:GTX 850M、GTX 860M
高端GPU移动平台:GTX 870M、GTX 880M
API支持
Direct3DDirect3D 12
Shader Model 5.0
OpenGLOpenGL 4.4
OpenCLOpenCL 1.2
历史
前代产品GeForce 700系列
后继产品GeForce 900系列
Close

概观

用于GeForce 800系列上的‘Maxwell’显示核心架构,是用于GeForce 600以及700系列‘Kepler’显示核心架构的下一代,将首次在显示核心上内建ARM架构的CPU核心。[8][9]NVIDIA的CEO黄仁勋称,这样做使得GPU更加独立于主CPU[10]。NVIDIA称‘Maxwell’显示核心架构对比‘Kepler’架构,会有更高的图形处理性能、更简化的可编程性以及更好的能效比[11]

2010年9月NVIDIA宣布下一代显示核心架构‘Maxwell’。[12]首款基于‘Maxwell’架构的消费级显示核心的产品将于2014年早期发卖。[13]稍后将有基于‘Maxwell’显示核心的NVIDIA Tesla运算卡以及NVIDIA Quadro专业图形卡。最后会有供手持式装置使用的基于该架构的NVIDIA Tegra系统单片机出现。[11]

架构特性

初期,Maxwell架构显示核心,仍采用台积电的28nm制程,核心规模也较为有限。首代Maxwell显示核心有GM107和GM108,均面向消费级市场,相比Kepler而言仅是多了一些Kepler架构所没有的附加功能特性,性能、功耗及能效比上与Kepler相去不远。这些新增的特性主要有:

  • NVENC性能的加强。NVENC是NVIDIA开发的视频解码器,在初代Maxwell显示核心上的性能为1.5倍到2倍于Kepler显示核心,在6到8倍的回放速率使仍能实时解码。[14]
  • PureVideo性能加强。NVIDIA提升了Maxwell的视频解码缓存和存储器存取效率,称在Pure Video E功能集视频解码时,比以往的有8到10倍性能提升。然而,H.265硬件解码的支持度仍然不完整,需要软件以及硬件共同执行。[14]
  • 新增一个电源模式‘GC5’。当显示核心进行视频解码作业时,会进入一个新的‘GC5’电源模式,只保留视频解码所需的电路单元的电力供应,节省电力。[14]

显示内存

GM107的L2缓存,由GK107的256KB,大幅增加到2MB,大大降低对显示内存的带宽需求。相应地,NVIDIA仅为GM107的使用128位的存储器控制器位宽,而GM107的性能与kepler的192位元存储器位宽的GK106不相上下,除此以外,减少了存储器位宽,还会节省电能。[14]

SMM

Kepler时代,CUDA核心/流处理器数组被NVIDIA称作SMX,而Maxwell的设计,则改称SMM。SMM数组中,各数组是分离独立的,因此数组中的4个调度引擎控制各自所属的FP32 CUDA核心、加载/存储单元以及特殊功能单元,不像Kepler那样一个调度引擎需要共享资源。不过,纹理单元以及FP64 CUDA核心则仍然是共享的。[14]SMM提供比SMX更细粒度的资源分配,当负载并非为共享资源优化时节省电力。NVIDIA称128个CUDA核心的SMM可以达到192个CUDA核心的SMX的90%的性能。[14]

通用运算

相比GK110/GK208支持CUDA 3.5,GM107可以支持CUDA 5.0通用运算库。在GK110/GK208上现身的动态并发以及HyperQ,基于Maxwell架构的显示核心会全面支持。Maxwell架构为32位整数的原子操作提供原生共享存储器,支持32位和64位的数据比较和交换(compare-and-swap,CAS),可实现其它形式的原子操作功能。

API

Maxwell架构全面支持DirectX 12。[15]

继任架构

接替‘Maxwell’显示核心架构的,是NVIDIA于2013年3月宣布的代号‘Volta’的显示核心架构。[16]2014年,这个构想的架构被定名为‘Pascal’[17][18] ‘Pascal’将实现片上堆栈式动态随机存储器(DRAM),或称‘片上显示内存’,统一存储器架构以及NVLink。[19][17]

产品介绍

桌面型平台

首款基于Maxwell架构的显示核心是GM107,但它却被划入GeForce 700系列,是为GeForce GTX 750和GTX 750 Ti,均使用28纳米制程,[14]它们均于2014年2月18日发布。GeForce GTX 750和GTX 750 Ti的TDP分别仅为55瓦和60瓦,这样使得它们都能直接从PCIe插槽中获取足够的电能而无需辅助供电连接端口。[14]第二款基于Maxwell架构的显示核心GM204被划入GeForce 900系列,是为GeForce GTX 970和GTX 980,它们均于2014年9月19日发布。

移动平台

GeForce 800M的首发产品是GeForce 820M[20] - 使用‘Fermi’显示核心架构的GF117显示核心,仅支持PCI-E 2.0,但支持DirectX 11.2、OpenGL 4.4、OpenCL 1.1、FXAA以及Optimus双显示核心切换,搭载DDR3显示内存。其后发布的GeForce 830M、840M使用规格较低,但基于Maxwell架构的GM108显示核心。GeForce GTX 850M以及GTX 860M后来推出的批量,采用GM107显示核心。GeForce GTX 860M早期版本、870M以及880M均使用GK104核心,但各型号的核心配置不一。

晶片规格

GeForce 800系列本代仅供手提电脑使用,而同架构的台式电脑用图形处理器产品,则为GeForce 900系列以及GeForce GTX 750/750Ti。

  • 1 统一渲染器/流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量
  • 2 像素填充率的估算:ROP的数量乘以基准核心时钟频率(时脉单位Hz),单位像素数每秒(P/s)
  • 3 纹理填充率的估算:TMU的数量乘以基准核心时钟频率(时脉单位Hz),单位纹理数每秒(T/s)
  • 4 全系列可支持Direct3D 12,但功能层级会是更低的Feture Level 11_0
  • 5 单精度浮点数处理性能的估算,由着色器时脉乘以CUDA核心/流处理器数量和每时钟周期CUDA核心/流处理器指令数;双精度浮点数处理性能的估算:核心代号“GMxxx”的为单精度浮点数的1/32,核心代号“GKxxx”的为单精度浮点数的1/24
  • 6 时脉资料与实际使用的可能有差别,核心代号“GFxxx”的核心时脉分为两部分:CUDA核心时脉/着色器时脉
More information 型号, 推出年分 ...
型号 推出年分 晶片代号 制程
(纳米)
晶体管数
(百万个)
晶粒面积
(平方毫米)
总线接口 核心配置
SPs:TMUs:ROPs1
时脉配置 填充率 显示内存配置 API支持(版本)4 运算性能
(GFLOPS)
热设计功耗
(W)
默认
(MHz)6
加速
(MHz)
存储器
(MT/s)
像素
(GP/s)2
材质
(GT/s)3
容量
(MiB)
总线类型 总线宽度
(位元)
带宽
(GB/s)
DirectX OpenGL OpenCL Vulkan 单精度浮点数5 双精度浮点数5
GeForce 800M[21][22] 2014年3月17日 GF117 28 585 116 PCIe 2.0 x8 48:8:8
(1 SM)
738/1476 N/A 1800 1.476 5.9 2048 DDR3 64 14.4 11.0 4.5 1.1 未知 141.7 未知 15
GeForce 810M (GF117)[23] 2014年3月24日 GF117 28 585 116 PCIe 2.0 x16 48:8:8
(1 SM)
738/1476 N/A 1800 1.576 5.9 1024
2048
DDR3 64 16 11.0 4.4 1.1 未知 141.7 未知 15
GeForce 810M (GK107)[24] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 820M (GF117)[20][25] 2013年11月27日 GF117 28 585 116 PCIe 2.0 x16 96:16:4
(2 SM)
625/1250~775/1550 N/A 1800 2.5~3.1 10~12.4 1024
2048
DDR3 64 14.4 11.0 4.4 1.1 未知 240~297.6 未知 15
GeForce 820M (GK107)[26] 2015年3月21日 GK107 28 1270 118 PCIe 3.0 x16 384:32:16
(2 SMX)
810 未知 1800 6.48 25.92 1024
2048
DDR3 128 28 11.2 4.5 1.2 未知 622.1 未知 45
GeForce 825M[27] 2014年3月12日 GK208 28 未知 87 PCIe 3.0 x16 384:32:16
(2 SMX)
850 未知 1800 6.8 27.20 1024
2048
DDR3 64 14.4 12.0 4.5 1.2 1.0 652.8 未知 33
GeForce 830M[28] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 256:16:8
(2 SMM)
1082 1150 1800 8.66 17.31 2048 DDR3 64 14.4 12.0 4.5 1.2 1.0 554 未知 33
GeForce 840M [29] 2014年3月12日 GM108 28 未知 未知 PCIe 3.0/2.0 x16 384:24:8
(3 SMM)
1029 1124 2000 8.2 24.7 1024
2048
DDR3 64 16.02 12.0 4.5 1.2 1.0 790.3 未知 33
GeForce 845M (GM107)[30] 2015年2月7日 GM107 28 1870 148 PCIe 3.0 x16 512:32:16
(4 SMM)
863 未知 2000 13.81 27.62 1024
2048
DDR3 64 16 12.0 4.5 1.2 1.0 883.7 未知 45
GeForce 845M (GM108)[31] 2015年8月26日 GM108 28 未知 未知 PCIe 3.0 x16 384:24:8
(3 SMM)
1071 1176 5000 17.14 34.3 1024
2048
GDDR5 64 40 12.0 4.5 1.2 1.0 822.5 未知 33
GeForce GTX 850M[32] 2014年3月14日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
936 未知 5000 14.4 36.1 2048 GDDR5
DDR3
128 80
32
12.0 4.5 1.2 1.0 1198.1 未知 45
GeForce GTX 860M (GK104)[33][34] 2014年3月10日 GK104 28 3540 294 PCIe 3.0 x16 1152:96:16
(6 SMX)
797 915 5000 19.13 76.5 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1836.3 未知 75
GeForce GTX 860M (GM107)[33][35] 2015年2月5日 GM107 28 1870 148 PCIe 3.0 x16 640:40:16
(5 SMM)
1020 1085 5000 16.32 41.2 2048 GDDR5 128 80 12.0 4.5 1.2 1.0 1317.1 未知 75
GeForce GTX 870M[36] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1344:112:32
(7 SMX)
941 967 5000 30.1 105.4 3072 GDDR5 192 120 12.0 4.5 1.2 1.0 2529.4 未知 100
GeForce GTX 880M[37] 2014年3月12日 GK104 28 3540 294 PCIe 3.0 x16 1536:128:32
(8 SMX)
954 993 5000 30.53 122.1 4096
8192
GDDR5 256 160 12.0 4.5 1.2 1.0 2930.7 未知 122
Close

参见

参考资料

外部链接

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.