NVIDIA GeForce 800系列,是英伟达研发的图形处理器产品系列,用于手提电脑平台。此代显示核心将采用新的Maxwell微架构(晶片代号将以‘GM’开头),以苏格兰理论物理学家詹姆士·克拉克·麦克斯韦的名字命名。2014年初悄然发表的行动型显示核心GeForce 820M,尽管列入GeForce 800系列,但仍采用GeForce 500系列‘Fermi’架构的GF117显示核心,因此仅仅是旧型号显示核心更名而已。[1][2]首款基于Maxwell微架构的显示核心实际为GeForce 700系列上的GeForce GTX 750以及750 Ti。[3][4][5]后来,NVIDIA也陆续发布移动平台的GeForce 800M系列的其他型号,除GeForce 830M、840M、GTX 850M以及GTX 860M的部分批量以外,其余的均使用旧有显示核心。NVIDIA宣布新一代Maxwell核心的首发两款产品将被命名为NVIDIA GeForce 900系列,分别为GTX 970和GTX 980。[6][7]而预计GeForce 800系列将使用在OEM市场,就像之前的GeForce 100和GeForce 300系列。
发布日期 | 2014年 |
---|---|
代号 | Fermi (28nm) GF117 Kepler(28nm) GK104 Maxwell (28nm/20nm) GM107 GM108 |
显卡 | |
入门GPU | 移动平台:820M、830M、840M |
中端GPU | 移动平台:GTX 850M、GTX 860M |
高端GPU | 移动平台:GTX 870M、GTX 880M |
API支持 | |
Direct3D | Direct3D 12 Shader Model 5.0 |
OpenGL | OpenGL 4.4 |
OpenCL | OpenCL 1.2 |
历史 | |
前代产品 | GeForce 700系列 |
后继产品 | GeForce 900系列 |
概观
用于GeForce 800系列上的‘Maxwell’显示核心架构,是用于GeForce 600以及700系列‘Kepler’显示核心架构的下一代,将首次在显示核心上内建ARM架构的CPU核心。[8][9]NVIDIA的CEO黄仁勋称,这样做使得GPU更加独立于主CPU[10]。NVIDIA称‘Maxwell’显示核心架构对比‘Kepler’架构,会有更高的图形处理性能、更简化的可编程性以及更好的能效比。[11]
2010年9月NVIDIA宣布下一代显示核心架构‘Maxwell’。[12]首款基于‘Maxwell’架构的消费级显示核心的产品将于2014年早期发卖。[13]稍后将有基于‘Maxwell’显示核心的NVIDIA Tesla运算卡以及NVIDIA Quadro专业图形卡。最后会有供手持式装置使用的基于该架构的NVIDIA Tegra系统单片机出现。[11]
架构特性
初期,Maxwell架构显示核心,仍采用台积电的28nm制程,核心规模也较为有限。首代Maxwell显示核心有GM107和GM108,均面向消费级市场,相比Kepler而言仅是多了一些Kepler架构所没有的附加功能特性,性能、功耗及能效比上与Kepler相去不远。这些新增的特性主要有:
GM107的L2缓存,由GK107的256KB,大幅增加到2MB,大大降低对显示内存的带宽需求。相应地,NVIDIA仅为GM107的使用128位的存储器控制器位宽,而GM107的性能与kepler的192位元存储器位宽的GK106不相上下,除此以外,减少了存储器位宽,还会节省电能。[14]
Kepler时代,CUDA核心/流处理器数组被NVIDIA称作SMX,而Maxwell的设计,则改称SMM。SMM数组中,各数组是分离独立的,因此数组中的4个调度引擎控制各自所属的FP32 CUDA核心、加载/存储单元以及特殊功能单元,不像Kepler那样一个调度引擎需要共享资源。不过,纹理单元以及FP64 CUDA核心则仍然是共享的。[14]SMM提供比SMX更细粒度的资源分配,当负载并非为共享资源优化时节省电力。NVIDIA称128个CUDA核心的SMM可以达到192个CUDA核心的SMX的90%的性能。[14]
相比GK110/GK208支持CUDA 3.5,GM107可以支持CUDA 5.0通用运算库。在GK110/GK208上现身的动态并发以及HyperQ,基于Maxwell架构的显示核心会全面支持。Maxwell架构为32位整数的原子操作提供原生共享存储器,支持32位和64位的数据比较和交换(compare-and-swap,CAS),可实现其它形式的原子操作功能。
Maxwell架构全面支持DirectX 12。[15]
继任架构
接替‘Maxwell’显示核心架构的,是NVIDIA于2013年3月宣布的代号‘Volta’的显示核心架构。[16]2014年,这个构想的架构被定名为‘Pascal’[17][18] ‘Pascal’将实现片上堆栈式动态随机存储器(DRAM),或称‘片上显示内存’,统一存储器架构以及NVLink。[19][17]
产品介绍
首款基于Maxwell架构的显示核心是GM107,但它却被划入GeForce 700系列,是为GeForce GTX 750和GTX 750 Ti,均使用28纳米制程,[14]它们均于2014年2月18日发布。GeForce GTX 750和GTX 750 Ti的TDP分别仅为55瓦和60瓦,这样使得它们都能直接从PCIe插槽中获取足够的电能而无需辅助供电连接端口。[14]第二款基于Maxwell架构的显示核心GM204被划入GeForce 900系列,是为GeForce GTX 970和GTX 980,它们均于2014年9月19日发布。
GeForce 800M的首发产品是GeForce 820M[20] - 使用‘Fermi’显示核心架构的GF117显示核心,仅支持PCI-E 2.0,但支持DirectX 11.2、OpenGL 4.4、OpenCL 1.1、FXAA以及Optimus双显示核心切换,搭载DDR3显示内存。其后发布的GeForce 830M、840M使用规格较低,但基于Maxwell架构的GM108显示核心。GeForce GTX 850M以及GTX 860M后来推出的批量,采用GM107显示核心。GeForce GTX 860M早期版本、870M以及880M均使用GK104核心,但各型号的核心配置不一。
晶片规格
GeForce 800系列本代仅供手提电脑使用,而同架构的台式电脑用图形处理器产品,则为GeForce 900系列以及GeForce GTX 750/750Ti。
- 1 统一渲染器/流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量
- 2 像素填充率的估算:ROP的数量乘以基准核心时钟频率(时脉单位Hz),单位像素数每秒(P/s)
- 3 纹理填充率的估算:TMU的数量乘以基准核心时钟频率(时脉单位Hz),单位纹理数每秒(T/s)
- 4 全系列可支持Direct3D 12,但功能层级会是更低的Feture Level 11_0
- 5 单精度浮点数处理性能的估算,由着色器时脉乘以CUDA核心/流处理器数量和每时钟周期CUDA核心/流处理器指令数;双精度浮点数处理性能的估算:核心代号“GMxxx”的为单精度浮点数的1/32,核心代号“GKxxx”的为单精度浮点数的1/24
- 6 时脉资料与实际使用的可能有差别,核心代号“GFxxx”的核心时脉分为两部分:CUDA核心时脉/着色器时脉
型号 | 推出年分 | 晶片代号 | 制程 (纳米) |
晶体管数 (百万个) |
晶粒面积 (平方毫米) |
总线接口 | 核心配置 SPs:TMUs:ROPs1 |
时脉配置 | 填充率 | 显示内存配置 | API支持(版本)4 | 运算性能 (GFLOPS) |
热设计功耗 (W) | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
默认 (MHz)6 |
加速 (MHz) |
存储器 (MT/s) |
像素 (GP/s)2 |
材质 (GT/s)3 |
容量 (MiB) |
总线类型 | 总线宽度 (位元) |
带宽 (GB/s) |
DirectX | OpenGL | OpenCL | Vulkan | 单精度浮点数5 | 双精度浮点数5 | |||||||||
GeForce 800M[21][22] | 2014年3月17日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x8 | 48:8:8 (1 SM) |
738/1476 | N/A | 1800 | 1.476 | 5.9 | 2048 | DDR3 | 64 | 14.4 | 11.0 | 4.5 | 1.1 | 未知 | 141.7 | 未知 | 15 |
GeForce 810M (GF117)[23] | 2014年3月24日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x16 | 48:8:8 (1 SM) |
738/1476 | N/A | 1800 | 1.576 | 5.9 | 1024 2048 |
DDR3 | 64 | 16 | 11.0 | 4.4 | 1.1 | 未知 | 141.7 | 未知 | 15 |
GeForce 810M (GK107)[24] | 2015年3月21日 | GK107 | 28 | 1270 | 118 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
810 | 未知 | 1800 | 6.48 | 25.92 | 1024 2048 |
DDR3 | 128 | 28 | 11.2 | 4.5 | 1.2 | 未知 | 622.1 | 未知 | 45 |
GeForce 820M (GF117)[20][25] | 2013年11月27日 | GF117 | 28 | 585 | 116 | PCIe 2.0 x16 | 96:16:4 (2 SM) |
625/1250~775/1550 | N/A | 1800 | 2.5~3.1 | 10~12.4 | 1024 2048 |
DDR3 | 64 | 14.4 | 11.0 | 4.4 | 1.1 | 未知 | 240~297.6 | 未知 | 15 |
GeForce 820M (GK107)[26] | 2015年3月21日 | GK107 | 28 | 1270 | 118 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
810 | 未知 | 1800 | 6.48 | 25.92 | 1024 2048 |
DDR3 | 128 | 28 | 11.2 | 4.5 | 1.2 | 未知 | 622.1 | 未知 | 45 |
GeForce 825M[27] | 2014年3月12日 | GK208 | 28 | 未知 | 87 | PCIe 3.0 x16 | 384:32:16 (2 SMX) |
850 | 未知 | 1800 | 6.8 | 27.20 | 1024 2048 |
DDR3 | 64 | 14.4 | 12.0 | 4.5 | 1.2 | 1.0 | 652.8 | 未知 | 33 |
GeForce 830M[28] | 2014年3月12日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0/2.0 x16 | 256:16:8 (2 SMM) |
1082 | 1150 | 1800 | 8.66 | 17.31 | 2048 | DDR3 | 64 | 14.4 | 12.0 | 4.5 | 1.2 | 1.0 | 554 | 未知 | 33 |
GeForce 840M [29] | 2014年3月12日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0/2.0 x16 | 384:24:8 (3 SMM) |
1029 | 1124 | 2000 | 8.2 | 24.7 | 1024 2048 |
DDR3 | 64 | 16.02 | 12.0 | 4.5 | 1.2 | 1.0 | 790.3 | 未知 | 33 |
GeForce 845M (GM107)[30] | 2015年2月7日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 512:32:16 (4 SMM) |
863 | 未知 | 2000 | 13.81 | 27.62 | 1024 2048 |
DDR3 | 64 | 16 | 12.0 | 4.5 | 1.2 | 1.0 | 883.7 | 未知 | 45 |
GeForce 845M (GM108)[31] | 2015年8月26日 | GM108 | 28 | 未知 | 未知 | PCIe 3.0 x16 | 384:24:8 (3 SMM) |
1071 | 1176 | 5000 | 17.14 | 34.3 | 1024 2048 |
GDDR5 | 64 | 40 | 12.0 | 4.5 | 1.2 | 1.0 | 822.5 | 未知 | 33 |
GeForce GTX 850M[32] | 2014年3月14日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 640:40:16 (5 SMM) |
936 | 未知 | 5000 | 14.4 | 36.1 | 2048 | GDDR5 DDR3 |
128 | 80 32 |
12.0 | 4.5 | 1.2 | 1.0 | 1198.1 | 未知 | 45 |
GeForce GTX 860M (GK104)[33][34] | 2014年3月10日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1152:96:16 (6 SMX) |
797 | 915 | 5000 | 19.13 | 76.5 | 2048 | GDDR5 | 128 | 80 | 12.0 | 4.5 | 1.2 | 1.0 | 1836.3 | 未知 | 75 |
GeForce GTX 860M (GM107)[33][35] | 2015年2月5日 | GM107 | 28 | 1870 | 148 | PCIe 3.0 x16 | 640:40:16 (5 SMM) |
1020 | 1085 | 5000 | 16.32 | 41.2 | 2048 | GDDR5 | 128 | 80 | 12.0 | 4.5 | 1.2 | 1.0 | 1317.1 | 未知 | 75 |
GeForce GTX 870M[36] | 2014年3月12日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1344:112:32 (7 SMX) |
941 | 967 | 5000 | 30.1 | 105.4 | 3072 | GDDR5 | 192 | 120 | 12.0 | 4.5 | 1.2 | 1.0 | 2529.4 | 未知 | 100 |
GeForce GTX 880M[37] | 2014年3月12日 | GK104 | 28 | 3540 | 294 | PCIe 3.0 x16 | 1536:128:32 (8 SMX) |
954 | 993 | 5000 | 30.53 | 122.1 | 4096 8192 |
GDDR5 | 256 | 160 | 12.0 | 4.5 | 1.2 | 1.0 | 2930.7 | 未知 | 122 |
参见
参考资料
外部链接
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.