GeForce RTX 20系列

GeForce RTX 20系列是NVIDIA继GeForce GTX 10系列之后开发的图形处理器系列。该系列于2018年8月20日在Gamescom（科隆游戏展）上发布^[1]^[2]^[3]，首发产品是GeForce RTX 2080及2080Ti^[4]。此系列产品被重命名为RTX而非沿用已使用多年的GTX，以突显对光线跟踪的支持。

事实速览 发布日期, 代号 ...

Geforce RTX 20 系列
RTX 2080Ti 创始版
发布日期	2018年9月20日，7年前（2018-09-20） 2019年7月9日，6年前（2019-07-09） (Super系列)
代号	TU10x
架构	Turing
产品系列	GeForce RTX
电晶体	108亿 12nm(TU106) 136亿 12nm(TU104) 186亿 12nm(TU102)
制造工艺	台积电 12nm(FinFET)
显卡
中端GPU	GeForce RTX 2050 GeForce RTX 2060 GeForce RTX 2060 Super
高端GPU	GeForce RTX 2070 GeForce RTX 2070 Super GeFroce RTX 2080 GeForce RTX 2080 Super
旗舰GPU	GeForce RTX 2080 Ti NVIDIA TITAN RTX
API支持
Direct3D	Direct3D 12 (12_2)
OpenGL	OpenGL 4.6
OpenCL	OpenCL 1.2
Vulkan	Vulkan 1.2
历史
前代产品	GeForce 10系列
相关产品	GeForce 16系列
后继产品	GeForce 30系列

Remove ads

架构特性

RTX 20系列基于图灵微架构（Turing），其主要特点是支持实时光线跟踪（Ray tracing）技术。^[5]该系列显卡通过搭载RT（光线追踪运算）核心，显著加速了光线跟踪的计算过程。这些核心能够高效处理四叉树和球形层次结构，并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统的使用立方体贴图或深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真，尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。

该系列显卡还搭载了张量运算核心（Tensor Core）。张量核心最初是为深度学习任务设计的，例如训练图像超分辨率模型。然而，消费级显卡中的张量核心主要用于进行已经训练完成的深度学习模型的推理。这些模型的训练和分析通常在高性能计算机上进行，后者负责确定并优化实现特定目标（如图像超分辨率）的方法。之后，消费级显卡上的张量核心会使用这些经过高性能计算机训练获得的模型，从而实现例如提高图像分辨率等功能，如深度学习超级采样（DLSS）^[6]。

NVIDIA早在基于帕斯卡和伏打图形处理微架构的GeForce GTX TITAN系列上就已经在画面运算中应用了深度学习和光线追踪技术，但由于当时设备性能的限制，仅能生成静态画面，而GeForce RTX 20系列则首次在画面处理中大规模采用深度学习技术，并引入了与深度学习相结合的光线追踪实时动态画面技术。^[7]

Remove ads

细节

GeForce RTX 20系列采用的台积电12nm FFN制程由伏特微架构使用的12nm FFC制程改进（但本质上依旧是台积电16nm FF+制程的延伸版本），性能是后者的1.1倍，功耗只有后者的70%，核心面积则可以缩小20%
为容纳数量庞大的运算单元，GeForce RTX 20系列的核心面积相比帕斯卡微架构大幅增加，由GP102（GeForce GTX 1080Ti）的471mm²增加至TU102（GeForce RTX 2080Ti）的754mm²
GeForce RTX 20系列支持 CUDA 计算能力 7.5
GeForce RTX 20系列采用了全新的SM数组设计: TPC包含了两个SM单元(Pascal为1个)，SM单元重新分配为64个FP32、64个INT32、8个Tensor Core 、1个RT Core ，同时添加了独立的INT数据路径，支持FP32和INT32操作的并发执行。
为共享暂存、一级暂存、纹理暂存引入了统一架构，一级暂存与共享暂存大小是灵活可变的，可以根据需要在64+32KB或者32+64KB之间变换，让一级暂存更充分利用资源，也减少一级暂存延迟，并提供比Pascal GPU中使用的一级暂存更高的带宽，同时二级暂存容量提升。
Tensor Core（张量核心） : 负责人工智能、神经网络运算，增加了新的INT8和INT4精度模式，FP16半精度也能够被完整支持通常会用到矩阵融合乘加(FMA)运算，新的INT8精度模式的工作速率是此速率的两倍，张量核心为矩阵运算提供了显著的加速，除了新的神经图形功能外，还用于深度学习训练和推理操作。
NGX (Neural Graphics Acceleration)框架: 利用张量核心，在游戏中实现深度学习功能，GeForce Experience会自动匹配Turing显卡并且下载可用的NGX Core软件包，对应如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
DLSS (深度学习超级采样) : 利用张量核心实现在较低的实际分辨率下更快地渲染，。
AI InPainting : 利用基于大量真实世界图像训练的模型，GeForce RTX 20系列可以补全图片中缺失的内容、移除照片的噪点、失真部分。
AI Super Rez : GeForce RTX 20系列可以将原始图像的分辨率放大2倍、4倍、8倍，使图像更加锐利。
AI Slow-Mo : GeForce RTX 20系列可以对常见的30fps的影片进行智能补帧计算，获得240/480fps的慢动作影片，而不需要专门的高帧率摄影机。
RT Core : 一条专门为光线追踪计算设计的渲染流水线，用于加速计算边界体积层次（BVH）遍历以及光线和三角求交（光线投射）。
支持GDDR6显示内存
附有影像流压缩技术（Display Stream Compression，DSC）1.2版的DisplayPort 1.4a
功能集PureVideo的硬件加速视频解码
NVLink连接器（与伏打微架构的不兼容）
VirtualLink VR
GPU Boost 4^[8]

Remove ads

设计

在RTX的光线追踪示范程序中使用了微软的DXR 、NVIDIA的OptiX 以及Vulkan等API来实现光线追踪功能^[9]。

芯片规格

更多信息 型号, 推出日期 ...

型号	推出日期	核心代号	制程 (nm)	晶体管数 & 晶粒面积	核心配置				时钟频率			填充率		显示内存				运算性能 (TFLOPS)				每秒光线数 (十亿)	总线接口	TDP (W)	NVLink 支持	发售价格(美金)
型号	推出日期	核心代号	制程 (nm)	晶体管数 & 晶粒面积	核心配置 ^{SPs:TMUs:ROPs^[a]}	光追核心	张量核心	二级暂存 (MB)	默认 (MHz)	加速 (MHz)	存储器 (MT/s)	像素 (GP/s)	材质 (GT/s)	容量 (GB)	带宽 (GB/s)	类型	接口带宽 (比特)	单精度 (加速)	双精度 (加速)	半精度 (加速)	张量浮点	每秒光线数 (十亿)	总线接口	TDP (W)	NVLink 支持	零售版	创始版
GeForce RTX 2060	2019年 1月15日	TU106- 200A- KA-A1	12	108亿 445mm²	1920:120:48 （30 SM）	30	240	3	1365	1680	14000	65.52	163.8	6	336	GDDR6	192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5	PCIe 3.0 x16	160	否	$349
GeForce RTX 2060 TU104	2020年 1月10日	TU104- 150-KC- A1		136亿 545mm²	1920:120:48 （30 SM）	30	240	3	1365	1680		65.52	163.8	6	336		192	5.24 (6.45)	0.16 (0.20)	10.5 (12.9)	51.6	5		160		$300
GeForce RTX 2060 Super	2019年 7月9日	TU106- 410- A1		108亿 445mm²	2176:136:64 （34 SM）	34	272	4	1470	1650		90.5	191.4	8	448		256	6.12 (7.18)	0.19 (0.22)	12.2 (14.4)	57.4	6		175		$399
GeForce RTX 2070	2018年 10月17日	TU106- 400-A1			2304:144:64 （36 SM）	36	288		1410	1620		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499	不适用
GeForce RTX 2070	2018年 10月17日	TU106- 400A-A1			2304:144:64 （36 SM）	36	288		1410	1620+		90.24	203.04					6.50 (7.47)	0.20 (0.23)	12.3 (14.9)	59.7					$499+	$599
GeForce RTX 2070 Super	2019年 7月9日	TU104- 410-A1		136亿 545mm²	2560:160:64 （40 SM）	40	320		1605	1770		102.72	256.8					8.22 (9.06)	0.26 (0.28)	16.4 (18.1)	72.5	7		215	2路 NVLink	$499
GeForce RTX 2080	2018年 9月20日	TU104- 400-A1			2944:184:64 （46 SM）	46	368		1515	1710		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5	8				$699	不适用
GeForce RTX 2080	2018年 9月20日	TU104- 400A-A1			2944:184:64 （46 SM）	46	368		1515	1710+		96.96	278.76					8.92 (10.1)	0.28 (0.32)	17.8 (20.1)	80.5					$699+	$799
GeForce RTX 2080 Super	2019年 7月23日	TU104- 450-A1			3072:192:64 （48 SM）	48	384		1650	1815	15500	105.6	316.8		496			10.1 (11.2)	0.32 (0.35)	20.3 (22.3)	89.2			250		$699
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300-K1- A1		186亿 754mm²	4352:272:88 （68 SM）	68	544	5.5	1350	1545	14000	118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999	不适用
GeForce RTX 2080 Ti	2018年 9月27日	TU102- 300A-K1- A1			4352:272:88 （68 SM）	68	544	5.5		1545+		118.8	367.2	11	616		352	11.8 (13.4)	0.37 (0.42)	23.5 (26.9)	107.6	10				$999+	$1,199
NVIDIA Titan RTX	2018年 12月18日	TU102- 400-A1			4608:288:96 （72 SM）	72	576	6		1770		129.6	388.8	24	672		384	12.4 (16.3)	0.39 (0.51)	24.9 (32.6)	130.5	11		280		$2,499

[a]
流处理器数量 : 纹理映射单元数量 : 渲染输出单元数量

Remove ads

另见

参见

Loading content...

扩展链接

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads