GeForce RTX 20系列
来自维基百科,自由的百科全书
GeForce RTX 20系列是NVIDIA继GeForce GTX 10系列之后开发的图形处理器系列。该系列于2018年8月20日在Gamescom(科隆游戏展)上发布[1][2][3],首发产品是GeForce RTX 2080及2080Ti[4]。此系列产品被重命名为RTX而非沿用已使用多年的GTX,以突显对光线跟踪的支持。
![]() RTX 2080Ti 创始版 | |
发布日期 | 2018年9月20日 2019年7月9日 (Super系列) |
---|---|
代号 | TU10x |
架构 | Turing |
产品系列 | GeForce RTX |
电晶体 |
|
制造工艺 | 台积电 12nm(FinFET) |
显卡 | |
中端GPU | GeForce RTX 2050 GeForce RTX 2060 GeForce RTX 2060 Super |
高端GPU | GeForce RTX 2070 GeForce RTX 2070 Super GeFroce RTX 2080 GeForce RTX 2080 Super |
旗舰GPU | GeForce RTX 2080 Ti NVIDIA TITAN RTX |
API支持 | |
Direct3D | Direct3D 12 (12_2) |
OpenGL | OpenGL 4.6 |
OpenCL | OpenCL 1.2 |
Vulkan | Vulkan 1.2 |
历史 | |
前代产品 | GeForce 10系列 |
相关产品 | GeForce 16系列 |
后继产品 | GeForce 30系列 |
架构特性
RTX 20系列基于图灵微架构(Turing),其主要特点是支持实时光线跟踪(Ray tracing)技术。[5]该系列显卡通过搭载RT(光线追踪运算)核心,显著加速了光线跟踪的计算过程。这些核心能够高效处理四叉树和球形层次结构,并在碰撞模拟的过程中更快地为三角面组成的立体模型进行物体碰撞模拟。RT核心的光线追踪功能在模拟反射、折射和阴影的操作上可以取代传统的使用立方体贴图或深度贴图的光栅技术。从光线追踪运算得到的信息可以增强阴影使画面更加逼真,尤其是可以将发生于屏幕画面以外的动作通过阴影和光线反射渲染到画面之中。
该系列显卡还搭载了张量运算核心(Tensor Core)。张量核心最初是为深度学习任务设计的,例如训练图像超分辨率模型。然而,消费级显卡中的张量核心主要用于进行已经训练完成的深度学习模型的推理。这些模型的训练和分析通常在高性能计算机上进行,后者负责确定并优化实现特定目标(如图像超分辨率)的方法。之后,消费级显卡上的张量核心会使用这些经过高性能计算机训练获得的模型,从而实现例如提高图像分辨率等功能,如深度学习超级采样(DLSS)[6]。
NVIDIA早在基于帕斯卡和伏打图形处理微架构的GeForce GTX TITAN系列上就已经在画面运算中应用了深度学习和光线追踪技术,但由于当时设备性能的限制,仅能生成静态画面,而GeForce RTX 20系列则首次在画面处理中大规模采用深度学习技术,并引入了与深度学习相结合的光线追踪实时动态画面技术。[7]
细节
- GeForce RTX 20系列采用的台积电12nm FFN制程由伏特微架构使用的12nm FFC制程改进(但本质上依旧是台积电16nm FF+制程的延伸版本),性能是后者的1.1倍,功耗只有后者的70%,核心面积则可以缩小20%
- 为容纳数量庞大的运算单元,GeForce RTX 20系列的核心面积相比帕斯卡微架构大幅增加,由GP102(GeForce GTX 1080Ti)的471mm2增加至TU102(GeForce RTX 2080Ti)的754mm 2
- GeForce RTX 20系列支持 CUDA 计算能力 7.5
- GeForce RTX 20系列采用了全新的SM数组设计: TPC包含了两个SM单元(Pascal为1个),SM单元重新分配为64个FP32、64个INT32、8个Tensor Core 、1个RT Core ,同时添加了独立的INT数据路径,支持FP32和INT32操作的并发执行。
- 为共享暂存、一级暂存、纹理暂存引入了统一架构,一级暂存与共享暂存大小是灵活可变的,可以根据需要在64+32KB或者32+64KB之间变换,让一级暂存更充分利用资源,也减少一级暂存延迟,并提供比Pascal GPU中使用的一级暂存更高的带宽,同时二级暂存容量提升。
- Tensor Core(张量核心) : 负责人工智能、神经网络运算,增加了新的INT8和INT4精度模式,FP16半精度也能够被完整支持通常会用到矩阵融合乘加(FMA)运算,新的INT8精度模式的工作速率是此速率的两倍,张量核心为矩阵运算提供了显著的加速,除了新的神经图形功能外,还用于深度学习训练和推理操作。
- NGX (Neural Graphics Acceleration)框架: 利用张量核心,在游戏中实现深度学习功能,GeForce Experience会自动匹配Turing显卡并且下载可用的NGX Core软件包,对应如DLSS、AI InPainting、AI Super Rez、AI Slow-Mo等功能。
- DLSS (深度学习超级采样) : 利用张量核心实现在较低的实际分辨率下更快地渲染,。
- AI InPainting : 利用基于大量真实世界图像训练的模型,GeForce RTX 20系列可以补全图片中缺失的内容、移除照片的噪点、失真部分。
- AI Super Rez : GeForce RTX 20系列可以将原始图像的分辨率放大2倍、4倍、8倍,使图像更加锐利。
- AI Slow-Mo : GeForce RTX 20系列可以对常见的30fps的影片进行智能补帧计算,获得240/480fps的慢动作影片,而不需要专门的高帧率摄影机。
- RT Core : 一条专门为光线追踪计算设计的渲染流水线,用于加速计算边界体积层次(BVH)遍历以及光线和三角求交(光线投射)。
- 支持GDDR6显示内存
- 附有影像流压缩技术(Display Stream Compression,DSC)1.2版的DisplayPort 1.4a
- 功能集PureVideo的硬件加速视频解码
- NVLink连接器(与伏打微架构的不兼容)
- VirtualLink VR
- GPU Boost 4[8]
设计
在RTX的光线追踪示范程序中使用了微软的DXR 、NVIDIA的OptiX 以及Vulkan等API来实现光线追踪功能[9]。
芯片规格
另见
参见
扩展链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.