来自维基百科,自由的百科全书
NVIDIA GeForce RTX 30系列是NVIDIA继GeForce RTX 20系列之後开发的圖形處理器系列。於2020年9月1日正式發佈,並於2020年9月17日開始發貨[1]。
![]() | 此條目可参照英語維基百科相應條目来扩充。 (2022年6月13日) |
![]() ![]() GeForce RTX 3090 創始版 | |
发布日期 | 2020年9月17日 |
---|---|
代号 | GA10x |
架构 | Ampere |
产品系列 | GeForce RTX |
电晶体 |
|
制造工艺 | 三星 8nm |
显示卡 | |
中端GPU | GeForce RTX 3050 GeForce RTX 3060 行動平台: RTX 3050 RTX 3050Ti RTX 3060 |
高端GPU | GeForce RTX 3060 Ti GeForce RTX 3070 GeForce RTX 3070 Ti 行動平台: RTX 3070 RTX 3070Ti |
旗舰GPU | GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090 GeForce RTX 3090 Ti 行動平台: RTX 3080 RTX 3080Ti |
API支持 | |
Direct3D | Direct3D 12 Ultimate(12_2) |
OpenGL | OpenGL 4.6 |
OpenCL | OpenCL 3.0 |
Vulkan | Vulkan 1.3 |
历史 | |
前代产品 | NVIDIA GeForce 20系列 |
后继产品 | NVIDIA GeForce 40系列 |
GeForce 30系列圖形處理器基于安培微架构,擁有第二代光線追踪核心和第三代張量核心,Nvidia稱其運行性能和能效約為之前图灵微架构圖形處理器的两倍[1][2],使用三星电子的8纳米工艺制造。
在上一代圖靈架構,引入了分數據類型計算的理念,將整數型(INT32)和單精度浮點型(FP32)兩種不同的數據類型交給兩種不同的ALU進行計算,提高了SM單元的並行計算效率。不過現代遊戲應用中最為常見的還是FP 32計算,INT 32 ALU的使用率比FP 32 ALU的低。為提升計算效率,新一代安培架構引入了可同時支援INT 32和FP 32兩種數據類型的新ALU,取代了原本只支援INT 32計算的ALU。也就是說,現在有兩條不同的數據路徑(Datapath),一條能夠處理整數或單精度浮點,另一條只能處理單精度浮點計算。原本整個SM單元同時可以處理64個INT 32計算指令和64個FP 32計算指令,安培上則是變成128個FP 32計算指令或64個INT 32計算指令和64個FP 32計算指令。為配合規模有一定擴張的計算單元,安培SM的共享緩存/L1數據緩存容量從96KB增長到了128KB,同時其帶寬變為原來的兩倍。
安培微架構的RT Core(Ray Tracing core,光線追踪核心)在圖靈架構的基礎上將三角形求交模塊數量增加到兩個(以並行方式運作),在基礎的BVH計算上面,新一代RT Core也能夠快上2倍。同時,第二代RT Core還增加了一個三角形位置內插模塊,在允許BVH內的數據做少量更新的情況下,就能實現移動物體運動模糊效果的顯著性能提升。在OptiX 7.0 中,開發人員可以為幾何體指定特定的移動路徑,讓每條射線和時間關聯起來,從而實現移動物體的所有運動模糊效果加速。
Tensor Core(張量核心)是專門針對深度學習加速設計的矩陣運算單元,可以執行基於深度學習的應用,例如光線追踪降噪和DLSS抗鋸齒渲染。圖靈中每個SM都配有8個Tensor Core(每個子核有兩個Tensor Core),每個Clock(週期)可以執行512個FP16 Tensor操作。而在安培架構,每個SM裡有4個Tensor Core(每個子核有一個Tensor Core),但是每個Tensor Core的處理能力倍增,因此每個SM也能執行512個FP16 Tensor操作。
第三代Tensor Core引入了BF16、TF32 兩種新的數據格式,並引入硬件稀疏化技術,操作的能力上增加一倍達到等效每週期1024 個FP16 操作。
Seamless Wikipedia browsing. On steroids.