Ada Lovelace (微架构)
Nvidia設計的圖形處理單元微架構 来自维基百科,自由的百科全书
Ada Lovelace 是Nvidia開發的圖形處理單元(GPU) 微架構,用於取代上一代安培架構,於 2022 年 9 月 20 日正式宣布。架構名稱首次同時包含名字和姓氏,它以英國數學家愛達·勒芙蕾絲 [1]的名字命名,她通常被認為是第一位計算機程式設計師。 Nvidia 同時發布了使用該架構的GeForce 40 系列消費級顯卡 [2]和 RTX 6000 Ada Generation 專業工作站顯卡。 [3]據透露,新的 GPU 使用台積電新的5 納米「4N」工藝,與 Nvidia 用於上一代安培架構的三星8 納米和台積電N7工藝相比,效率更高。 [4]

發布於 | 2022 年 10 月 12 日 |
---|---|
設計者 | Nvidia |
製造商 | |
製造工藝 | TSMC 4N |
產品系列 | |
台式機系列 | |
專業級/
工作站系列 |
|
伺服器/
數據中心系列 |
|
技術規格 | |
時鐘頻率 | 735 MHz - 2640 MHz |
一級緩存 | 128 KB (每組 SM) |
二級緩存 | 32 MB - 96 MB |
顯存類型 | |
顯存頻率 | 21 - 22.4 Gbps |
PCIe版本 | PCIe 4.0 |
圖形API | |
DirectX | DirectX 12 Ultimate (12.2) |
Direct3D | Direct3D 12 |
Shader Model | Shader Model 6.7 |
OpenCL | OpenCL 3.0 |
OpenGL | OpenGL 4.6 |
CUDA | Compute Capability 8.9 |
Vulkan | Vulkan 1.3 |
通用計算API | |
CUDA | CUDA Toolkit 11.6 |
DirectCompute | 支持 |
媒體編解碼引擎 | |
編碼引擎 | |
解碼引擎 | |
色彩深度 |
|
編碼器 | NVENC |
顯示輸出 | |
歷史 | |
前代產品 | Ampere |
變體 | Hopper (數據中心) |
背景
Nvidia 執行長黃仁勛在 2022 年 9 月 20 日的 GTC 2022 主題演講中宣布了 Ada Lovelace 架構,該架構為 Nvidia 的遊戲、工作站和數據中心 GPU 提供動力。 [5]
微架構詳解
Ada Lovelace 架構的架構改進包括以下內容: [6]
每個 SM 單元包含 128 個 CUDA 核心。
Ada Lovelace 採用第三代光追單元。 其中,RTX 4090 具有 128 個光追單元,而上一代 RTX 3090 Ti 為 84 個。這 128 個光追單元可以提供高達 191 TFLOPS 的計算能力,其中每個光追單元 1.49 TFLOPS。 [10] 全新的光線追蹤管線引入了著色器執行重排序 (SER),Nvidia 聲稱它在光追工作負載中能提供 2 倍的性能提升。 [5]
第四代張量核心引入了基於 AI 的 DLSS 3 幀生成技術。Ada Lovelace 中每個 SM 單元包含 4 個張量核心,與上代安培架構非常相似。但是由於包含了更多的 SM 單元,張量核心的總數對比上代有所增加。
Ada Lovelace 架構的核心頻率顯著提高,RTX 4090 的基礎頻率甚至高於 RTX 3090 Ti 的加速 (Boost) 頻率。
完整版的 AD102 核心擁有高達 96 MB 的二級緩存,相比基於安培架構的 GA102 核心,有著十六倍的提升。 [11]相較於那些通過較慢GDDR顯存讀取數據的GPU,新的GPU能夠快速訪問大量二級緩存,這有利於複雜的操作,例如光線追蹤。與此同時,通過減少需要頻繁訪問的重要數據對顯存的依賴,較低位寬的顯存也可以和大容量二級緩存協同工作。
每個內存控制器占用一個 32 位連接,最高 12 個連接,組合得到內存匯流排位寬為 384 位。 Ada Lovelace 架構支持GDDR6或GDDR6X顯存。台式機 GeForce RTX 40 系列採用 GDDR6X 顯存,而相應的移動版本和 RTX A6000 工作站 GPU 則使用更節能的 GDDR6 顯存。
與上一代相比,Ada Lovelace 架構能夠使用更低的電壓。 [5] Nvidia 聲稱,RTX 4090 在與上一代旗艦 RTX 3090 Ti 使用相同 450W 功耗的情況下,性能提高了 2 倍。 [12]
能耗比的提升歸功於更先進的製造工藝。 Ada Lovelace 架構採用TSMC為Nvidia定製的頂尖4N工藝製造。上一代安培架構從 2018 年開始使用三星基於 8nm 的8N工藝節點,在該架構推出時已經是兩年前的製造工藝。 [13] [14] 此外,具有 763 億個電晶體的 AD102 晶片,電晶體密度為 1.255 億/mm 2 ,比 GA102 的 4510 萬/mm 2密度增加了 178%。
Ada Lovelace 架構採用了新的第 8 代 Nvidia NVENC視頻編碼器,以及從安培架構沿用下來的第 7 代 NVDEC 視頻解碼器。 [15]
NVENC AV1硬體編碼的加入,使得新架構支持高達 8K 60FPS 10 位色深。與H.264和H.265編解碼器相比,能夠以更低的比特率實現更高的視頻保真度。 [16] Nvidia 聲稱其採用 Ada Lovelace 架構的 NVENC AV1 編碼器比採用安培架構的 H.264 編碼器效率高 40%。 [17]
Ada Lovelace 架構因仍舊使用 32Gbps 的舊 DisplayPort 1.4a,不支持具備更高數據帶寬的DisplayPort 2.0接口而受到批評。 [18]因此,儘管 GPU 的性能能夠達到更高的幀率,但依然會受到 DisplayPort 1.4a 的刷新率限制。反觀同樣於 2022 年 10 月發布的英特爾Arc GPU 卻帶有 DisplayPort 2.0 接口。在 Ada Lovelace 發布的兩個月後, AMD對標的 RDNA 3 架構發布,RDNA 3 甚至支持 DisplayPort 2.1 。[19]
核心參數
晶片[20] | AD102 [21] | AD103 [22] | AD104 [23] | AD106 [24] | AD107 [25] |
---|---|---|---|---|---|
尺寸 | 608 mm2 | 378.6 mm2 | 295 mm2 | 190 mm2 | 146 mm2 |
電晶體 | 763億 | 459億 | 358億 | 未知 | |
電晶體密度 | 1.255 億/mm2 | 1.211 億/mm2 | 1.214 億/mm2 | ||
圖形處理集群
(GPC) |
12 | 7 | 5 | 3 | 2 |
流處理器
(SM) |
144 | 80 | 60 | 36 | 24 |
CUDA
核心 |
18432 | 10240 | 7680 | 4608 | 3072 |
紋理映射單元 | 576 | 320 | 240 | 144 | 96 |
渲染輸出單元 | 192 | 112 | 80 | 64 | 32 |
張量核心 | 576 | 320 | 240 | 144 | 96 |
光追單元 | 144 | 80 | 60 | 36 | 24 |
一級緩存 | 18 MB | 10 MB | 7.5 MB | 4.5 MB | 3 MB |
每個 SM 單元 128 KB | |||||
二級緩存 | 96 MB | 64 MB | 48 MB | 32 MB |
基於 Ada Lovelace 架構的產品
- GeForce RTX 40系列
- GeForce RTX 4050(移動端)(AD107)
- GeForce RTX 4060(移動端)(AD107)
- GeForce RTX 4070(移動端)(AD106)
- GeForce RTX 4070 (AD104)
- GeForce RTX 4070 Ti (AD104)
- GeForce RTX 4080(移動端)(AD104)
- GeForce RTX 4080 (AD103)
- GeForce RTX 4090(移動端)(AD103)
- GeForce RTX 4090 (AD102)
- 桌面工作站
- RTX 4000 SFF Ada Generation
- RTX 6000 Ada Generation
- 移動工作站
- RTX 2000 Max-Q Ada Laptop
- RTX 2000 Ada Laptop
- RTX 3000 Ada Laptop
- RTX 3500 Ada Laptop
- RTX 4000 Ada Laptop
- RTX 5000 Ada Laptop
- 數據中心
- L4
- L40
- L40G
- L40 CNX
參考資料
Wikiwand - on
Seamless Wikipedia browsing. On steroids.