Remove ads
Microarchitecture de carte graphique développée par NVIDIA De Wikipédia, l'encyclopédie libre
Ampere est une microarchitecture de processeur graphique développée par Nvidia pour ses cartes graphiques. Elle succède à la microarchitecture Turing et est sortie en mai 2020.
Date de sortie | 14 mai 2020 |
---|---|
Procédé |
TSMC N7 (professionnel) Samsung 8N (grand public) |
Direct3D | 12 |
---|---|
OpenGL | 4.6 |
Vulkan | 1.1 |
CUDA (Compute Capability) | 8.0 ou 8.6 |
Prédécesseur |
Turing (grand public) Volta (professionnel) |
---|---|
Successeur |
Ada Lovelace (grand public) Hopper (professionnel) |
Les améliorations architecturales de l'architecture Ampere comprennent :
Puce | GA100[6] | GA102[7] | GA103[8] | GA104[9] | GA106[10] | GA107[11] | GA10B[12] | GA10F |
---|---|---|---|---|---|---|---|---|
Taille de puce (mm2) | 826 | 628 | 496 | 392 | 276 | 200 | ? | ? |
Nb. transistors (milliards) | 54.2 | 28.3 | 22 | 17.4 | 12 | 8.7 | ? | ? |
Densité de transistors (MTr/mm2) | 65,6 | 45,1 | 44,4 | 44,4 | 43,5 | 43,5 | ? | ? |
Nb. Graphics processing clusters | 8 | 7 | 6 | 6 | 3 | 2 | 2 | 1 |
Nb. Streaming multiprocessors | 128 | 84 | 60 | 48 | 30 | 20 | 16 | 12 |
Nb. coeurs CUDA | 12288 | 10752 | 7680 | 6144 | 3480 | 2560 | 2048 | 1536 |
Nb. TMU | 512 | 336 | 240 | 192 | 120 | 80 | 64 | 48 |
Nb. ROP | 192 | 112 | 96 | 96 | 48 | 32 | 32 | 16 |
Nb. coeurs tenseur | 512 | 336 | 240 | 192 | 120 | 80 | 64 | 48 |
coeurs RT | N/A | 84 | 60 | 48 | 30 | 20 | 8 | 12 |
Cache L1 | 24 Mo | 10.5 Mo | 7.5 Mo | 6 Mo | 3 Mo | 2.5 Mo | 3 Mo | 1.5 Mo |
192 ko par SM |
128 ko par SM | 192 ko par SM |
128 ko par SM | |||||
Cache L2 (Mo) | 40 | 6 | 4 | 4 | 3 | 2 | 4 | ? |
GPU | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 |
---|---|---|---|
Code du GPU | GP100 | GV100 | GA100 |
Architecture GPU | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampere |
Compute capability | 6.0 | 7.0 | 8.0 |
Threads / warp | 32 | 32 | 32 |
Max warps / SM | 64 | 64 | 64 |
Max threads / SM | 2048 | 2048 | 2048 |
Max thread blocks / SM | 32 | 32 | 32 |
Max 32-bit registers / SM | 65536 | 65536 | 65536 |
Max registers / block | 65536 | 65536 | 65536 |
Max registers / thread | 255 | 255 | 255 |
Max thread block size | 1024 | 1024 | 1024 |
FP32 cores / SM | 64 | 64 | 64 |
Ratio of SM registers to FP32 cores | 1024 | 1024 | 1024 |
Taille de la mémoire partagée / SM | 64 KB | Configurable jusqu'à 96 KB | Configurable jusqu'à 164 KB |
Formats supportés par les coeurs CUDA | Formats supportés par les coeurs Tensor | |||||||||||||||
FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA Tesla P4 | Non | Oui | Oui | Non | Non | Oui | Non | Non | Non | Non | Non | Non | Non | Non | Non | Non |
NVIDIA P100 | Oui | Oui | Oui | Non | Non | Non | Non | Non | Non | Non | Non | Non | Non | Non | Non | Non |
NVIDIA Volta | Oui | Oui | Oui | Non | Non | Oui | Non | Non | Oui | Non | Non | Non | Non | Non | Non | Non |
NVIDIA Turing | Oui | Oui | Oui | Non | Non | Non | Non | Non | Oui | Non | Non | Oui | Oui | Oui | Non | Non |
NVIDIA A100 | Oui | Oui | Oui | Non | Non | Oui | Non | Oui | Oui | Non | Oui | Oui | Oui | Oui | Oui | Oui |
Légende :
Flux concurrents | Décodage H.264 (1080p30) |
Décodage H.265 (HEVC) (1080p30) |
Décodage VP9 (1080p30) |
---|---|---|---|
V100 | 16 | 22 | 22 |
A100 | 75 | 157 | 108 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.