Loading AI tools
З Вікіпедії, вільної енциклопедії
Hoper — кодова назва мікроархітектури графічних процесорів, розробленої Nvidia в якості наступника архітектури Ampere, яка була випущена в 2022 році. Вона названа на честь Ґрейс Мюррей Гоппер (англ. Grace Murray Hopper) — американської вченої у галузі комп'ютерних наук та контр-адмірала військово-морських сил США, що була одною з перших програмістів комп'ютера Марк I.
Порівняльна таблиця GP100, GV100, GA100 та GH100[1][2]
GPU features | NVIDIA Tesla P100 | NVIDIA Tesla V100 | NVIDIA A100 | NVIDIA H100 |
---|---|---|---|---|
GPU codename | GP100 | GV100 | GA100 | GH100 |
GPU architecture | NVIDIA Pascal | NVIDIA Volta | NVIDIA Ampere | NVIDIA Hopper |
Compute capability | 6.0 | 7.0 | 8.0 | 9.0 |
Threads / warp | 32 | 32 | 32 | 32 |
Max warps / SM | 64 | 64 | 64 | 64 |
Max threads / SM | 2048 | 2048 | 2048 | 2048 |
Max thread blocks / SM | 32 | 32 | 32 | 32 |
Max Thread Blocks / Thread Block Clusters | N/A | N/A | N/A | 16 |
Max 32-bit registers / SM | 65536 | 65536 | 65536 | 65536 |
Max registers / block | 65536 | 65536 | 65536 | 65536 |
Max registers / thread | 255 | 255 | 255 | 255 |
Max thread block size | 1024 | 1024 | 1024 | 1024 |
FP32 cores / SM | 64 | 64 | 64 | 128 |
Ratio of SM registers to FP32 cores | 1024 | 1024 | 1024 | 512 |
Shared Memory Size / SM | 64 KB | Configurable up to 96 KB | Configurable up to 164 KB | Configurable up to 228 KB |
Матриця порівняння підтримки точності обчислень[3][4]
Supported CUDA Core Precisions | Supported Tensor Core Precisions | |||||||||||||||||
FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | FP8 | FP16 | FP32 | FP64 | INT1 | INT4 | INT8 | TF32 | BF16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
NVIDIA Tesla P4 | Ні | Ні | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA P100 | Ні | Так | Так | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Volta | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Ні | Ні | Ні | Ні | Ні |
NVIDIA Turing | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Ні | Ні | Так | Ні | Ні | Так | Так | Так | Ні | Ні |
NVIDIA A100 | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Ні | Так | Ні | Так | Так | Так | Так | Так | Так |
NVIDIA H100 | Ні | Так | Так | Так | Ні | Ні | Так | Ні | Так | Так | Так | Ні | Так | Ні | Ні | Так | Так | Так |
Позначення:
Порівняння потужностей декодування
Відео | H.264 decode (1080p30) | H.265 (HEVC) decode (1080p30) | VP9 decode (1080p30) |
---|---|---|---|
V100 | 16 | 22 | 22 |
A100 | 75 | 157 | 108 |
H100 | 170 | 340 | 260 |
Зображення/сек[2] | JPEG 4:4:4 decode(1080p) | JPEG 4:2:0 decode(1080p) |
---|---|---|
A100 | 1490 | 2950 |
H100 | 3310 | 6350 |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.