Tesla是一個NVIDIA的顯示核心系列品牌,主要用於伺服器高效能電腦運算,用於對抗AMD的FireStream系列。這是繼GeForce和Quadro之後,第三個顯示核心商標。NVIDIA將顯示核心分為三大系列。GeForce用於提供家庭娛樂;Quadro用於專業繪圖設計;Tesla用於大規模的並聯電腦運算。
Tesla以發明家尼古拉·特斯拉的名字命名。
產品系列
目前,Tesla有三個系列:
- Tesla GPU運算處理器 - 外形與普通顯示卡大致相同,C870採用GeForce 8顯示核心,而C1060採用GeForce 200顯示核心,不設任何顯示輸出。
- Tesla GPU Deskside Supercomputer - 桌面平台用,外形與QuadroPlex相似,D870包含兩張C870運算處理器,可透過接線互聯多個裝置。Tesla 10系列中沒有相關產品。
- Tesla GPU Server - 伺服器用,外形與1U伺服器相似,S870包含四張C870運算處理器,而S1070包含四張C1060運算處理器,可透過接線互聯多個裝置。
較早的時候,人們已意識到GPU能運算大量數據。所以開發者通過圖形語言,利用顯示核心,來進行平行計算,亦即是GPGPU(通用繪圖核心)。但開發者需要有一定程度的圖形處理知識,才能發揮顯示核心效能。隨後,NVIDIA推出了CUDA。開發者利用C++語言,再通過CUDA編譯器,就能利用顯核運算。開發者可忽略圖形處理技術,而直接利用熟悉的C++語言。開發者和科學家,就可以利用顯示核心,研究物理、生化和勘探等領域。
Tesla比較專注於高效能運算,並且C1060以上(G200)系列能支援雙精度浮點格式。另一方面,CUDA被所有的NVIDIA顯示核心支援,包括GeForce和Quadro系列。
將來,顯示核心能普及化地,輔助中央處理器,進行影片壓縮、資料庫搜尋等工作。並支援更多程式語言,例如Fortran、C++、JAVA和Python等。
完整型號列表
型號 | 微架構 | 發佈時間 | 晶片 | 核心 頻率 |
彩現器 | 主記憶體 | 算力[a] | CUDA 運算能力[b] |
熱設計功耗 | 註釋/ 外形尺寸 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CUDA核心 (總數) |
基礎 頻率 |
最大 增強 頻率[c] |
匯流排 類型 |
匯流排字長 | 容量大小 | 頻率 | 頻寬 | 半精度 Tensor Core FP32 累加 | 單精度 (MAD或FMA) |
雙精度 (FMA) | ||||||||
單位 | MHz | MHz | MHz | bit | GB | MT/s(英語:Transfers per second) | GB/s | GFLOPs | GFLOPs | GFLOPs | W | |||||||
C870 GPU Computing Module[d] | Tesla(英語:Tesla (microarchitecture)) | 2007年 5月2日 |
1× G80 | 600 | 128 | 1350 | 不適用 | GDDR3 | 384 | 1.5 | 1600 | 76.8 | 否 | 345.6 | 否 | 1.0 | 170.9 | Internal PCIe GPU (full-height, dual-slot) |
D870 Deskside Computer[d] | 2007年 5月2日 |
2× G80 | 600 | 256 | 1350 | 不適用 | GDDR3 | 2× 384 | 2× 1.5 | 1600 | 2× 76.8 | 否 | 691.2 | 否 | 1.0 | 520 | Deskside or 3U 19-inch rack(英語:19-inch rack) external GPUs | |
S870 GPU Computing Server[d] | 2007年 5月2日 |
4× G80 | 600 | 512 | 1350 | 不適用 | GDDR3 | 4× 384 | 4× 1.5 | 1600 | 4× 76.8 | 否 | 1382.4 | 否 | 1.0 | 1U 19-inch rack(英語:19-inch rack) external GPUs, connect via 2× PCIe (×16) | ||
C1060 GPU Computing Module[e] | 2009年 4月9日 |
1× GT200 | 602 | 240 | 1296[2] | 不適用 | GDDR3 | 512 | 4 | 1600 | 102.4 | 否 | 622.08 | 77.76 | 1.3 | 187.8 | Internal PCIe GPU (full-height, dual-slot) | |
S1070 GPU Computing Server "400 configuration"[e] | 2008年 6月1日 |
4× GT200 | 602 | 960 | 1296 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1538.4 | 4× 98.5 | 否 | 2488.3 | 311.0 | 1.3 | 800 | 1U 19-inch rack(英語:19-inch rack) external GPUs, connect via 2× PCIe (×8 or ×16) | |
S1070 GPU Computing Server "500 configuration"[e] | 1440 | 不適用 | 否 | 2764.8 | 345.6 | |||||||||||||
S1075 GPU Computing Server[e][3] | 2008年 6月1日 |
4× GT200 | 602 | 960 | 1440 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1538.4 | 4× 98.5 | 否 | 2764.8 | 345.6 | 1.3 | 1U 19-inch rack(英語:19-inch rack) external GPUs, connect via 1× PCIe (×8 or ×16) | ||
Quadro Plex 2200 D2 Visual Computing System[f] | 2008年 7月25日 |
2× GT200GL | 648 | 480 | 1296 | 不適用 | GDDR3 | 2× 512 | 2× 4 | 1600 | 2× 102.4 | 否 | 1244.2 | 155.5 | 1.3 | Deskside or 3U 19-inch rack(英語:19-inch rack) external GPUs with 4 dual-link DVI outputs | ||
Quadro Plex 2200 S4 Visual Computing System[f] | 2008年 7月25日 |
4× GT200GL | 648 | 960 | 1296 | 不適用 | GDDR3 | 4× 512 | 4× 4 | 1600 | 4× 102.4 | 否 | 2488.3 | 311.0 | 1.3 | 1200 | 1U 19-inch rack(英語:19-inch rack) external GPUs, connect via 2× PCIe (×8 or ×16) | |
C2050 GPU Computing Module[4] | Fermi | 2011年 7月25日 |
1× GF100 | 575 | 448 | 1150 | 不適用 | GDDR5 | 384 | 3[g] | 3000 | 144 | 否 | 1030.4 | 515.2 | 2.0 | 247 | Internal PCIe GPU (full-height, dual-slot) |
M2050 GPU Computing Module[5] | 2011年 7月25日 |
不適用 | 3092 | 148.4 | 否 | 225 | ||||||||||||
C2070 GPU Computing Module[4] | July 25, 2011 | 1× GF100 | 575 | 448 | 1150 | 不適用 | GDDR5 | 384 | 6[g] | 3000 | 144 | 否 | 1030.4 | 515.2 | 2.0 | 247 | Internal PCIe GPU (full-height, dual-slot) | |
C2075 GPU Computing Module[6] | 2011年 7月25日 |
不適用 | 3000 | 144 | 否 | 225 | ||||||||||||
M2070/M2070Q GPU Computing Module[7] | 2011年 7月25日 |
不適用 | 3132 | 150.336 | 否 | 225 | ||||||||||||
M2090 GPU Computing Module[8] | 2011年 7月25日 |
1× GF110 | 650 | 512 | 1300 | 不適用 | GDDR5 | 384 | 6[g] | 3700 | 177.6 | 否 | 1331.2 | 665.6 | 2.0 | 225 | Internal PCIe GPU (full-height, dual-slot) | |
S2050 GPU Computing Server | 2011年 7月25日 |
4× GF100 | 575 | 1792 | 1150 | 不適用 | GDDR5 | 4× 384 | 4× 3[g] | 3 | 4× 148.4 | 否 | 4121.6 | 2060.8 | 2.0 | 900 | 1U 19-inch rack(英語:19-inch rack) external GPUs, connect via 2× PCIe (×8 or ×16) | |
S2070 GPU Computing Server | 不適用 | 4× 6[g] | 否 | |||||||||||||||
K10 GPU accelerator[9] | Kepler | 2012年 5月1日 |
2× GK104 | 不適用 | 3072 | 745 | ? | GDDR5 | 2× 256 | 2× 4 | 5000 | 2× 160 | 否 | 4577 | 190.7 | 3.0 | 225 | Internal PCIe GPU (full-height, dual-slot) |
K20 GPU accelerator[10][11] | 2012年 11月12日 |
1× GK110 | 不適用 | 2496 | 706 | 758 | GDDR5 | 320 | 5 | 5200 | 208 | 否 | 3524 | 1175 | 3.5 | 225 | Internal PCIe GPU (full-height, dual-slot) | |
K20X GPU accelerator[12] | 2012年 11月12日 |
1× GK110 | 不適用 | 2688 | 732 | ? | GDDR5 | 384 | 6 | 5200 | 250 | 否 | 3935 | 1312 | 3.5 | 235 | Internal PCIe GPU (full-height, dual-slot) | |
K40 GPU accelerator[13] | 2013年 10月8日 |
1× GK110B | 不適用 | 2880 | 745 | 875 | GDDR5 | 384 | 12[g] | 6000 | 288 | 否 | 4291–5040 | 1430–1680 | 3.5 | 235 | Internal PCIe GPU (full-height, dual-slot) | |
K80 GPU accelerator[14] | 2014年 11月17日 |
2× GK210 | 不適用 | 4992 | 560 | 875 | GDDR5 | 2× 384 | 2× 12 | 5000 | 2× 240 | 否 | 5591–8736 | 1864–2912 | 3.7 | 300 | Internal PCIe GPU (full-height, dual-slot) | |
M4 GPU accelerator[15][16] | Maxwell(英語:Maxwell (microarchitecture)) | 2015年 11月10日 |
1× GM206 | 不適用 | 1024 | 872 | 1072 | GDDR5 | 128 | 4 | 5500 | 88 | 否 | 1786–2195 | 55.81–68.61 | 5.2 | 50–75 | Internal PCIe GPU (half-height, single-slot) |
M6 GPU accelerator[17] | 2015年 8月30日 |
1× GM204-995-A1 | 不適用 | 1536 | 722 | 1051 | GDDR5 | 256 | 8 | 4600 | 147.2 | 否 | 2218–3229 | 69.3–100.9 | 5.2 | 75–100 | Internal MXM GPU | |
M10 GPU accelerator[18] | 4× GM107 | 不適用 | 2560 | 1033 | ? | GDDR5 | 4× 128 | 4× 8 | 5188 | 4× 83 | 否 | 5289 | 165.3 | 5.2 | 225 | Internal PCIe GPU (full-height, dual-slot) | ||
M40 GPU accelerator[16][19] | 2015年 11月10日 |
1× GM200 | 不適用 | 3072 | 948 | 1114 | GDDR5 | 384 | 12 | 6000 | 288 | 否 | 5825–6844 | 182.0–213.9 | 5.2 | 250 | Internal PCIe GPU (full-height, dual-slot) | |
M60 GPU accelerator[20] | 2015年 8月30日 |
2× GM204-895-A1 | 不適用 | 4096 | 899 | 1178 | GDDR5 | 2× 256 | 2× 8 | 5000 | 2× 160 | 否 | 7365–9650 | 230.1–301.6 | 5.2 | 225–300 | Internal PCIe GPU (full-height, dual-slot) | |
P4 GPU accelerator[21] | Pascal | 2016年 9月13日 |
1× GP104 | 不適用 | 2560 | 810 | 1063 | GDDR5 | 256 | 8 | 6000 | 192.0 | 否 | 4147–5443 | 129.6–170.1 | 6.1 | 50-75 | PCI Express card |
P6 GPU accelerator[22][23] | 2017年 3月24日 |
1× GP104-995-A1 | 不適用 | 2048 | 1012 | 1506 | GDDR5 | 256 | 16 | 3003 | 192.2 | 否 | 6169 | 192.8 | 6.1 | 90 | 行動PCI Express模組 card | |
P40 GPU accelerator[21] | 2016年 9月13日 |
1× GP102 | 不適用 | 3840 | 1303 | 1531 | GDDR5 | 384 | 24 | 7200 | 345.6 | 否 | 10007–11758 | 312.7–367.4 | 6.1 | 250 | PCI Express card | |
P100 GPU accelerator (mezzanine)[24][25] | 2016年 4月5日 |
1× GP100-890-A1 | 不適用 | 3584 | 1328 | 1480 | HBM2 | 4096 | 16 | 1430 | 732 | 否 | 9519–10609 | 4760–5304 | 6.0 | 300 | NVLink card | |
P100 GPU accelerator (16 GB card)[26] | 2016年 6月20日 |
1× GP100 | 不適用 | 1126 | 1303 | 否 | 8071‒9340 | 4036‒4670 | 250 | PCI Express card | ||||||||
P100 GPU accelerator (12 GB card)[26] | 2016年 6月20日 |
不適用 | 3072 | 12 | 549 | 否 | 8071‒9340 | 4036‒4670 | ||||||||||
V100 GPU accelerator (mezzanine)[27][28][29] | Volta | 2017年 5月10日 |
1× GV100-895-A1 | 不適用 | 5120 | 未知 | 1,455 | HBM2 | 4,096 | 16 or 32 | 1,750 | 900 | 119,192 | 14,899 | 7,450 | 7.0 | 300 | SXM card |
V100 GPU accelerator (PCIe card)[27][28][29] | 2017年 6月21日 |
1× GV100 | 不適用 | 未知 | 1,370 | 112,224 | 14,028 | 7,014 | 250 | PCIe card | ||||||||
V100 GPU accelerator (PCIe FHHL card) | 2018年 3月27日 |
1× GV100 | 不適用 | 937 | 1,290 | 16 | 1,620 | 829.44 | 105,680 | 13,210 | 6,605 | 250 | PCIe FHHL card | |||||
T4 GPU accelerator (PCIe card)[30][31] | Turing | 2018年 9月12日 |
1× TU104-895-A1 | 不適用 | 2,560 | 585 | 1,590 | GDDR6 | 256 | 16 | 5,000 | 320 | 64,800 | 8,100 | 未知 | 7.5 | 70 | PCIe card |
A2 GPU accelerator (PCIe card)[32] | Ampere | 2021年 11月10日 |
1× GA107 | 不適用 | 1,280 | 1,440 | 1,770 | GDDR6 | 128 | 16 | 6,252 | 200 | 18,124 | 4,531 | 140 | 8.6 | 40-60 | PCIe card (half height, single-slot) |
A10 GPU accelerator (PCIe card)[33] | 2021年 4月12日 |
1× GA102-890-A1 | 不適用 | 9,216 | 885 | 1,695 | GDDR6 | 384 | 24 | 6,252 | 600 | 124,960 | 31,240 | 976 | 8.6 | 150 | PCIe card (single-slot) | |
A16 GPU accelerator (PCIe card)[34] | 2021年 4月12日 |
4× GA107 | 不適用 | 4× 1,280 | 885 | 1,695 | GDDR6 | 4× 128 | 4× 16 | 7,242 | 4× 200 | 4x 18,432 | 4× 4,608 | 1,084.8 | 8.6 | 250 | PCIe card (dual-slot) | |
A30 GPU accelerator (PCIe card)[35] | 2021年 4月12日 |
1× GA100 | 不適用 | 3,584 | 930 | 1,440 | HBM2 | 3,072 | 24 | 1,215 | 933.1 | 165,120 | 10,320 | 5,161 | 8.0 | 165 | PCIe card (dual-slot) | |
A40 GPU accelerator (PCIe card)[36] | 2020年 10月5日 |
1× GA102 | 不適用 | 10,752 | 1,305 | 1,740 | GDDR6 | 384 | 48 | 7,248 | 695.8 | 149,680 | 37,420 | 1,168 | 8.6 | 300 | PCIe card (dual-slot) | |
A100 GPU accelerator (PCIe card)[37][38] | 2020年 5月14日[39] |
1× GA100-883AA-A1 | 不適用 | 6,912 | 765 | 1410 | HBM2 | 5,120 | 40 or 80 | 1,215 | 1,555 | 312,000 | 19,500 | 9,700 | 8.0 | 250 | PCIe card (dual-slot) | |
H100 GPU accelerator (PCIe card)[40] | Hopper | 2022年 3月22日[41] |
1× GH100[42] | 不適用 | 14,592 | 1,065 | 1,755 CUDA 1620 TC | HBM2e | 5120 | 80 | 1,000 | 2,039 | 756,449 | 51,200 | 25,600 | 9.0 | 350 | PCIe card (dual-slot) |
H100 GPU accelerator (SXM card) | 不適用 | 16,896 | 1,065 | 1,980 CUDA 1,830 TC | HBM3 | 5,120 | 80 | 1,500 | 3,352 | 989,430 | 66,900 | 33,500 | 9.0 | 700 | SXM card | |||
L40 GPU accelerator[43] | Ada Lovelace | 2022年 10月13日 |
1× AD102[44] | 不適用 | 18,176 | 735 | 2,490 | GDDR6 | 384 | 48 | 2,250 | 864 | 362,066 | 90,516 | 1,414 | 8.9 | 300 | PCIe card (dual-slot) |
L4 GPU accelerator[45][46] | 2023年 3月21日[47] |
1x AD104[48] | 不適用 | 7,424 | 795 | 2,040 | GDDR6 | 192 | 24 | 1,563 | 300 | 121,000 | 30,300 | 490 | 8.9 | 72 | HHHL single slot PCIe card | |
型號 | 微架構 | 發佈時間 | 晶片 | 核心 頻率 |
彩現器 | 主記憶體 | 算力[a] | CUDA 運算能力 |
熱設計功耗 | 註釋/ 外形尺寸 | ||||||||
CUDA核心 (總數) |
基礎 頻率 |
最大 增強 頻率[c] |
匯流排 類型 |
匯流排字長 | 容量大小 | 頻率 | 頻寬 | 半精度 Tensor Core FP32 累加 | 單精度 (MAD或FMA) |
雙精度 (FMA) |
註釋:
- To calculate the processing power see Tesla (微架構)(英語:Tesla (微架构)), 費米微架構, Kepler (微架構), Maxwell (microarchitecture)(英語:Maxwell (microarchitecture)), or 帕斯卡 (微架構). A number range specifies the minimum and maximum processing power at, respectively, the base clock and maximum boost clock.
- Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 8GTX
- Specifications not specified by Nvidia assumed to be based on the NVIDIA GeForce 200
- Specifications not specified by Nvidia assumed to be based on the Quadro FX 5800
- With ECC on, a portion of the dedicated memory is used for ECC bits, so the available user memory is reduced by 12.5%. (e.g. 4 GB total memory yields 3.5 GB of user available memory.)
另見
參考資料
- Nvidia GPU Boost For Tesla (PDF). January 2014 [7 December 2015]. (原始內容存檔 (PDF)於2020-05-16).
- Tesla C1060 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Difference between Tesla S1070 and S1075. 31 October 2008 [January 29, 2017]. (原始內容存檔於2012-02-26).
S1075 has one interface card
- Tesla C2050 and Tesla C2070 Computing Processor (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Tesla M2050 and Tesla M2070/M2070Q Dual-Slot Computing Processor Modules (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Tesla C2075 Computing Processor Board (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Hand, Randall. NVidia Tesla M2050 & M2070/M2070Q Specs OnlineVizWorld.com. VizWorld.com. 2010-08-23 [2015-12-11]. (原始內容存檔於2020-08-17).
- Tesla M2090 Dual-Slot Computing Processor Module (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-10-26).
- Tesla K10 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Tesla K20 GPU active accelerator (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2017-07-12).
- Tesla K20 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-03-26).
- Tesla K20X GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-11-24).
- Tesla K40 GPU accelerator (PDF). Nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2020-06-17).
- Tesla K80 GPU accelerator (PDF). Images.nvidia.com. [2015-12-11]. (原始內容存檔 (PDF)於2018-07-12).
- Nvidia Announces Tesla M40 & M4 Server Cards - Data Center Machine Learning. Anandtech.com. [2015-12-11]. (原始內容存檔於2020-11-08).
- Accelerating Hyperscale Datacenter Applications with Tesla GPUs | Parallel Forall. Devblogs.nvidia.com. 2015-11-10 [2015-12-11]. (原始內容存檔於2017-07-09).
- Smith, Ryan. Nvidia Announces Tesla P40 & Tesla P4 - Network Inference, Big & Small. Anandtech. 13 September 2016 [13 September 2016]. (原始內容存檔於2021-01-16).
- Tesla P6 Specs. www.techpowerup.com. [2019-03-07]. (原始內容存檔於2020-07-28).
- Smith, Ryan. Nvidia Announces Tesla P100 Accelerator - Pascal GP100 for HPC. Anandtech.com. Anandtech.com. 5 April 2016 [5 April 2016]. (原始內容存檔於2016-07-30).
- Harris, Mark. Inside Pascal: Nvidia’s Newest Computing Platform. [13 September 2016]. (原始內容存檔於2017-05-07).
- Smith, Ryan. NVidia Announces PCI Express Tesla P100. Anandtech.com. 20 June 2016 [21 June 2016]. (原始內容存檔於2020-11-11).
- Smith, Ryan. The Nvidia GPU Technology Conference 2017 Keynote Live Blog. Anandtech. 10 May 2017 [10 May 2017].
- Smith, Ryan. NVIDIA Volta Unveiled: GV100 GPU and Tesla V100 Accelerator Announced. Anandtech. 10 May 2017 [10 May 2017].
- Oh, Nate. NVIDIA Formally Announces V100: Available later this Year. Anandtech.com. 20 June 2017 [20 June 2017].
- NVIDIA TESLA T4 TENSOR CORE GPU. NVIDIA. [17 October 2018].
- NVIDIA Tesla T4 Tensor Core Product Brief (PDF). www.nvidia.com. [2019-07-10].
- NVIDIA TESLA A100 TENSOR CORE GPU. NVIDIA. [14 January 2021].
- NVIDIA Tesla A100 Tensor Core Product Brief (PDF). www.nvidia.com. [2020-09-22].
- Smith, Ryan. NVIDIA Ampere Unleashed: NVIDIA Announces New GPU Architecture, A100 GPU, and Accelerator. AnandTech. May 14, 2020.
外部連結
Wikiwand in your browser!
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.