Loading AI tools
NVIDIAによるARM系の省電力統合型プロセッサのシリーズ ウィキペディアから
NVIDIA Tegra(エヌビディア テグラ)は、NVIDIAによるARM系の省電力SoC[1]のシリーズ。2023年現在はNintendo Switch、nVidia Shield TV、自動車のインフォテインメントシステムなどに採用されている。
TegraにはモバイルSoCの基本構造として、1チップ内に独立したプロセッサコアが機能別に搭載されている(ARMプロセッサ、GPU、2Dエンジン、HD動画のエンコーダ・デコーダ、オーディオ処理、画像処理)。使っていない機能のプロセッサは電源が遮断され、消費電力を下げる仕様となっており(100 - 500mW程度)初代から低消費電力高パフォーマンスを目指す設計となっていた[2]。
競合製品は同じくモバイルSoCでシェアを持つ、クアルコム社のモバイル向けプロセッサSnapdragonや、TI社のモバイル向けプロセッサOMAPなど。
初代モデルTegra APX2500は2008年に、APX 2600は2009年に発表、携帯電話などの搭載に適したチップとして当初から打ち出されていた。Tegra600および650チップはスマートフォン向けに設計されUMPCなどの搭載にも対応した。Tegraを使用した最初の製品はマイクロソフトのZune HDである。
2011年頃に登場したTegra2から徐々にタブレット等に搭載され始める事となる[3]。同チップを搭載する端末では、テレビに繋いで大画面に出力できるほか、対応するPS3、Wii、Xboxなどのゲームコントローラーをつなげて、家庭用ゲーム機レベルの3Dゲームが楽しめる[4]。
Tegraはスマートフォンやタブレット機器等のモバイル端末向けSocとしては、特にゲーム等に強い高パフォーマンス型の処理の出来る方向性の設計思想が打ち出されたが、採用シェア率は低く、自社開発を行ったタブレットゲーム機nVidia Shieldへの搭載を行ってシェアの挽回を計った(Tegra K1)[5]。
低消費電力であるモバイルSoCは自動車の運転支援システムにおけるサポートAIの性能需要も満たしており、2010年には自動運転車載用コンピュータとしてアウディがTegra採用を表明し、その後は他にもフォルクスワーゲンや、電気自動車ベンチャーのテスラモーターズのEV「Model S」にも採用された。車載分野では、Tegraとともにメモリなどの周辺ICや電子部品を搭載したモジュール製品『Tegra VCM(Visual Computing Module)を展開しており、これらはTegraのアップグレードを容易にするとしている[6]。
先行運転支援システム(ADAS)に代表される、自動車の自動運転機能・補助機能、及び全自動運転を目指すAI用チップの開発は、PCのコンシューマ用GPUでも採用されたTensor Core等の技術も統合、フィードバックされた最新半導体が開発される事で、2022年時も継続されており[7]、EV車メーカーにおいての採用シェアでは60%を超える高いシェアを誇っている[8]。
2017年に発売された任天堂ハイブリッドゲーム機Nintendo Switchへの搭載が発表され[9]、2018年にはTegraのみで15億3000万ドルの収益を記録した(内訳は9億7200ドルがSwitch、5億5800万ドルが自動車)[10]。
製造プロセス | アーキテクチャ | CPU | GPU | メモリ | 動画 エンコード | 画面解像度 | モデム | ||||
---|---|---|---|---|---|---|---|---|---|---|---|
コア数 | クロック | コア数 | 演算性能 | ||||||||
Tegra APX 2500, 2600 | ARM11 | 1 | 0.6 GHz | NEON 非対応 (Advanced SIMD) | LPDDR-333 | 720p@30fps | 854x480 (LCD) 1280x1024 (CRT) 1280x720 (HDMI) |
なし | |||
Tegra 600 | 0.7 GHz | 1280x1024 | |||||||||
Tegra 650 | 0.8 GHz | LPDDR-400 | 1080p@24fps | 1680x1050 | |||||||
Tegra 230 | 40 nm[12] | Cortex-A9 | 2 | 1.0 GHz | VFPv3-D16 (VFPv3に対してレジスタ数が半分) NEON 非対応 (Advanced SIMD) |
8 (VS : 4 PS : 4)[13] | 単精度 5.6 GFLOPS (333 MHz)[14] | シングルチャネル LPDDR2-600 | 1080p | 1024x600 (LCD) 1280x1024 (CRT) 1920x1080 (HDMI) | |
Tegra 250 | シングルチャネル LPDDR2-600, 667 | 1680x1050 (LCD) 1600x1200 (CRT)1920x1080 (HDMI) |
製造プロセス | アーキテクチャ | CPU | GPU | メモリ | 動画 エンコード | 画面解像度 | モデム | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
コア数 | クロック | 演算性能 | L2 キャッシュ | コア数 | 演算性能 | ||||||||
Tegra 3 | 40 nm[15] | Cortex-A9 | 4 + 1[16] | 1.3 - 1.7 GHz | VFPv3 NEON 対応 (Advanced SIMD) |
単精度 27.2 GFLOPS[17] 倍精度 10.2 GFLOPS[18] |
1 MB[19] | 12 (VS : 4 PS : 8[20] | 単精度 12.4 GFLOPS(520 MHz[21][22]) | 32bit シングルチャネル LPDDR3-L 1600, LPDDR2-1066 | 1440p | 2048x1536(LCD) 1920x1200(CRT) 1920x1080(HDMI) |
なし |
Tegra 4i | 28 nm[23] | Cortex-A9 R4 | ? - 2.3 GHz | VFPv4 NEON 対応 (Advanced SIMD) |
単精度 36.8 GFLOPS[24] 倍精度 13.8 GFLOPS[25] |
60 (VS : 20 PS : 40[26]) | 単精度 79.2 GFLOPS (660 MHz[27]) | 32bit シングルチャネル LPDDR3-2133 | 1920x1200(LCD) 1920x1080(HDMI) |
LTE Cat4 HSPA+ TD-HSPA GSM / GPRS / EDGE | |||
Tegra 4 | Cortex-A15 r2 | 1.2 - 1.9 GHz | 単精度 60.8 GFLOPS[28] 倍精度 15.2 GFLOPS[29] |
2 MB + 0.5 MB[30] | 72[31] (VS : 24 PS : 48[32] | 単精度 96.76 GFLOPS (672 MHz[33]) |
32bit デュアルチャンネル LPDDR3-L, LPDDR3-1866 | 3200x2000(LCD) 3840x2160(HDMI) |
なし |
製造プロセス | アーキテクチャ | CPU | GPU | メモリ | 動画 エンコード | 画面解像度 | モデム | ||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
コア数 | クロック | 演算性能 | L2 キャッシュ | コア数 | クロック | 演算性能 | |||||||
Tegra K1
(32ビット) |
28 nm[34] (TSMC HPM) | Cortex-A15 r3 | 4 + 1 | ? - 2.3 GHz | 単精度 73.6 GFLOPS[35] 倍精度 18.4 GFLOPS[36] |
2 MB + 0.5 MB[37] | CUDA Kepler Unified Shader 192コア |
950 MHz | 単精度 365 GFLOPS[38] | 64bit デュアルチャンネル LPDDR3,LPDDR3-L 14.9 GB/s | H.264, VP8など 2160p 30fps | 3840x2160 (LCD) 4096x2160 (HDMI) |
なし |
Tegra K1
(64ビット) |
Denver | 2 | ? - 2.5 GHz[39] | 単精度 40 GFLOPS[40] 倍精度 20 GFLOPS[41] |
2 MB[42] | ||||||||
Tegra X1[43] | 20 nm (TSMC 20 SoC) | Cortex-A57 + Cortex-A53[44] | 4 + 4[45] | Cortex-A57 1.9 GHz[46] | 2 MB + 0.5 MB[47] | CUDA Maxwell 256コア[48] | 1024 MHz | 単精度 512 GFLOPS[49]
半精度 1 TFLOPS |
64bit LPDDR4, LPDDR3, DDR3 25.6 GB/s[50] | H.265, VP9など 2160p 30fps | 4096x2160 60fps | ||
Tegra X1+[51][52] | 16 nm | 1267 MHz[53] | 単精度 649 GFLOPS
半精度 1298 GFLOPS |
64bit LPDDR4X | |||||||||
Tegra X2 (Parker)[54] | 16 nm | Denver 2 + Cortex-A57 | 2 + 4 | 2.0 GHz + 2.0 GHz | 2 MB + 2 MB | CUDA Pascal 256コア | 1465 MHz | 単精度 750 GFLOPS
半精度 1.5 TFLOPS |
128bit LPDDR4 58.4 GB/s | H.265, VP9など 2160p 60fps |
製造プロセス | アーキテクチャ | CPU | GPU | メモリ | 動画 エンコード | 画面解像度 | モデム | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
コア数 | クロック | 演算性能 | L2 キャッシュ | L3 キャッシュ | コア数 | クロック | 演算性能 | |||||||
Xavier[55] | 12 nm | NVIDIA Carmel Arm®v8.2 | 8 | 1.9GHz(Nano) 2.2 GHz(AGX) |
6MBr[55] 8MB[55] |
4MB[55] | CUDA Volta 384コア Tensor 48コア(Nano) Volta512コア Tensor64コア(AGX) |
1.1 GHz(Nano) 1377 MHz(AGX) |
単精度 1410 GFLOPS
半精度 2.820 TFLOPS |
128bit LPDDR4X 59.7 GB/s 256bit LPDDR4X 136.5GB/s |
H.265,VP9など 4K 60fps | 3840x2160 60fps | ||
Orin[57] | 8 nm | Cortex®-A78AE v8.2 | 12 | 1.5GHz(Nano) 2.2 GHz(AGX) |
1.5MB(Nano) 3MB(AGX) |
4MB(Nano) 6MB(AGX) |
CUDA Ampere 512コア Tensor 16コア(Nano) Ampere 2048コア Tensor 64コア(AGX) |
625 MHz(Nano) 1.3 GHz(AGX) |
単精度 0.64 – 5.32 TFLOPS | 128bit LPDDR5 102.4 GB/s 256bit LPDDR5 204.8 GB/s |
H.265,VP9,AV1など 4K 60fps | 3840x2160 60fps |
Tegra 650のグラフィック性能は「GeForce 6」シリーズ相当で、『Quake III Arena』を46fpsで実行できる[60]。Tegra 250は1024x600の解像度を60fpsで実行できる[61]。
Tegra 3は12コアのGeForce GPUを搭載しており、Tegra 2と比べ約3倍のグラフィックス性能を持つ[62]。また、最新のビデオ・エンジンを実装することで、1080p、40Mbpsのビデオを再生することが可能[62]。このほか、ステレオスコピック3Dにも対応する。
Tegra 4は72コアのGeForce GPUを搭載しており、Tegra 3の約6倍、Tegra 2の約20倍のグラフィック性能を持つ[63]
Tegra K1は192のCUDAコアを搭載、Tegra 4の3.75倍のグラフィック性能をもっており[64]第7世代の据え置きゲーム機(PS3/Xbox 360)の性能を超えている[65]。
Tegra X1は256のCUDAコアを搭載、Tegra K1の1.5~2倍のグラフィック性能を持つ。正式にFP16に対応しており、最大で1TFLOPSの演算能力を有する[66][67]。またHDMI 2.0とHDCP 2.2に対応したことで、最新の著作権保護付き60fpsの4Kコンテンツの出力をサポートしたほか、内蔵されるハードウェアビデオプロセッサもHEVC対応となった。色深度はDeep Color相当の10bitまで対応している[68]。
Xavierは512のCUDAコアを搭載、GPUアーキテクチャであるVoltaにAI処理を行うための「Tensorコア」を搭載しており、Tegra X1の10倍以上の演算性能を発揮する(Jetson Xavier NXとJetson Nanoの比較において)[69][70]。Xavierには10W消費の小型省電力NXシリーズ(8GB・16GB)から、40W消費の大型高性能のAGXシリーズ(AGX32GB・64GB、Industrial)の2シリーズ5モデルが存在する[55]。
OrinはXavierの6倍の処理性能を有する[58]。Orinには7W消費の小型省電力から順にNano、NX、AGX(最大70W消費)の3シリーズ9モデル[71]が存在する[58]。
ARMアーキテクチャのデュアルコアCPUで LPDDR2 SDRAM を利用している場合はデュアルチャネル(32ビット×2)を採用しているものが多い中、Tegra 2 と Tegra 3 はシングルチャネル(32ビット×1)を採用している。
Tegra 2以降のプロセッサを搭載したスマートフォン・タブレットを、NVIDIAでは「Tegraスーパー・フォン」「Tegraスーパー・タブレット」と呼ぶ。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.