★ NVIDIA DGX A100は販売終了となりました ★
DGX A100 ラインナップ
- 320GBモデル(NVIDIA A100 Tensor Core GPU 40GB × 8 基搭載)
- 640GBモデル(NVIDIA A100 Tensor Core GPU 80GB × 8 基搭載)
2020年11月、NVIDIAより「NVIDIA A100 640GB」モデルがリリースされました。
「NVIDIA A100 640GB」モデルは、高速な High Bandwidth Memory 2E(HBM2E) を採用し、容量を640GBに倍増。
さらに2TB/sを超えるメモリバス帯域幅を実現し、従来のA100と比較し1.25倍から3倍の性能向上を実現!
NVIDIA DGX A100 特徴
NVIDIA A100 Tensor Core GPU × 8基 搭載
- GPU あたり 12 の NVLink GPU から GPU への帯域幅: 600 GB/秒
デュアル AMD Rome CPU
- 3.2 倍のコア(DGX-1比)で最も集中的な AI ジョブを強化
GEN4 NVME SSD
- ピーク時の帯域幅: 50 GB/秒Gen3 NVME SSD より 2 倍高速
6基のNVIDIA NVSwitch
- 双方向の帯域幅: 4.8 TB/秒、前世代と比較して 2 倍
MELLANOX CONNECTX-6 HDR ネットワーク
- ピーク時の双方向の帯域幅: 500 GB/秒
搭載GPU
NVIDIA A100 Tensor Core 特徴
飛躍的な世代更新 Volta の 20倍
ピーク性能 | vs Volta | |
FP32 学習 | 312 TFLOPS | 20倍 |
INT8 推論 | 1,248 TOPS | 20倍 |
FP64 HPC | 19.5 TFLOPS | 2.5倍 |
Ampere
世界最大の7nmチップ
548トランジスタ、HBM2
第3世代 Tensor Cores
更なる高速化、柔軟性、簡便
20倍のAI性能(TF32)
新たな高速スパース演算処理機能
AIモデルにおけるスパースを活かし
最大2倍のAI性能を発揮
新たなマルチインスタンスGPU
GPUあたり最大7つの
同時実行可能インスタンス
第3世代 NVLINK & NVSWITCH
システム性能最大化のための
効率的なスケーリング、2倍以上の帯域
新たなマルチインスタンス GPU (MIG)とは・・・
GPU を利用できるユーザーが増える
MIG を利用すれば、1 つの A100 GPU で GPU リソースを最大 7 倍にすることができます。MIG があれば、研究者や開発者はこれまでにない多くのリソースと柔軟性を得られます。
GPU 利用率を最適化する
MIG には、さまざまなインスタンス サイズを選択できる柔軟性があり、各ワークロードに適した規模で GPU をプロビジョニングできます。結果的に、利用率が最適化され、データ センターに対する投資が最大化されます。
混合ワークロードを同時実行する
MIG を使用すると、推論、トレーニング、ハイ パフォーマンス コンピューティング (HPC) といった複数のワークロードを、互いのレイテンシとスループットに影響を与えることなく単一 GPU 上で同時に実行できます
NVIDIA DGX ソフトウェアスタック
最適化されたディープラーニングフレームワークがすぐに使える
DGX システムは、DGX共通のソフトウェアスタックを備えています。
AI チューニングされた基本オペレーティング システム、必要となるすべてのシステム ソフトウェア、GPU 対応アプリケーション、トレーニング済みモデル、NGC™ の各種機能など、テスト済みで最適化された DGX ソフトウェア スタックが統合されています。
すべてのDGX システムにおいて、ソフトウェア、ツール、NVIDIA専門スタッフからなる統合的なソリューションが、すばやい利用開始、迅速なトレーニング、スムーズな運用を実現します。
組み込まれたセキュリティ
DGX A100 は、あらゆる主要なハードウェアとソフトウェア コンポーネントを保護するための自動暗号化ドライブ、署名付きソフトウェア コンテナー、安全な管理と監視といったマルチレイヤー アプローチを採用することで、AI 導入において最も信頼性の高いセキュリティ体制を実現します。
NVIDIA DGX A100 スペック
DGX A100 | ||
320GB | 640GB | |
GPU | NVIDIA A100 Tensor Core 40 GB × 8 基 | NVIDIA A100 Tensor Core 80 GB × 8 基 |
GPUメモリ | Total 320 GB | Total 640 GB |
性能 | AI で 5 petaFLOPS INT8 で 10 petaOPS | |
NVIDIA NVSwitches | 6 | |
CPU | Dual AMD Rome 7742 2.25 GHz(base), 3.4 GHz(max boost) Total 128 コア | |
システムメモリ | 1 TB (最大2TBに拡張可能) | 2 TB |
ネットワーク | Single-Port Mellanox ConnectX-6 VPI 200Gb/s HDR InfiniBand × 8 Dual-Port Mellanox ConnectX-6 VPI 10/25/50/100/200 Gb/s Ethernet × 1 (Dual Portカードを2枚に拡張可能) | Single-Port Mellanox ConnectX-6 VPI 200Gb/s HDR InfiniBand × 8 Dual-Port Mellanox ConnectX-6 VPI 10/25/50/100/200 Gb/s Ethernet × 2 |
ストレージ | OS: 1.92 TB M.2 NVME drives × 2 内部ストレージ: 15 TB (3.84 TB × 4) U.2 NVME drives (30TBに拡張可能) | OS: 1.92 TB M.2 NVME drives × 2 内部ストレージ: 30 TB (3.84 TB × 8) U.2 NVME drives |
ソフトウェア | Ubuntu Linux OS Red Hat Enterprise Linux CentOS | |
最大消費電力 | 6.5 kW max | |
重量 | 123 kg | |
サイズ | 全高: 264.0 mm 全幅: 482.3 mm 奥行: 897.1 mm | |
運用温度範囲 | 5 ℃ - 30 ℃ |