CPUサーバー25ラック分の性能を実現

NVIDIA DGX-1™ は、GPUの最新アーキテクチャ Volta™採用の「NVIDIA V100 Tenso コア GPU」を8基搭載し、NVIDIAの次世代バス規格「NVIDIA ® NVLink ®」を採用。CPUには「Dual 20-core Intel Xeon E5-2698 v4」、512GB メモリ、1.92TB SSDを4基、ネットワークは、NFS用に10Gb x2, ノード間接続間のためにIB EDRx4も標準実装されています。

NVIDIA DGX-1は、各GPU間をNVLinkを利用して、従来のPCIe Gen3 x16 よりも約10倍高速化された 300GB/s の高速な相互接続により、半精度で 960 TFLOPS (半精度浮動小数点演算)という、従来のCPUサーバの約400台分相当の性能をもち、それを3Uの大きさで実現しているディープラーニング専用スーパーアプライアンスコンピュータとなっています。

​ソフトウェアスタックとして、OS(Linux)やディープラーニング用の開発フレームワーク、各種ドライバ、管理ツールなど、ディープラーニングに必要な全てが搭載されて提供されるため、ユーザは、サーバの選定やボードの接続、開発環境の入手などの手間もなく、短期間で最適な構成が入手できます。 ​

NVIDIA DGX-1 特長

NVIDIA V100 Tenso コア GPU​ 32GBを8基搭載

nvidia-tesla-v100

​世界でも有数の研究者が広く採用している NVIDIA V100 は、メモリを最も消費するディープラーニングと高性能コンピューティングワークロードを処理するためにメモリが32GB(1枚あたり)になりました。

32GBのメモリを搭載した NVIDIA V100 ​は、これまで以上に正確なより深いディープラーニングモデルを学習するのに役立ちます。

高速相互接続を実現したNVLinkを採用

NVIDIA® NVLink® は、帯域幅を広くし、リンクを増やし、マルチ GPU および マルチ GPU/CPU システム構成の拡張性を改善することで、この相互接続の問題に対処しています。1つの NVIDIA V100 は、最大 6 つの NVLink で、合計 300 Gb/sec の帯域幅 (すなわち、PCIe 3 の 10 倍) をサポートします。新しい NVIDIA DGX-1のようなサーバーでは、このような技術を利用して、超高速のディープラーニングのトレーニングに対してより大きな拡張性を提供します。​

nvlink-performance

NVIDIA DGX-1 スペック

GPUNVIDIA ​V100 32GB × 8基搭載
GPUメモリTotal 256 GB
演算性能1 petaFLOPS (FP16)
NVIDIA CUDA® コア40,960
NVIDIA Tensor コア5,120
NVIDIA® NVSwitch™
CPUDual Intel Xeon
E5-2698 v4 2.2 GHz, 20 コア
システムメモリ512 GB
ネットワーク10 GbE × 2
Infiniband EDR × 4
ストレージOS : 480 GB SSD
内部ストレージ : 1.92 TB
SSD × 4 RAID 0
ソフトウェアCanonical Ubuntu
Red Hat Enterprise Linux
最大消費電力3,500 W
重量61 kg
サイズ全高: 131 mm
全幅: 444 mm
奥行: 866 mm
運用温度範囲10 ℃ - 35 ℃
入力電圧200 V
image-nvidia-dgx-1-catalog