★ NVIDIA DGX -1 は販売終了となりました ★
CPUサーバー25ラック分の性能を実現
NVIDIA DGX-1™ は、GPUの最新アーキテクチャ Volta™採用の「NVIDIA V100 Tenso コア GPU」を8基搭載し、NVIDIAの次世代バス規格「NVIDIA ® NVLink ®」を採用。CPUには「Dual 20-core Intel Xeon E5-2698 v4」、512GB メモリ、1.92TB SSDを4基、ネットワークは、NFS用に10Gb x2, ノード間接続間のためにIB EDRx4も標準実装されています。
NVIDIA DGX-1は、各GPU間をNVLinkを利用して、従来のPCIe Gen3 x16 よりも約10倍高速化された 300GB/s の高速な相互接続により、半精度で 960 TFLOPS (半精度浮動小数点演算)という、従来のCPUサーバの約400台分相当の性能をもち、それを3Uの大きさで実現しているディープラーニング専用スーパーアプライアンスコンピュータとなっています。
ソフトウェアスタックとして、OS(Linux)やディープラーニング用の開発フレームワーク、各種ドライバ、管理ツールなど、ディープラーニングに必要な全てが搭載されて提供されるため、ユーザは、サーバの選定やボードの接続、開発環境の入手などの手間もなく、短期間で最適な構成が入手できます。
NVIDIA DGX-1 特長
NVIDIA V100 Tenso コア GPU 32GBを8基搭載

世界でも有数の研究者が広く採用している NVIDIA V100 は、メモリを最も消費するディープラーニングと高性能コンピューティングワークロードを処理するためにメモリが32GB(1枚あたり)になりました。
32GBのメモリを搭載した NVIDIA V100 は、これまで以上に正確なより深いディープラーニングモデルを学習するのに役立ちます。
高速相互接続を実現したNVLinkを採用
NVIDIA® NVLink® は、帯域幅を広くし、リンクを増やし、マルチ GPU および マルチ GPU/CPU システム構成の拡張性を改善することで、この相互接続の問題に対処しています。1つの NVIDIA V100 は、最大 6 つの NVLink で、合計 300 Gb/sec の帯域幅 (すなわち、PCIe 3 の 10 倍) をサポートします。新しい NVIDIA DGX-1のようなサーバーでは、このような技術を利用して、超高速のディープラーニングのトレーニングに対してより大きな拡張性を提供します。

NVIDIA DGX-1 スペック
GPU | NVIDIA V100 32GB × 8基搭載 |
GPUメモリ | Total 256 GB |
演算性能 | 1 petaFLOPS (FP16) |
NVIDIA CUDA® コア | 40,960 |
NVIDIA Tensor コア | 5,120 |
NVIDIA® NVSwitch™ | ー |
CPU | Dual Intel Xeon E5-2698 v4 2.2 GHz, 20 コア |
システムメモリ | 512 GB |
ネットワーク | 10 GbE × 2 Infiniband EDR × 4 |
ストレージ | OS : 480 GB SSD 内部ストレージ : 1.92 TB SSD × 4 RAID 0 |
ソフトウェア | Canonical Ubuntu Red Hat Enterprise Linux |
最大消費電力 | 3,500 W |
重量 | 61 kg |
サイズ | 全高: 131 mm 全幅: 444 mm 奥行: 866 mm |
運用温度範囲 | 10 ℃ - 35 ℃ |
入力電圧 | 200 V |