★ NVIDIA DGX -1 は販売終了となりました ★
CPUサーバー25ラック分の性能を実現
NVIDIA DGX-1™ は、GPUの最新アーキテクチャ Volta™採用の「NVIDIA V100 Tenso コア GPU」を8基搭載し、NVIDIAの次世代バス規格「NVIDIA ® NVLink ®」を採用。CPUには「Dual 20-core Intel Xeon E5-2698 v4」、512GB メモリ、1.92TB SSDを4基、ネットワークは、NFS用に10Gb x2, ノード間接続間のためにIB EDRx4も標準実装されています。
NVIDIA DGX-1は、各GPU間をNVLinkを利用して、従来のPCIe Gen3 x16 よりも約10倍高速化された 300GB/s の高速な相互接続により、半精度で 960 TFLOPS (半精度浮動小数点演算)という、従来のCPUサーバの約400台分相当の性能をもち、それを3Uの大きさで実現しているディープラーニング専用スーパーアプライアンスコンピュータとなっています。
ソフトウェアスタックとして、OS(Linux)やディープラーニング用の開発フレームワーク、各種ドライバ、管理ツールなど、ディープラーニングに必要な全てが搭載されて提供されるため、ユーザは、サーバの選定やボードの接続、開発環境の入手などの手間もなく、短期間で最適な構成が入手できます。
NVIDIA DGX-1 特長
NVIDIA V100 Tenso コア GPU 32GBを8基搭載
世界でも有数の研究者が広く採用している NVIDIA V100 は、メモリを最も消費するディープラーニングと高性能コンピューティングワークロードを処理するためにメモリが32GB(1枚あたり)になりました。
32GBのメモリを搭載した NVIDIA V100 は、これまで以上に正確なより深いディープラーニングモデルを学習するのに役立ちます。
高速相互接続を実現したNVLinkを採用
NVIDIA® NVLink® は、帯域幅を広くし、リンクを増やし、マルチ GPU および マルチ GPU/CPU システム構成の拡張性を改善することで、この相互接続の問題に対処しています。1つの NVIDIA V100 は、最大 6 つの NVLink で、合計 300 Gb/sec の帯域幅 (すなわち、PCIe 3 の 10 倍) をサポートします。新しい NVIDIA DGX-1のようなサーバーでは、このような技術を利用して、超高速のディープラーニングのトレーニングに対してより大きな拡張性を提供します。