性能検証
ベンチマーク性能比較 ~A100 vs A30 vs A10~
2022.03.15
NTTPC GPUエンジニア
はじめてGPUを購入される場合、どのカードを購入すればいいか悩まれる方も多いのではないでしょうか。GPUメモリやTensorコア数、メーカーが公開する単精度性能・倍精度性能などが比較の指標ですが、実際どのくらい使えるのか?自分たちの用途であればどれを選べばいいの?ということが最も気になる点だと思います。
今回はそんな方のために、2022年にリリースされたAmpereモデルGPU「NVIDIA A30 Tensor Core GPU」、「NVIDIA A10 Tensor Core GPU」、「NVIDIA A100 Tensor Core GPU」の3種類について、性能比較結果を公開します!
この3つの中であれば、「NVIDIA A100 Tensor Core GPU」が最も高価なハイスペックモデルですが、他の型番と比べてどの程度差があるのでしょうか。
各種ベンチマークソフトでの結果を掲載しますので、ご導入の参考にしてください。
検証環境
今回の検証環境は表1、表2の通りです。
表1 検証環境
OS | NVIDIADriver | CUDA | TensorFlow | Python | ngcコンテナイメージ | |
---|---|---|---|---|---|---|
NVIDIA A100 GPU(メモリ40GB) | Ubuntu18.04.5 | 455.32.00 | 11.1.0 | 2.3.1 | 3.6.9 | nvcr.io/nvidia/tensorflow:20.10-tf2-py3 |
NVIDIA A30 GPU(メモリ24GB) | Ubuntu18.04.1 | 470.42.01 | 11.1.0 | 2.3.1 | 3.6.9 | nvcr.io/nvidia/tensorflow:20.10-tf2-py3 |
NVIDIA A10 GPU(メモリ24GB) | Ubuntu18.04.5 | 470.42.01 | 11.1.0 | 2.3.1 | 3.6.9 | ttnvcr.io/nvidia/tensorflow:20.10-tf2-py3tt |
表2 物理サーバ構成
項目 | 構成 | 数量 |
---|---|---|
筐体 | Supermicro SYS-740GP-TNRT | 1 |
メモリ | 16GB DDR4-3200 | 16 (計256GB) |
ストレージ(OS領域) | SSD 480G SATA | 1 |
ストレージ(データ領域) | 3.2TB NVMe PCIe 3.0 | 1 |
ベンチマークソフトは下記で公開されているものを使用しました。
https://github.com/tensorflow/benchmarks/tree/master/scripts/tf_cnn_benchmarks
検証結果
図1~2はresnet50とresnet152をバッチサイズ32、64でそれぞれ実行したスコア結果です。
図1 resnet50ベンチマーク結果
図2 resnet152ベンチマーク結果
少しばらつきはあるものの、A100 vs A30の性能差は約2~2.4倍、A30 vs A10の性能差は約1.5~2倍になっています。A10はビジュアライズ向けGPUですので、高いAI/ディープラーニング性能を求める場合は、やはりA100を選択するのがよさそうです。
とはいえ、価格差やメモリ差を考慮するとA30も健闘しています。個人的にはもう少し差が開くのではと想定していましたが、A30も十分に活躍できそうです。
また、ほかのベンチマークアルゴリズムを回した際の結果も見ておきましょう。
図1,2の結果と同様に、平均するとA100 vs A30の性能差は約2.5倍、A30 vs A10の性能差は約1.5倍になりました。
図3 trivialベンチマーク結果
図4 alexnetベンチマーク結果
図5 inception3ベンチマーク結果
図6 vgg16ベンチマーク結果
考察
6種類のベンチマークソフトを利用し、3つのGPUカードの性能を検証しました。
当初の想定通り、度の場合でもA100が最高のスペックを発揮したため、ご予算や消費電力に余裕があればA100を選定いただくのがベストです。
ただ、A30もスタンダードラインGPUとしての実力を十分に発揮できていると感じました。価格差(約3分の1)や消費電力(300W vs 165W)、GPUメモリの差(40GB vs 24GB)を考慮すればかなりお買い得といえそうです。
また、A100とA30はどちらもMIG(マルチインスタンスGPU)を利用できます。1つのカードを複数のコンテナに分割し、それぞれ別用途で使うようなケースにも対応可能です。
当社では、他GPUカードのベンチマーク結果も公開していますのでご参照ください。
https://www.nttpc.co.jp/gpu/article/benchmark13.html
https://www.nttpc.co.jp/gpu/article/benchmark08.html
本結果がGPUの選定を迷われている方の参考になればと思います。
NVIDIA製品のご導入・検証は、NVIDIA Elite Partnerの当社へぜひお問い合わせください。