トレンドコラム

基礎知識

クラウド vs オンプレミス GPUサーバーの利用コストを徹底比較!

2020.03.17

サービスクリエーション本部 データサイエンティスト 張 暁楠

営業本部
クラウドストラテジスト
吉﨑 政幸

クラウド vs オンプレミス GPUサーバーの利用コストを徹底比較!

はじめに

近年、GPUサーバーはクラウドサービス上でも利用できるようになりました。クラウドのメリットは、リソースの拡張性、柔軟性、コストの最適化、耐障害性、バックアップが容易であることなどが挙げられます。そしていつでも利用開始、停止ができるため検証や短期間での開発目的のニーズにマッチしますし、昨今の技術革新やサービスリリースのスピードを考慮すれば、新機能を気軽に利用できることもメリットとなりえるでしょう。対して、オンプレミス環境で物理サーバーを運用する場合は占有環境ならではの処理速度やレスポンス、セキュリティの確保、リソース利用、カスタマイズ性の高さが優位点になります。
ユーザーはどのような基準でクラウド、オンプレミスを選択すべきでしょうか。本コラムでは主にコスト面におけるクラウドとオンプレミスの比較について紹介いたします。長期利用であればオンプレミス環境で物理サーバーを購入したほうが安価になるのが一般的であると考えられますが、実際のところはどうなのでしょうか。オンプレミスとクラウドそれぞれ特有のコストがあるため、これらを踏まえつつ説明いたします。

クラウドvsオンプレミス コストの考え方

クラウドサービスは一般的に初期費用が無料で、利用した分だけ支払う仕組みになっています。おおむねどこのプロバイダでも同様ですが、細かな点で異なる場合がありますので注意が必要です。時間単位の従量制や一括前払いで安価になるディスカウントがされる予約制、初期費用ありの月額制などもあります。タリフがドル建てで、データ通信料が従量制というプロバイダの場合は、為替レートと通信容量の両方が変動要素になります。利用した分だけ支払うことは合理的でコストの最適化を実現しますが、毎月の料金が変動するのは困ると考える利用者もいるのではないでしょうか。
オンプレミスではサーバーやGPUカードの購入のために高額な初期費用が必要となり、企業の場合、固定資産として管理する必要があります。また運用開始後のコストとして、電気料金や保守にかかわる費用が必要になります。その他、ディスクやメモリ等増設が必要となる場合は機器代金と設置費用が発生します。この際、必ず人手を要しますので、情報システム担当者の事務処理や、立ち合いなどの稼働が発生するためこれらも考慮する必要があります。このコストがあらかじめどの程度必要になるかを見積もるのは難しいといえるでしょう。

選定にあたって考慮すべきこと

私は約7年間のクラウドサービスのマーケティングにかかわってきまして、オンプレミスとの比較やクラウドの利点を訴求してきました。結論としては、クラウド、オンプレミスそれぞれに利点があり、完全には割り切れず、用途や目的に合わせて、ハイブリッドで利用することが一般化してきているという認識を持っています。
 まずスペックについて、クラウドはプロバイダが決めたプランで提供されるため、要件に合わない場合はオンプレミスを選択する必要があります。当サイトでも案内しているSupermicro製サーバーは、カスタマイズ性の高さに定評があります。現在は各社とも当たり前になっているメモリやディスク容量などカタログスペック内での変更にとどまらず、複数の外部インターフェースを追加できるなど細かい個別カスタマイズに応えることが可能で、時にはカスタム仕様をもとに製品化されるケースもあります。
次に、運用面では、クラウドサービスは共有環境であるため、ユーザー側で日時をコントロールできない緊急メンテナンスや定期メンテナンスがあります。もちろんオンプレミスにおいてもOSのバージョンアップや予防保全は必要になることはありますが、日時の調整が可能であり、故障時は状況や原因の把握がしやすい点はメリットといえるかもしれません。
ハイブリッド利用の場合、複数のプロバイダやベンダーを利用することとなるため、情報システム部門が直接運用管理する場合、担当者の苦労は絶えないということになりましょうか・・・。

コスト比較

目的や用途で明確にクラウドもしくはオンプレミスを選択できれば良いのですが、どちらも候補に入りえるということであれば、やはりコスト比較を行うことになるでしょう。そこである程度条件を絞った上で、クラウドサービスと弊社で提供しているオンプレミス向けサーバーそれぞれのコスト比較を行ってみました。クラウド各社とも提供プランが同一仕様ではありませんので、比較にあたってはクラウドサービスのインスタンスのスペックを基準に、弊社の見積もりシミュレータで同等比較できるものに絞りました。
GPUはNVIDIA V100とT4の2種類とし、クラウドプロバイダは外資系の2社、国内の1社を選びました。外資系2社は従量プランと、長期利用割引を、国内のプロバイダでは従量プランもしくは月額プランを選択することができますが、V100は月額プランのみを提供していました。ディープラーニングの学習・モデル作成には想定よりも長期間かかることがザラにあるため、長期利用を前提として3年利用時の価格を比較しています。

比較条件:

  1. ① GPUカード:NVIDIA Tesla V100とT4の2種、同一枚数を基準にサーバーのコア数、メモリは近い値のものを、ストレージ容量は実容量約1.5GBとしました。
  2. ② 料金   :B社はドル建てであるため109円/ドルで計算しています。
    C社は該当プランでは月額プランのみを提供しているため、3年総額は初期費用+36カ月で算出しました。
    オンプレミス(Supermicro製サーバー)には、機器代金と3年間の24/365オンサイト保守を含めています。
    小数点以下は四捨五入して算出しています。

① V100の1枚構成

3年予約ありの場合で比較すると、クラウド3社ともコストが近接していました。競合を意識した価格設定であると推測されます。この場合においてオンプレミス(NTTPC)は約60%の価格費用で済むことがわかりました。

表1 GPU V100 1枚
プロバイダ コア メモリ
(GB)
GPU
枚数・種別
従量料金
(時間)
単位:円
3年予約料金
(時間)
単位:円
3年総額
(クラウド:
予約)
単位:円
3年総額
(クラウド:
従量)
単位:円
A社 6 112 1X V100 470 178 4,676,116 12,344,452
B社 8 61 1X V100 469 193 5,070,200 12,317,436
オンプレミス
(NTTPC)
8 128 1X V100 2,932,000 2,932,000
C社※ 8 128 1X V100 5,076,000

※ 月額プランのみのため初期費用+36ヶ月で算出。


図1 V100x1累積コスト(1ヵ月単位)

② V100の4枚構成

3年予約ありの場合で比較すると、1枚構成時と同様にクラウド3社ともコストが近接しています。3年予約で比較するとオンプレミス(NTTPC)は約40%の費用で済むことがわかりました。

表2 GPU V100 4枚※
プロバイダ コア メモリ
(GB)
GPU
枚数・種別
従量料金
(時間)
単位:円
3年予約料金
(時間)
単位:円
3年総額
(クラウド:
予約)
単位:円
3年総額
(クラウド:
従量)
単位:円
A社 24 448 4X V100 2067 783 20,574,969 54,316,765
B社 32 244 4X V100 1820 770 20,223,511 47,837,484
オンプレミス
(NTTPC)
32 256 4X V100 8,112,000 8,112,000

※ C社は4枚構成未提供


図2 V100x4累積コスト(1ヵ月単位)

③ T4の8枚構成

前述の①、②は当初の予想通り、長期利用の場合は断然オンプレミスの方がおトクになります。
T4はB社のみ提供しているのですが、こちらはなぜかクラウドサービスのほうが約26%安価になりました。T4は前述の①②よりも後にリリースされたチップなので、もしかするとキャンペーン期間なのかもしれません。
必ずしもオンプレミスが安価にならないケースもあるということがわかったのは驚きでした。

表3 GPU T4 4枚
プロバイダ コア メモリ
(GB)
GPU
枚数・種別
従量料金
(時間)
単位:円
3年予約料金
(時間)
単位:円
3年総額
(クラウド:
予約)
単位:円
3年総額
(クラウド:
従量)
単位:円
B社 48 192 8X T4 426 160 4,213,709 11,206,002
オンプレミス
(NTTPC)
48 256 8X T4 5,711,000 5,711,000

図3 T4x8累積コスト(1ヵ月単位)

まとめ

長期利用前提で変動コストを除外し単純比較した場合、オンプレミスがコスト面において優位であることがわかります。しかしながら先にも述べた通り運用開始後に発生するコストは別途考慮する必要があります。 今回のコスト比較はサーバー部分に限定して行いました。実際はネットワークや、ファイアウォール等のセキュリティ機能のコストが別に必要となりますし、システムの特性に合わせて総合的に検討する必要があります。とはいえ、V100等の高性能GPUカードは1枚約100万円と高額ですし、GPUサーバーのコストはシステムに占める割合に大きく影響すると考えまして、主に価格面での比較検討結果を紹介しました。本記事がオンプレミス、クラウド選定の一助になれれば幸いです。

※ 各種データは2019年12月時点の情報を元にしています。