AI基盤/GPUサーバーに対応した「高電力データセンター」の選び方
生成AI/LLMなどの技術を用いたシステムを構築・運用する際に使用する「GPUサーバー」は、従来よりも大きな消費電力量を供給できる「高電力データセンター」に設置する必要があります。今回は高電力データセンターの選び方について紹介します。
- 目次
生成AIの需要拡大で浮上した、データセンターの新たな課題
GPUの性能向上とともに増大する消費電力量
近年、業務効率化や生産性向上の1手段として生成AI/LLMへの注目が集まっています。
生成AI/LLM技術を活用したシステムを開発する際には膨大な演算処理が必要とされます。そのため、コア数の限られた従来のCPUよりも、多数のコアによる並列処理が可能なGPUを利用するケースが多くなっています。
GPUを搭載したサーバーを「GPUサーバー」と呼びます。なお、個人が業務で利用するものは「ワークステーション」と言われます。
CPUを搭載した従来の「CPUサーバー」の消費電力量が1サーバーあたり220W程度であるのに対し、最新の高性能なGPUサーバーでは1サーバーあたり10,000W以上の膨大な消費電力量を必要とするものもあります。
そのため、既存のサーバールームなど従来の設備ではGPUサーバーに必要な電力量をまかなえず、新たな設置場所を検討するなどの対応を迫られる企業が増加しています。
市場が拡大する一方で、活用できる高電力データセンターはまだまだ少ない
令和6年情報通信白書によれば、大規模データセンターの数は世界的に増加傾向にあります。また、データセンターシステムの市場規模も2014年の17.6兆円から2023年の34.1兆円と10年間で約2倍まで増加しており、2024年には36.7兆円に達すると予測されています。
日本国内に限ってみると、2022年の2兆938億円であったデータセンターサービス市場規模(売上高)は2027年には4兆1,862億円まで拡大すると予測されているものの、設備の老朽化や複数データセンターの集約といった理由からデータセンターの数は徐々に減少しています。特に中堅・中小企業が気軽に利用できるデータセンターについては、閉鎖されたり、GPUサーバーが必要とする電力量に対応していなかったりといったケースが増加しています。GPUサーバーに活用できる「高電力データセンター」はまだまだ少ないのが現状なのです。
こうした状況から、今後、企業が生成AI/LLMの技術などを活用したシステムの導入を検討する際には、まずはGPUサーバーをどう導入・設置するかという点から検討する必要があります。
オンプレミスかクラウド化か GPUサーバー導入時の選択肢
GPUサーバーの主な導入方法には、GPUサーバーの機能をインターネット経由で利用する「クラウド型」と、自社でサーバーを購入しデータセンターへ設置する「オンプレミス型」の2種類があります。
クラウド型は管理や保守などをベンダーに任せることができる、リソースの追加・削減が簡単に行えるなどのメリットがありますが、その一方で長期的なランニングコストがオンプレミス型と比較すると高くなりがちというデメリットもあります。
反対にオンプレミス型は自社で管理や保守などを行う必要があるというデメリットがありますが、ランニングコストがクラウド型と比較して一般的に安価というメリットがあります。例えばデータベースなどアーカイブデータを運用する場合には、通信量に応じてコストが増加する従量課金制のクラウド型よりも定額制のデータセンターを利用するオンプレミス型のほうが秀でているといえます。
また、これら2種類に加え、用途に応じてクラウド型とオンプレミス型を併用する「ハイブリッドクラウド」を選択するという考え方もあります。
どの導入方法を選択するにしても、コストを抑えてGPUサーバーを運用するためにはGPUサーバーに対応した高電力データセンターの活用が必要といえるでしょう。
AI基盤/GPUサーバー向け「高電力データセンター」を選ぶ6つのポイント
GPUサーバーに対応した高電力データセンターを比較・検討する際には、特に次の6つの条件に着目すると失敗が少ないでしょう。
1. 電力容量
一般的なデータセンターの電力容量は1ラックあたり2kVA~8kVA程度ですが、消費電力量の大きいGPUサーバーの格納を想定する場合には、20kVA程度の電力供給が可能なデータセンターを選ぶべきでしょう。
2. 冷却性能
大量の演算処理を行うGPUサーバーは発熱量も大きくなります。適切な冷却が行われずサーバーが高温になると短寿命化や故障につながるため、空調制御や冷却方式を工夫するなどで高い冷却性能を持つデータセンターを選びましょう。
3. ネットワーク速度
運用において外部との通信が必要となる場合には、高速で低遅延な通信環境が提供されているデータセンターを選びましょう。ただし、機械学習などの処理がデータセンター内で完結しているなど、外部との通信が限られる場合にはさほど重要視する必要はありません。
4. 冗長性
サーバーを安定運用し、システムの停止などが発生するリスクを最小化するためには冗長化が有効です。データセンターの電力設備やネットワーク機器が冗長構成されているかどうかを確認しましょう。
5. 安全性・セキュリティ
データセンターの堅牢性・耐震性など災害時の安全性対策や、入退出時の管理などセキュリティ対策もサーバーおよびシステムの安定稼働には必要です。これらの対策が十分に施されているかどうかも確認しましょう。
6. 立地
データセンターの立地も重要です。必要な場合に迅速に駆けつけられるよう、なるべくオフィスに近いデータセンターを選択しましょう。また、重要な施設がある都心部では震災時などの計画停電を免除される場合もあるので有利かもしれません。
AI基盤/GPUサーバー向け高電力データセンター「WebARENA® Symphony」
これまで紹介したポイントをすべてクリアしており、GPUサーバーの設置場所として活用できる高電力データセンターのひとつに、NTTPCのAI基盤/GPUサーバー向け高電力データセンター「WebARENA® Symphony」があります。
20kVA対応可能な高電力ラックを、信頼の技術力とともに提供
勝ちどきデータセンター、門前仲町データセンター、大阪堂島データセンターに加え、新たに都心からのアクセスがよく電力インフラも整備され、かつ地盤も強固な千葉県印西市にてAI基盤/GPUサーバーにも対応可能な20kVA高電力ラックの提供を開始しました。
NTTPCは「NVIDIA認定エリートパートナー(Solution Provider)」であり、マルチノードGPUシステムを効率的に運用するインフラ環境をトータルで設計・提供できる技術力を有しています。商用サービスから研究開発基盤に至るまで、用途・予算に合わせた様々なインフラ設計・構築および運用でお客さまを支援します。
NTTPCの大容量バックボーンと、自社のシステムを直結
長年にわたりネットワークサービスを提供しているNTTPCのIPバックボーンは、主要なIXやISPと高速接続が可能。さらにネットワーク回線は冗長化されており、障害発生時には迂回ルートを確保するなど、安心で快適なアクセス環境を実現しています。
NTTPCのインターネット回線サービス「InfoSphere」を活用することで、このNTTPCの大容量バックボーンと貴社のシステムを直結し、貴社システムへの快適なアクセス環境を提供します。
十分なリスク対策とセキュリティ環境で、安心安全な運用を実現
災害や長時間の停電対策として、UPS(無停電電源装置)や非常用発電機などの電気設備を冗長構成。十分なリスク対策でGPUサーバーの安定運用を実現します。
また、24時間365日のカメラ監視、ICカード / 生体認証によるなりすまし防止・供連れ防止、エレベーターの着床制限など、多層的セキュリティ対策を実施。強固なセキュリティ環境を構築しています。
今後、生成AI/LLMの技術などを活用したシステムの導入を検討する際には、「WebARENA® Symphony」を選択肢の1つに加えてみてはいかがでしょうか。
まとめ
今回は、生成AI/LLMなどを導入する際に利用する「GPUサーバー」に対応した「高電力データセンター」の選び方について解説しました。
日本国内では、データセンターサービス市場規模が拡大する一方でデータセンターの数は徐々に減少しており、特に最新のGPUサーバーに活用できる高電力データセンターはまだまだ少ない現状です。
今後、生成AI/LLMの技術などを活用したシステムの導入を検討する際には、まず「クラウド型」か「オンプレミス型」かを決定し、本コラムで紹介した「電力容量」「冷却性能」「ネットワーク速度」「冗長性」「安全性・セキュリティ」「立地」の6つのポイントを考慮のうえで高電力データセンターを選択しましょう。
※ICT Digital Columnに記載された情報は、リリース時点のものです。
商品・サービスの内容、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。