【GPU×コミュニケーション】イラスト一枚でVライバーに~機械学習が実現する新しい自己表現の形~
株式会社IRIAMさま

投稿日
更新日
【GPU×コミュニケーション】イラスト一枚でVライバーに~機械学習が実現する新しい自己表現の形~
Index
溝田 直也 さま
株式会社IRIAM プラットフォーム事業部 プロダクト開発部 副部長
溝田 直也 さま
市川 創大 さま
株式会社IRIAM プラットフォーム事業部 プロダクト開発部 エンジニアリング第八グループ
市川 創大 さま

お客さまの課題

  • サービスの中核となる機械学習技術を活用したイラスト配信機能の開発加速に向けた高性能GPU環境の必要性
  • 既存環境(RTX 6000 Ada×2基)では機械学習モデルの学習に1~2カ月を要し、研究開発サイクルが停滞
  • VRAMの制約により採用可能なモデルアーキテクチャーが限定され、学習の安定性にも課題
  • 新たな手法への挑戦を妨げる長い学習時間と計算資源の不足

導入の効果

  • H200 NVL搭載GPUサーバー導入により学習時間が4~5倍高速化され、1~2カ月要していた処理を大幅に短縮
  • バッチサイズを8倍に拡大することで学習の安定性が向上
  • VRAMの大幅増加により、これまでマシンの制約で試せなかった新しいアーキテクチャーの検証が可能に
  • オンプレミス環境での専有利用により、コストを気にせずトライアンドエラーを繰り返せる研究開発環境を実現
  • 研究開発サイクルの加速により、ユーザーフィードバックを迅速にプロダクションへ反映できる体制を確立
  • より多様なイラストへの対応と高品質なキャラクター表現により、なりたい自分になれる世界の実現を加速

「心でつながる魔法をかける」をミッションに掲げる株式会社IRIAMは、DeNAグループの一員として、Vライブコミュニケーションアプリ「IRIAM」を運営している。2018年10月のサービスリリース以降、キャラクターを介した新しいライブ配信体験を提供し続けてきた。中でも、2020年初頭に実装されたイラスト配信機能は、現在ではライバーの90%以上が利用する中核機能へと成長している。機械学習技術を活用し、1枚のイラストから表情豊かに動くキャラクターを表現することで、手軽にバーチャルキャラクターでの配信を楽しめる環境を実現した。

こうしたサービスの進化をさらに加速させるべく、同社は機械学習機能の内製化に着手。その基盤となる高性能GPU環境として、NTTPCを通じてNVIDIA H200 NVL搭載GPUサーバーを導入した。本インタビューでは、プロダクト開発部副部長の溝田氏と機械学習開発を担当する市川氏に、この導入がもたらした変革と、機械学習技術が切り拓くコミュニケーションの未来について語っていただいた。

【導入製品】
Supermicro製:SYS-521GE-TNRT
GPU:NVIDIA H200 NVL

Supermicro製:SYS-521GE-TNRT

Supermicro製:SYS-521GE-TNRT製品画像(参考:NTTPC
※NVIDIA H200 NVLは、PCI Express Gen5に対応したTensor Core GPU。141GBのGPUメモリと最大4.8TB/秒のGPU内部メモリ帯域を備え、メモリ容量や帯域が処理性能に影響する大規模言語モデル(LLM)の推論処理やHPCワークロードに対応。

「スマホとイラスト一枚あれば、わずか5分でVライバーになれます」

――Vライブコミュニケーションアプリ「IRIAM」を手がける株式会社IRIAMのプロダクト開発部副部長 溝田氏はそう語る。

従来、バーチャルキャラクターを使った配信を行うには、専用ツールでLive2Dモデル(2Dイラストを立体的に動かす技術)を作成する必要があった。高度なスキルと時間、数万円〜数十万円のコストを要する作業は、多くの人にとって大きな壁となっていた。

株式会社IRIAM プラットフォーム事業部 プロダクト開発部 副部長 溝田 直也さま
株式会社IRIAM プラットフォーム事業部 プロダクト開発部 副部長 溝田 直也さま

溝田氏「以前は、Vライバーとして配信するためには、Live2Dモデルを自作する必要がありました。専用ツールを使ってイラストをパーツごとに分け、変形やモーションをすべて手作業で設定しなければならず、参入のハードルは非常に高かったと思います。イラスト一枚で配信できるようにすることで、より多くの方に参加していただきやすくなりました。」

こうした課題を技術で解決したのが、IRIAMのイラスト配信機能だ。同機能は機械学習技術を活用し、ユーザーがアップロードした一枚のイラストを自動的に解析・分解することで、表情豊かに動くキャラクターとして表現する。実際に試した範囲では、アップロード後、十数秒程度でイラストが動き出し、配信ラグもIRIAM社計測で約0.1秒という低遅延である。この機能により、IRIAMはバーチャル配信に参加するための技術的・心理的なハードルを大きく引き下げた。

IRIAM配信機能を含む、IRIAMのイメージ動画

※IRIAMは、累計ダウンロード数544万突破、配信者数15万人突破という規模で展開している。Vライブ配信とは、イラストや3Dモデルなどのバーチャルキャラクターを使ったライブ配信のことを指し、その配信者をVライバーという。

このように、IRIAMの特徴はバーチャルキャラクターを介した親密なコミュニケーションにある。

溝田氏「一般的な配信プラットフォームとは異なり、IRIAMでは5~10人程度の少人数で親密にやり取りをします。配信に入ると配信者が名前を呼んで挨拶してくれる、そんな温かいコミュニケーションが特徴です。キャラクターを介することで、立場や見た目に左右されず、フラットにコミュニケーションできると考えています。」

このイラスト配信機能のさらなる進化を目指し、同社は高性能GPUサーバーの導入を決断した。

【導入の背景】機械学習技術を活用したイラスト配信機能の内製化への挑戦

溝田氏「2024年頃から、機械学習周りを社内で開発する体制を整え始めました。それまでは外部パートナーと協業していましたが、サービスのコア機能であるイラスト配信機能をより進化させるため、内製化に踏み切りました。」

IRIAMのイラスト配信機能は、2020年の開始からバージョン1、2、3と進化を重ねてきた。
現在でもLive2Dを使用している配信者は存在するが、細かい表現が可能な一方で、イラスト配信機能を使う配信者が大多数を占めている。

溝田氏「機械学習では、イラストからパーツを分解し、表情を変えられるようにしています。目や口といった基本的な部分を動かすだけでなく、キャラクターに忠実な表情や、より豊かな動作を実現することが目標です。」

しかし、機械学習モデルの大規模化に伴い、計算資源の制約が研究開発の大きなボトルネックとなっていた。

【導入の経緯】試行錯誤を加速させるGPU刷新

高性能GPU環境の導入を検討し始めた背景には、既存環境の深刻な性能不足があった。

市川氏「当時利用可能だったのは、RTX 6000 Adaを2基搭載したマシンでした。しかし、イラスト配信機能を実現する機械学習モデルをリリース可能な品質までトレーニングするのに、1~2カ月という時間がかかっていました。さらに、VRAM(GPUメモリ)の不足により、採用できるモデルのアーキテクチャー(構造)にも制限が出ていました。」

研究開発では、一度の実験で完璧な結果が得られることは稀であり、何度も試行錯誤を繰り返す必要がある。しかし、1回の学習に1~2カ月かかる状況では、現実的な研究スケジュールを組むことが不可能だった。

市川氏「研究開発では、様々な手法を試す必要があります。学習に1カ月かかるとなると、どうしても安全な選択肢に偏ってしまい、リスクを取った挑戦ができませんでした。学習時間が短くなれば、万が一実験が失敗しても大きな痛手にならず、より多様なアプローチを試せるようになります。このような経緯からオンプレミスのGPUサーバーの導入に至りました。」

今回導入に至ったH200 NVL搭載GPUサーバー
今回導入に至ったH200 NVL搭載GPUサーバー

オンプレミスGPUを選んだ理由:コストの迷いなく試行錯誤可能に

GPU環境の選択肢として、クラウドサービスも検討されたが、様々な観点からオンプレミスが選ばれた。

市川氏「クラウドサービスも検討しましたが、この実験を実施するためにいくらかかるか、という計算がどうしても頭をよぎってしまいます。それが開発の妨げになると考えました。オンプレミスであれば、一度購入すれば後は使うほどお得になりますし、様々な実験に挑戦しやすくなります。」

研究開発においては、トライアンドエラーが本質的な要素となる。同社にとって、オンプレミス環境は制約なく研究開発を進められる選択肢となった。

市川氏「コストを気にしながらの研究では、本来必要な検証が十分にできない可能性があります。手元でいつでも使えて、独占的に計算リソースを使用できる価値は非常に大きいです。実際に、自分たちのペースで制約なく新しいアルゴリズムの検証に集中できています。」

NTTPC採用の決め手

複数のベンダーを検討した結果、NTTPCを選択した理由について溝田氏に伺った。

溝田氏「見積もりシミュレーターを使って、さまざまな構成を事前に検討できた点は非常に大きかったですね。高性能なGPUサーバーは価格感がつかみにくい部分もありますが、構成を変えながら試算できたことで、導入前に予算の見通しを立てることができました。結果として、安心して意思決定を進められたと思います。」

見積シミュレーション

NTTPCの見積もりシミュレーター:躯体とパーツを選ぶカスタマイズ方式と、用途別おすすめ構成から選ぶ方式の両方に対応。構成選択から概算見積もりまでをオンラインで迅速に提案する。

実際の導入プロセスでも、NTTPCのサポートが役立ったという。

溝田氏「価格面が安く、カスタマイズの選択肢が豊富でした。また、初めてオンプレミスGPUサーバーを導入する私たちに対して、非常に丁寧にサポートしていただきました。」

導入にあたっては、設置場所の検討も課題となった。

溝田氏「オンプレミス導入という判断をしたものの、200Vの大容量電源が必要になることは想定外でした。オフィス内のサーバールームへの設置も考えましたが、電源工事が必要になります。一方、データセンターをお借りする場合も、ハウジングでラックだけ借りるということが電源の制約上できず、フルラックでの契約が必要になるなど、想定以上に電源のコストがかかることが分かりました。最終的には、様々な工夫を加えた上で、データセンターに設置することで問題なく収めることができました。」

【導入がもたらす価値】学習時間の大幅短縮と研究開発サイクルの加速

今回のH200 NVL搭載GPUサーバー導入により、同社の研究開発環境は大きく変化した。

市川氏「従来と比べて学習時間が4~5倍程度高速化されました。1~2カ月かかっていた処理が大幅に短縮され、研究開発サイクルのボトルネックが解消されました。」

さらに、VRAMの増加により、バッチサイズ(一度に処理するデータ量)を8倍程度に増やすことが可能となった。

市川氏「一度に載せられるデータが増えることで、学習が安定します。また、一度に載せられるパラメーター数が増えることで、より大規模な、より新しいアーキテクチャーの機械学習モデルを試せるようになりました。これまでマシンの制約で試せなかったモデルにも挑戦できるようになったのは、大きな価値です。」

研究開発の加速は、最終的にユーザー体験の向上につながる。

市川氏「ユーザーさんから『この画像でうまく動かなかった』といったフィードバックをいただき、それを踏まえて改善策を検討します。しかし、学習に1カ月かかると、安全な手法しか試せませんでした。学習時間が短くなったことで、多少リスクのある新しい手法にも挑戦しやすくなり、試せる手数が増えました。」

現在、すでに新しい環境での研究開発が進行中だ。

市川氏「ある手法を学習させるためのプログラムを作成し、実際に動かしています。プログラムのバグ修正や環境への適合など、学習を正しく実行できる状態にするまでにも、様々な試行錯誤が必要です。GPUの計算力と日々の試行錯誤が組み合わさることで、研究開発は着実に前進しています。」

【今後の展開】機械学習技術がもたらすコミュニケーションの未来

【今後の展開】機械学習技術がもたらすコミュニケーションの未来

機械学習技術の進化がIRIAMにもたらす可能性について、溝田氏は次のような展望を示す。

溝田氏「当面は、イラスト配信機能を大きく進化させることに注力します。長年提供している機能ではありますが、まだまだ満足いく表現ができていません。もっとできることがあると強く思っています。」

イラスト配信機能における主な課題について、溝田氏はこう語る。

溝田氏「一つは、対応できるイラストの幅です。目が二つあって口があるという、ある程度の前提はありますが、眼鏡をかけたキャラクター、デフォルメされたキャラクター、様々な角度を向いたキャラクターなど、様々なバリエーションに対応する必要があります。せっかく描いたキャラクターが動かないというのは、避けたい事態です。」

もう一つは、キャラクター表現の品質である。

市川氏「アップロードしたキャラクターに対して、忠実な表情を実現すること、動きの滑らかさ、稼働する部位の多さなど、品質には様々な側面があります。特定の絵柄だときれいに動くが、別の絵柄ではうまく動かないという状況は、『自分らしさを表現する』というIRIAMの理念からすると好ましくありません。どんな絵柄であっても受け入れられるようにすることが目標です。」

この「どんな絵柄でも受け入れる」という技術的な挑戦こそが、IRIAMの掲げる価値観を支える基盤となっている。

“なりたい自分になれる世界へ”

機械学習開発を担う市川氏は、その実装を担う立場としてのやりがいを次のように語る。

市川氏「キャラクターになりたいと思ったら、そのキャラになれる。より可愛く、よりかっこよく、ライバーさんのなりたい自分を表現できるようにする。機械学習技術でそういう世界を実現していく立場にあることに、すごくやりがいを感じています。」

一方で溝田氏は、サービス全体としての未来像をこう描く。

溝田氏「IRIAMというサービスは、まだまだ完成していません。大きなポテンシャルを秘めているサービスだと思っています。バーチャルキャラクターを介することで、現実世界での立場や容姿、性別といった属性に縛られることなく、純粋に人と人としてフラットにコミュニケーションできる世界を目指しています。自動翻訳技術が発展すれば、国境や言語の壁も超えて、世界中の人とつながることもできます。IRIAMを使うことで自分の価値観が変わるというレベルまで到達できるよう、これからも挑戦し続けます。」

株式会社IRIAMは、機械学習技術の内製化と基盤強化を通じて、表現の自由度そのものを広げ続けている。
技術が裏側に溶け込むことで、人はより自然に「なりたい自分」を選び、世界とつながれる——そんなコミュニケーションの未来を、プロダクトとして実装し続けていく。

GPU製品・サービス

AI / IoT、デジタルツイン用途に適したGPUサーバーを設計・構築。さらにデータセンター・ネットワークなど、GPU運用に必要なシステムをワンストップで提供可能。

※NVIDIAは、米国およびその他の国におけるNVIDIA Corporationの商標または登録商標です。
※IRIAMは、株式会社IRIAMの登録商標または商標です。
※本記事は2026年1月時点の情報に基づいています。製品・サービスに関わる情報等は予告なく変更される場合がありますので、あらかじめご了承ください。