
インタビュー
"異音"検知ソリューションで
産業分野に新たな価値を提供し、社会に貢献
高性能GPUサーバーで研究開発を加速

音を通じて社会課題の解決に取り組んでいるHmcommは、防犯、畜産、機械や駆動系の故障検知などをアプリケーションとする異音検知プラットフォーム「FAST-D」を開発している。異音検知のモデル開発やアルゴリズム検証を迅速化するために、高性能なGPUサーバーNVIDIA DGX-1を複数台導入するなどして、リサーチャーの研究開発効率の向上を図る。2021年春の実用化を見据えた同社の取り組みについて話を伺った。

Hmcomm株式会社
R&Dセンター センター長
横田 裕之 氏
注:所属・肩書きは2020年3月時点のものです
異音をディープラーニングなどで検知する
「FAST-D」プラットフォームを開発中
Hmcommさまの概要を教えてください。
横田 Hmcomm(エイチエムコム)は産総研(国立研究開発法人 産業技術総合研究所)発のベンチャー企業として2012年に設立されました。「音から価値を創出し、革新的サービスを提供することにより社会に貢献する」というビジョンを掲げ、音を通じて社会課題の解決に取り組んでいます。
事業の柱となっているのが、ディープラーニングを用いた音声認識処理・自然言語解析処理プラットフォーム「Vシリーズ」で、音声のテキスト化や自動要約などの用途でコールセンターを中心にさまざまなお客さまに活用されています。
新たな事業のひとつとして開発を進めているのが異音検知プラットフォーム「FAST-D」(Flexible Anomaly Sound Training and Detection)です。いくつかの企業と共同開発を進めている段階です。
FAST-Dはどういったアプリケーションを想定しているのですか?
横田 大きくは四つの領域があると考えています(図1)。
① クルマや鉄道車両における駆動系の故障予防や安全性向上
② 悲鳴やガラス破砕音の検出による保安・安全・防災
③ 養豚の鳴き声から疾病や発情を検知する飼養管理
④ 生産設備やプラントの異音検出による機械設備の故障予防・早期対応
このほかに、たとえば屋外のデジタル・サイネージの周辺にどの程度の人がいるかという広告効果測定への応用も検討しています。

図1. Hmcommの異音検知プラットフォーム「FAST-D」が対象とする主な分野
異音検知は技術的にはどのような原理で行われるのでしょうか?
横田 解決したい課題や収集できる音データによっても異なるため、ルールベース、従来の機械学習、および、ディープラーニングなどを使い分けながら実現します。ディープラーニングを適用する場合は、集音した音データの周波数分布や抽出した特徴量から学習モデルを構築します(図2)。

図2. 異音検知のおおまかな処理の流れ
横田 音の波形にはさまざまな情報が混ざり合っているため、異音だけを直接検知するのは難しく、たとえば周波数分布をスペクトログラムとして時系列に表示させ、画像化の上画像認識として処理するといった手法を用いることもあります。また、正常音は収集できても異常音は収集できない場合もあります(図3)。つまり、課題に適した手法をどう選択するかが重要といえます。当社でもこのようにさまざまな研究や検証を行っています。

図3. 正常状態のみ学習できる場合の異音検知モデル(外れ値検知モデル)の構築と推論の概念
NVIDIA DGX-1をNTTPCのファシリティに収容
InnovationLAB*1も活用し効率的な運用を図る
FAST-Dの開発はどのような環境で進めているのですか?
横田 異音検知のプラットフォーム開発や要素技術の研究開発を進めるには、相応の計算資源が必要です。外部クラウドサービスのGPUインスタンスも利用していますが、開発チームの人員も増えたこともあり、計算の分散化や並行化を進めるためには高性能なGPUサーバーがローカルにも必要と考えて環境を構築しています。
まず2018年10月頃に、異音検知プラットフォームの研究開発において、高性能なNVIDIA DGX-1 ( 図4 ) を3台導入しました。これらはNTTPCのデータセンターにハウジングし、運用管理を含めてNTTPCにお願いしています。
また、2020年3月には、オフィス内に設置するGPUワークステーション1台を、やはりNTTPCから購入しています。

図4. Tesla(R) V100 NVLinkを8基搭載し、1ペタFLOPSもの演算性能を実現した
ディープラーニング専用アプライアンス「NVIDIA DGX-1」。NTTPCでも取り扱っている。
*1 NTTPCがAIパートナー向けに提供。GPUサーバー、高電力ラック、容量ストレージ、VPN/インターネット回線を提供するとともに、AIパートナー同士の交流の場を設けています。詳しくはコチラをご参照ください。
ハウジング先としてWebARENA Symphonyを選択した理由を教えてください。
横田 NVIDIA DGX-1はきわめて強力なGPUサーバーで、最大消費電力は3,500Wと大きいなど、安定的な電力供給と空調(冷却)が高いレベルで求められます。また、筐体の奥行きが866㎜と長く、背面のケーブルの取り回しを含めると1,100mm程度が必要です。ハウジング先として主要なデータセンターを比較したなかで、GPUサーバーのハウジング実績が豊富で、電源や空調の品質も高く、ラックの奥行に余裕があり、さらに利用料金なども含めて総合的に判断しました。
また、NTTPCでは2019年度より「InnovationLAB」というパートナープログラムを開始されると伺いました。当社もこのプログラムに参画することで、単なるデータセンター事業者としての取引関係だけではなく、ビジネスパートナーとしての協業も見込めると考え、NTTPCのサービスを選定しました。
InnovationLABに参画した理由をお聞かせください。
横田 「InnovationLAB」を通じて参画する企業間の得意領域を活かしつつ、ビジネスコラボレーションを促進できる点に魅力を感じ、参画を決めました。
また、当社が保有していないGPUサーバーや安定的なVPN/インターネット回線なども提供されており、先端技術のPoC基盤としてGPUプラットフォームが利用でき、研究開発に専念することができます。
FAST-Dは当社一社だけではサービス提供は難しく、さまざまな企業との連携が不可欠です。他社との連携を図るひとつの機会として、そういった交流の機会を提供してもらえるのはありがたいと感じます。
また、InnovationLABへの参画とあわせて、「AIパートナー」としてNTTPCとの協業を行っています。今後、FAST-Dをサービス提供するにあたり、当社の保有する異音検知技術と、NTTPCのGPUプラットフォーム技術を融合することで、双方の得意領域を相乗した一体的なソリューションが提供できることは、当社にとって大きなメリットであると考えています。
なお、NVIDIA DGX-1やGPUサーバーを提供するベンダーは数多くありますが、機器の販売だけではなくInnovationLABのような取り組みを行っているところはNTTPCだけだと思います。
運用管理をNTTPCに委託しているのですね。
横田 社内にインフラ専任のエンジニアがいないこともあり、当時、DGX-1を導入したときに、設定や運用管理、安定的な運用を社内で行うのは難しいということを実感しました。リサーチャーに研究開発に専念してもらいたいという考えもあり、当初の2台と追加で導入した1台の運用管理を、GPUサーバーの運用経験が豊富なNTTPCにお願いすることにしたのです。
運用管理をNTTPCに委託し研究開発に専念
DGX-1により数百モデル/週の検証も可能に
NTTPCのサービスを利用したことで、どのようなメリットが生まれていますか?
横田 WebARENA SymphonyおよびInnovationLABとも電源や空調の安定性が高く、ハウジングで置いたDGX-1はトラブルなく稼働しています。また、運用管理をお任せしたことで、研究開発に専念できるようになったのも大きなメリットですね。
実際、当社のリサーチャーはディープラーニングのモデルやアルゴリズムを考えるのは得意ですが、GPUのシステムのセットアップやメンテナンスの経験・知見は豊富ではありません。そこも請け負います、というベンダーもいるとは思いますが、DGX-1クラスのサーバーを扱うには経験と実績がないと難しいと感じました。そういった意味でもNTTPCのサービスを選んで正解だったと考えています。
なお、DGX-1を導入する前はGPUワークステーションを用いていましたが、一週間で数種類のアルゴリズムによるモデルを作ることで精いっぱいでした。現在は一週間に数百個のモデルを作り、検証しているリサーチャーもいます。高性能なDGX-1を導入した効果はとても大きいと感じています。

InnovationLABの取り組みについてはいかがでしょうか。
横田 NTTPCのAIパートナーや顧客を集めた「InnovationLAB MeetUp #1」イベント[*2]が2020年2月7日(金)に開催され、私は残念ながら出席できなかったのですが、当社の代表取締役である三本幸司からは大変盛況だったと聞いています。FAST-Dをプラットフォームとして構築し提供するには当社だけではカバーできないところもありますので、そうした交流の場にこれからも期待しています。
最後に、今後の展望とNTTPCに対する期待をお聞かせください。
横田 FAST-Dに関しては複数のお客さまとPOCを進めていて、課題やノウハウを蓄積している段階です。当社のリサーチャーが現地に出向き、集音のコンサルテーションを行いつつ、音データの分析とモデルの開発・検証までを担当しています。今後はそれらをプラットフォーム化して、お客さまやサービス事業者が音声データを入れるとモデルが出てくるような仕組みを実用化したいなと考えていて、2021年春以降の提供を予定しています。
また、実際のシステムでは、アプリケーションの要件に応じて、推論器をクラウド上に実装したほうがいい場合と、エッジ側に実装したほうがいい場合とがあると考えられます。後者については、当社だけではエッジハードウェアの開発はできませんので、NTTPCや、InnovationLABを通じて交流しているパートナーなどとの協業に期待しています。
ありがとうございました。
最近の記事
技術解説

クラウド vs オンプレミス GPUサーバーの利用コストを徹底比較!
2020.03.17
ユーザーはどのような基準でクラウド、オンプレミスを選択すべきなのか・・・本コラムではコスト面におけるクラウドとオンプレミスの比較について紹介します!クラウドサービスに長年関わったスペシャリストが解説します!
イベントレポート

「InnovationLAB MeetUp #1」を開催しました!
~ 新たなビジネス開発に向けたコラボレーションを ~
2020.03.12
「InnovationLAB MeetUp #1」イベントレポート!AIサービス事業者・AI / IoT関連サービスの導入を検討されている企業さまや学術研究機関の方々などをお招きし、パートナーさまにさらなるアイディア創出やビジネスコラボレーションを促進させるために「InnovationLAB MeetUp #1」を開催しました。