ユースケース

INTERVIEW
インタビュー
学校法人 東京電機大学

来るべきAI時代を担う
機械学習
の専門人材を育成
GPUサーバーで研究サイクルを加速

足立区北千住ほかにキャンパスを構える東京電機大学は、1907年の開校以来、技術を通じて未来に貢献できる人材の育成に努めてきた。同大学は高度化する情報化社会に向けてシステムデザイン工学部を2017年に開設。その一環として機械学習(ディープラーニング)の教育と実践にも力を入れ始めている。2018年に開催されたディープラーニング関連のコンテストで顕著な成績を収めた同学部の前田英作教授ほかに話を伺った。

前田 氏

東京電機大学 知能創発研究所 所長
システムデザイン工学部 教授
データ科学・機械学習研究室

工学博士 前田 英作 氏

酒造 氏

東京電機大学 知能創発研究所
システムデザイン工学部
プロジェクト研究准教授

酒造 正樹 氏

右から:安藤 申将 さん(学部4年生)、ソウ・キン(Xin Cao) さん(同)
左から:鏡川 悠介 さん(学部3年生)、 伊藤 千紘さん(同)、皆川 哲範 さん(同)

注:所属・肩書き・学年は2019年2月時点のものです

機械学習とデータ活用を目的とした
研究室を開設

研究室の概要を教えてください。

前田  東京電機大学に着任した2017年9月に、システムデザイン工学部の中に「データ科学・機械学習室」という研究室を立ち上げました。人工知能ブームの中で、キーとなる機械学習を学んでもらうとともにデータを見る目を養うことを目的とした研究室です。研究テーマは、画像処理、映像処理、言語処理、音声対話システム、生体データ解析など、機械学習の応用の範囲で自由に選ばせています。

酒造  私は加速度MEMSセンサーやマイクロマシンなどのものづくり研究が専門ですが、そうしたセンサーから得られるデータの活用にあたって機械学習にも興味があり、データ科学・機械学習室の学生さんと一緒に勉強しています。

2018年に開催された機械学習のコンテストにおいて、国際大会の「Sussex-Huawei Locomotion Challenge(SHL Challenge)」では3位に入賞、電子情報学会のパターン認識・メディア理解研究会(PRMU)が主催した「第22回 PRMUアルゴリズムコンテスト」では最優秀賞を受賞されたそうですね。おめでとうございます。

前田  SHL Challengeは、スマートフォンを4ヶ月に亘って携行して集めた加速度・角速度・地磁気・方角・気圧などの多チャンネルの膨大な時系列データから、その人の行動を自動車に乗っている、バスに乗っている、電車に乗っている、地下鉄に乗っている、歩いている、走っている、自転車に乗っている、立ち止まっている、の中から推定するという国際コンテストです。3週間という短い準備期間での出場だったのでポスター発表へ入賞できればいいかなと思い、学生に取り組ませたところ、われわれも驚く全体の3位という素晴らしい成績を収めてくれました。

PRMUアルゴリズムコンテストは若手研究者の育成を目的に毎年開催されています。2018年に開催された第22回では、ブラックボックスである認識エンジン(識別器)の入力と出力だけを見て、その識別器のクローン(複製)を作るという題材が設定されました。機械学習やパターン認識の本質を理解するにはとても良い設問といえます。SHL Challenge同様、機械学習を理解してもらう目的で何かを掴んでくれればいいなと考えてチャレンジさせましたが、一位を獲得してくれました。

GPUサーバーを活用して
コンテストで上位を獲得

SHL Challengeについて、成果のポイントを教えてください。

ソウ  行動が分かっている271時間分のラベル付きデータを元に、96時間分のラベル無しデータを分類し、人間の行動を認識する精度を競うコンテストです。具体的には、どの部分が自動車に乗っているところ、どの部分が歩いているところ、といった正解の時間が長いほど上位になります。一般にこうした時系列データにはRNN(Recurrent Neural Network)やLSTM(Long short-term memory)が用いられますが、信号を画像に変換してCNN(Convolutional Neural Network)で処理する方法をちょうど別の研究で扱っていましたので、同じ手法を適用することにしました。データにFFT(Fast Fourier Transform)を掛けて画像変換する際、行動に応じた特徴が画像に現れるよう工夫し、識別率を上げました。

酒造  時系列データが与えられた場合、平均や分散や周波数スペクトルなどを多次元の特徴量空間に割り当ててクラス分類を行う手法が古典的には使われますが、クラスが増えるほど難しくなり、計算リソースも必要になってくるため、課題提出までの短い期間で識別精度を上げるのは難しいだろうと考えていました。ところがそうした手順は踏まずに、次の日には、「先生、こんな結果が出ました」と、変換した画像と合わせて持ってきたのです。彼らの発想の柔軟性に驚かされましたね。

伊藤  時系列のセンサーデータを画像に変換する処理には性能差はとくになかったため、通常のパソコンを使用しましたが、取得した画像の学習と識別のような高速処理にはGPUサーバーが不可欠でした。271時間分の既知のデータのうち、7割を学習に、残り3割を検証に割り当て、その組み合わせを変えて何度も繰り返し評価を行うのですが、GPUサーバーは通常のパソコンに比べて数倍高速で、1回当たりの検証を数分で終えられるため、効率良く進めることができました。今回、フレームワークにはTensorFlow、上位ライブラリ ( Wrapper ) にはKerasを使いました。


シンガポールで開催されたUbicomp 2018ワークショップでの表彰の様子
(右から、酒造先生、前田先生、ソウさん、伊藤さん)
参照元:東京電機大学公式サイト

ソウ  SHL Challengeの1位と2位はともにスロベニアの研究所で、多くのリソースを使いながらディープラーニングのあらゆる手法を試すなどして結果を出していました。そういったプロフェッショナルなチームが参加するコンテストで、短期間の取り組みで3位を獲得することができたことは嬉しく思います。

続いて、第22回PRMUアルゴリズムコンテストにおける取り組みについて教えてください。

安藤  入力と出力の対応だけを手掛かりに、ある認識モデルのクローンを構築するというのが課題で、レベル1からレベル3まで難易度の異なる三つの設問があります。考え方や発想が勝負のようなところがあり、メンバーで議論して、モデルを仮定して・実装・検証するサイクルを回せたことが良い成績につながったと思っています。レベル1とレベル2の設問は2次元の軽いデータでしたので通常のパソコンを使いましたが、数十GBの画像データを対象にしたレベル3には数倍も高速なGPUサーバーを活用しました。

皆川  私自身、もともとプログラミングの経験や機械学習に関する知識もありませんでした。しかし、トレンドとしてすごく興味あり、で、前田先生の勉強会に参加するようになりました。
今回のPRMUアルゴリズムコンテストに参加することで、認識モデルがどうなっているか、クローンをどう作るか、といったアイディア出しの部分で、議論と検証のサイクルを試せたことは大きな収穫でした。

鏡川  2018年の夏休み中に結果を出さなければいけなかったので、データ量の多いレベル3の設問はボトルネックになりがちでした。高性能なGPUサーバーがなければ難しかったと思っています。私は外観検査の自動化などへの応用を見据えてGAN(Generative Adversarial Network)を研究していますが、PRMUアルゴリズムコンテストでは安藤先輩の意図や考えを整理し、メンバー間での共通理解を深めること、資料にまとめるなどの作業を担いました。結果としてチームに貢献できたと思っています。


東北大学で開催された表彰式の様子
(左から皆川さん、鏡川さん、伊藤さん、安藤さん)
参照元:東京電機大学公式サイト

伊藤  私はSHL Challengeに続いてPRMUアルゴリズムコンテストにも参加しました。識別モデルとしては、kNN(k-nearest neighbour)、SVM(Support Vector Machine)、勾配ブースティング決定木などが知られていますが、kNNでもパラメータを変えるだけで認識率が変わってきます。識別モデルやパラメータを調整しながらGPUサーバーで走らせ、メンバーに結果を見てもらうことを繰り返しました。

GPUサーバーは教育目的での
長期使用に適している

功績を収めた2つのコンテストにはGPUサーバーを活用されたとのことですが、前田先生の研究室ではどういったGPUサーバーを導入されたのですか?

前田  GeForce GTX 1080Tiが1枚搭載されたタワー型のGPUサーバーを10台と、GeForce GTX 1080Tiが4枚搭載されたタワー型のGPUサーバーを2台導入しています。このシステムの導入にあたっては、研究室を早期に立ち上げることと、トラブルなく安心して使えることが重要と考えていました。公募に対して数社から提案をもらいましたが、決め手となったのはディープラーニングで最先端を走るPreferred Networks社への導入実績があり、また、放熱に対する不安についてもノウハウの中でご提案があった点などを評価し、NTTPCコミュニケーションズを選定しました。
また、導入以降、トラブルがあったときも非常に頼りにしています。

機械学習を実装するにはクラウドサービスやFPGAを利用する方法もありますが、教育目的として長期に使うにはLinuxやPythonを含む汎用的な環境を構築できるGPUが適しており、その知識や経験は就職後にも役立つと考えています。ちなみに、研究室に設置したGPUサーバーは学部1年生でも自由に使えるよう開放しました。学生が集まって活発な議論が生まれ、研究室の雰囲気が盛り上がるという効果も出ています。

ディープラーニングを含む機械学習技術は急速に進歩しています。また、AI(人工知能)に対しては社会全体が多くの期待を寄せています。これからの展望、そして次代を担う学生における育成面に対しご意見をお聞かせください。

酒造  やはりAIを使いこなせる人材を育てなければいけないなと考えています。たとえば、なんらかのデータが与えられたときに、最適な手法やツールを判断できるような感覚を身に付けてもらいたいなと願っています。

前田  今や機械学習は産業のあらゆる分野で必須の道具になりつつあり、「基礎となる技術や理論を身に付けておけば社会のどこに出ても役立つよ」と、学生にはいつも言い聞かせています。GPUサーバーは強力で優れたツールではあるものの、今回取り組んだコンテストでも分かるように、頭を絞らなければならないのは基本的な考え方やアプローチの部分です。ですから、自分が書いたプログラムが動いた、良かった、で満足するのではなくて、イロハをきちんと理解した学生を育成していくのが私たちの努めと考えています。

興味深いお話をありがとうございました。貴研究室のこれからの取り組みを楽しみにしています。