トレンドコラム

性能検証

AIの民主化!?話題の機械学習自動化プラットフォーム「Driverless AI」を試してみた!

2020.05.22

サービスクリエーション本部 ソフトウェアエンジニア 飯田 嘉一郎

サービスクリエーション本部 ソフトウェアエンジニア
飯田 嘉一郎

AIの民主化!?話題の機械学習自動化プラットフォーム「Driverless AI」を試してみた!

「AI人材が足りない!!」

これは色々なところでよく耳にする言葉です。現在は第3次AIブームと言われており、IT企業でない会社でもAIを活用している企業が増加しています。さまざまな場面でAIが活用されはじめ、多くの企業でAI人材不足が叫ばれています。実際、IPAの調査を見ると、IT企業においてAI人材が不足していると回答している企業は7割程度になるようです。(IT人材白書2019)
我々としてもこの「AI人材不足」という問題を解決すべく、社員の積極的な研修参加や、有志で機械学習コンテストに参加するなど、AI人材育成の取り組みを行っています。

しかし私は、AI人材育成以外のアプローチでもAI人材不足の解消ができるのではないかと考えています。
どうやら世の中にはAI人材を育てるまでもなく、誰もが機械学習を使えるようになる、言うなれば「機械学習の民主化」を実現するためのツールが出ているらしい。
ひょっとして、非技術者でも機械学習ができてしまうのではないか・・・
と言うことで、そんなツールである「機械学習自動化プラットフォーム」を試してみました!
※本記事は、2019年1~3月頃に行った機械学習自動化プラットフォームの検証内容及び結果に基づいています。

実際に試してみた!

今回試したツール

これらの機械学習自動化ツールを実際に使用し、どのくらい簡単に機械学習が行えるか?を試してみました。

試した際にやったこと

各ツールを実際に使用しました。

  • H2O.ai: AWS*1のEC2にインストールして使用。
  • Driverless AI: H2O.aiと同様にEC2にインストールして使用。ライセンスは無料トライアル用ライセンスを使用。

実際に、KaggleSignate(AI開発のコンペティションを行っているサイト)の問題を活用しながら、ツールを試してみました。

*1 Amazon Web Services、”Powered by Amazon Web Services”ロゴ、およびかかる資料で使用されるその他のAWS商標は、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。

試した結果 〜機械学習は楽になるか?〜

ツールを試してみた結果、どのくらい機械学習が楽になるか?と言う観点で見てみましょう。まず、通常の機械学習のサイクルについて簡単におさらいします。

通常の機械学習は上の図のような流れになるかと思います。
データを理解するところから始まり、実際に基準を満たすモデルができるまでサイクルを繰り返していくような形ですね。
このようなサイクルを回していく必要がある、機械学習がどれだけ楽になるか?を見ていきましょう。

H2O.ai

H2O.aiを試してみると、機械学習のサイクルの中で、「アルゴリズム選定」と「モデル作成」が自動化できることがわかりました。

本来であれば、「アルゴリズム選定」「モデル作成」では、実際にPython等でコードを書くことでデータの学習を行うのですが、H2O.aiのH2O FLOWというツールを使うと、GUIで「Run AutoML」を選択して実行するだけで、アルゴリズム選定とモデル作成を同時にやってくれます。

次はH2O.ai社の有償版ツールである、Driverless AIを見てみましょう。

Driverless AI

有償のツールだけあって、Driverless AIでは「データ前処理」「フィーチャーエンジニアリング」「アルゴリズム選定」「テスト指標」「モデル作成」「モデル評価」の6つの手順を自動化できることがわかりました。

「データ前処理」「フィーチャーエンジニアリング」の二つの手順に関しては、通常の手法だとデータサイエンティスト自身が職人技で実施していた手順でした。その手順を自動でやってくれるというのは非常にありがたいです。画面のように学習状況は可視化されており、どのような特徴量が学習に影響しているかも確認することができます。

「アルゴリズム選定」から「モデル作成」部分はH2O.aiと同様に自動化できるようになっております。H2O.aiに比べて高機能であるため、設定できるパラメータが非常に多く、細かい検証までは実施できませんでした。無料ライセンスがあるので、ご自身の手で試してみてください。

「モデル評価」の部分も一目瞭然です。通常の手法だと評価指標の選定やPythonのコードを作成し、評価結果の可視化を行います。こちらの部分についてDriverless AI ( 右上図 ) を利用することで可視化をすることができます。
評価画面の使い勝手等は個人差があるため明言できませんが、私は通常の手法よりも見やすく、結果も分析しやすいと感じました。

ツールを試してみて

実際に機械学習プラットフォームを使ってみて、機械学習がどれだけ楽になるかを図にしてみました。


図:機械学習モデル作成にかかる稼働量

上の図は先ほどの機械学習の1サイクルを20人日程度で回すことを想定し、各手順にかかる時間を2.2人日程度とした場合の稼働量を表したものです。
機械学習自動化プラットフォームを使うことで手順が自動化され、機械学習のサイクルを回しやすくなることがわかりました。機械学習は一回実施して完成したら終わりではなく、データが新しくなった場合にまた新たに学習を回します。そのため、自動化による稼働削減も見込めるのは嬉しいですね。

また、各工程が自動化されることで機械学習に必要な専門スキルも少なくなるのではと感じました。従来手法ではデータ分析や機械学習に長けたデータサイエンティストでなければできなかった作業が、H2O.aiを使うことで少し必要スキルのハードルが下がる、またDriverless AIを利用すればコーディング不要で機械学習を実行できるため、非技術者にも利用できそうです。
しかし、Driverless AIを利用する場合であっても機械学習に関する知識はある程度必要です。いくら自動化されるとはいえ、今押したボタンが何をやっているかがわからないと、ツールを使うことはできませんからね。機械学習のどの手順でどのようなことが行われているか、をイメージできる方なら使いこなせるのではないかと思います。

まとめ

今回は、機械学習自動化プラットフォームを用いて実際に機械学習を実行させた結果をまとめてみました。
今回試してみた「機械学習自動化プラットフォーム」が非常に便利なツールであることは伝わりましたかね?機械学習サイクルの一部の手順を自動化できる恩恵が非常に大きいことが伝わったと思います。

「AI人材不足」は、当社も含め多くの企業が直面している社会課題の一つであるため、今後も、こういった非エンジニアの方でも使いやすいツールの需要は高まっていくと思われます。AIの民主化が実現する日を心待ちにしています!