日系企業でAIの利活用が進まない真因とは | 株式会社DATAFLUCT
目次
データが「21世紀の石油」と注目され、それを活かすAIや IoT技術の進化が加速している。
その象徴的な存在としてGAFAが様々な側面で注目を集め、データサイエンティストなどの技術者の価値も高まり続けている。
一方で、データの利活用が思うように進まないケースも数多くある。あらゆるジャンルでデータの利活用が求められる現代において、これは大きな社会課題とも言えるだろう。
そこで今回から2回にわたり、株式会社DATAFLUCT 代表取締役の久米村隼人氏とCTOの原田一樹氏のインタビューを通じて、この課題について考えていきたい。
前編の今回は、DATAFLUCTの事業内容を概観しながら日本でAIの利活用が進まない理由についてお伝えする。
インタビュイー
久米村 隼人[Hayato Kumemura]
株式会社DATAFLUCT 代表取締役
1980年生まれ。2007年にベネッセコーポレーションに入社後、CRMやダイレクトマーケティングに従事。その後、マクロミル・リクルートマーケティングパートナーズ・日本経済新聞社など複数の企業にて、広告・ヘルスケア・データサイエンスなどの領域で15サービス以上の新規事業を創出。2018年8月、 データサイエンスと人間中心設計を軸に新規事業の立上支援を行う「株式会社FACTORIUM」を創業。2019年1月、データとサイエンスの⼒で社会課題を解決することをミッションに「株式会社DATAFLUCT」を設立。同年、宇宙航空研究開発機構(JAXA)の知的財産や知見を利用して事業を行うJAXAベンチャーに認定。現在、幅広い業界に向けてデータ活用支援・新規事業創出を行う。これまでローンチした新規事業は30を超える。 大阪府立大学大学院工学研究科修了(数理工学専攻)、早稲田大学大学院商学研究科(夜間主MBA)修了。JAXA J-SPARCプロデューサー。
原田 一樹[Kazuki Harada]
株式会社DATAFLUCT CTO
1986年生まれ。2010年に大手SIerに入社後、先進技術実証及びデジタルビジネスを推進する組織でアプリ開発・クラウド・データ関連技術の実証実験に幅広く携わってきたフルスタックエンジニア。技術コミュニティの牽引経験や技術コンテストの受賞経験を持つ。2016年6月にマイクロソフトにコンサルタントとして参画後、インフラ案件・AIアプリ開発・IoT/BigDataアーキテクチャ策定等のプロジェクトを推進。その後テクニカルトレーナーとして、同社クラウド技術を全方位にコーチング。現在はDATAFLUCTのCTOとして組織作り・技術標準化・プロダクト開発に従事。
機械学習プロジェクトに欠かせないツールをワンステップかつリーズナブルに提供
ーーまずDATAFLUCTの事業について教えてください。
久米村 当社のビジネスのコアは「マルチモーダルデータプラットフォーム事業」になります。ここに当社の技術が集約されて、主にデータを蓄積する「プラットフォーム」と「機械学習」、「BI」の3つで構成されています。ビッグデータを収集して、それを用いて結果を出すまでの一連の流れを、オールインワンで提供できるのが当社の強みです。
また、これらは基本的にPaaSとして提供されています。

ーーAIやビッグデータに関するソリューションは、ここ数年の流れもあり、多数ローンチされています。競合他社との競争優位性はなんですか?
久米村 私たちが競合として認識しているのは、ほとんどが海外の企業です。これらの企業のソリューションは、フルラインナップで導入すると数千万円はかかります。
しかし、当社の場合はこの10分の1の価格で提供できる。ここは圧倒的な差別化要因です。
あとUIをはじめ、ユーザーが使いやすいよう徹底的にシンプルにしたのも特徴です。その1つが「非構造化データ」の取り扱いです。
ビッグデータを用いた分析例などでは、表形式で整えられた構造化データがいきなり出てきますが、一般的に世の中は非構造化データが大半を占めています。
非構造化データを構造化データにする。これがビッグデータを扱う最初のステップになるのです。しかし、データサイエンティストなど専門家ではない人がこれをいきなりやろうとすると、多くの場合つまづいてしまうでしょう。
そこで、当社のソリューションではこのフェーズを自動化技術などを駆使してシンプルにしています。これも他社との圧倒的な違いになります。
原田 技術的には、データを取り込んだ後に外れ値や欠損値の有無を可視化して、あとはユーザーがクリック操作で修正できるようにしています。あと久米村がお伝えしたデータ加工の自動化については特許出願中で、当社のコアの技術の1つになっています。
AIのブラックボックス化を解決する仕組み
原田 他の特徴としては「実験パイプライン」という機能があります。これは、機械学習を用いたデータ分析のプロジェクトでやるべきことを集約して、試行錯誤できます。
またこの実験パイプラインはデータサイエンティストだけでなく、一般的なビジネスパーソンも入ることを想定しています。そのためUIもシンプルにして、コメント機能などを通じてチャットツールを用いた議論できるようにしています。

ーーこの実験パイプラインを用いれば、いわゆる教師データを用いたモデルの作成からそれを用いた本番運用までカバーできるのでしょうか。
原田 可能です。さらに教師データを用いてのモデルの精度向上については、パラメータなどを変更しながら、高速で検証を進める必要があります。これが実現するようにリアルタイム処理を重視するアーキテクチャにしてあります。
また、運用開始後のモデル監視・再学習はリアルタイム性よりも繰り返し処理が重要になるためバッチ処理が得意なアーキテクチャに変換して運用する機能も備えています。他にも、予測ターゲットの値を最大化するためのパラメータの最適な組み合わせを探索する最適化シミュレーションも合わせて実装中で、例えば小売店なら、店舗の売上を最大化するための施策検討に利用可能です。
ーー 一方で、ユーザー操作の負担を減らすということは、データを投入したらAIが勝手に結果を出す「ブラックボックス」のような状況にもなりかねません。このブラックボックス化については、どう対応していますか?
原田 実は画面の下部に、結果の根拠を示せるように試みています。これも特許出願のポイントになっていて、どのパラメータが結果に大きく寄与しているか、本来は専門家が解釈・考察して気付くような観点を、専門家ではない方でも同じ視点に気付けるようにサポートしたいと考えています。
結果に対する根拠を示せるかどうかは、導入を進める上でも大きなポイントです。そこはしっかり対応したいですね。
日本企業でAIの活用が進まない理由
ーーユーザーフレンドリーなソリューションにこだわっているのは、なぜでしょうか?
久米村 起業した背景にも関わるのですが、機械学習を用いたプロジェクトが日本の企業にとって難易度が高すぎるのが大きな理由です。
総務省の調査では、機械学習を活用した予測モデルを構築して運用できているのは、14%ほどしかないという結果が出ています。またあるコンサルティングファームの調査では、そもそも日本においてデジタル人材は就業人口のうちわずか12%ほどしかいないという結果もあります。

つまり、機械学習を用いたプロジェクトはほとんど失敗しているのです。
一方で、私たちのようなスタートアップにとってはここにチャンスがあります。仮に現状が14%なら、これを20%に引き上げるプロダクトをローンチできれば、大きな価値を提供できます。そしてこれが実現すれば、データやAIの“民主化”が果たされるはずです。
現在ローンチされているAIやビッグデータ関連のソリューションはほとんどが海外製です。そのため、日本人が使うことを想定して作れられていません。
しかし、日本のITリテラシーの状況などに鑑みて、日本人が使えるよう日本人が開発しているのが、当社プロダクトのポイントだと認識しています。少なくともExcelを扱えるくらいのリテラシーがあれば使えるプロダクトを提供したいです。
ーーPaaSで提供して、かつ価格も抑えて使いやすければ「スモールスタート」もやりやすいですね。
原田 はい。実際、当社もスモールスタートを前提にサービスを提供しています。いきなり機械学習の本番運用に必要な基盤一式をご契約いただくという形になると、どうしても初期投資が大きくなってしまいます。そうではなく、先ほど説明した1プロジェクト単位でスタートしていただき、順調に運用できれば新たなプロジェクトを立ち上げていただくのが理想です。
そのため、当社のソリューションはライセンス単位で課金していただくのではなく、プロジェクト単位で契約していただいております。
またプロジェクト単位の導入であれば、小売ビジネスを展開している企業さまなどは展開がしやすいのではないかと考えております。店舗の場合、立地などにより来店客数などのパラメーターが異なりますし、そうするとモデルも店舗ごとに構築する必要があります。
しかも、その活用を推進する旗振り役の方ではなく、店舗で働いている方々ができるようになるのが望ましい。店舗ごとにプロジェクトを立ち上げて、順次モデルを展開できるようになれば、費用も推進役の方々の負担も軽減できるのではないでしょうか。
取材・文:山田 雄一朗
*後編に続く(12月23日 午前9時 配信予定)