見出し画像

「誰もが使えるAI」のために。理論と実践の架け橋となるAI Lab Unitの挑戦とは

AI inside では、誰もが意識することなくAIの恩恵を受けられる豊かな社会を目指しています。これを実現するためには、AIを実証実験ビジネスで終わらせず、プロダクトとしてすぐに使える状態で提供することが重要です。そのために、プロダクト利用者のニーズにあったAIモデルの開発、安定運用のための基盤、そして継続したモデル改善などが求められます。

AI inside の研究開発組織であるAI Lab Unit、中でもそのエンジニアリングチームは、実証実験に留まらずお客様にすぐに使ってもらえる状態のサービスを提供するための社内の架け橋となり、理論と実践の接続に取り組んでいます。AIモデルをビジネスニーズに合わせて開発し、実践へ結びつけようとする彼らの、役割やビジョンについて聞きました。

Charles Melby-Thompson
Development Group/ AI Lab Unit / Tech Lead
アメリカ出身。日本やドイツなどで物理学を研究。AI inside 入社前は物理学者として宇宙や量子力学について研究を続けていたが、「より現実の世界へ具体的な影響を与えたい」と転身。自身の得意分野であったデータ分析などの数学的研究や実践が深層学習モデルと繋がりがあり、物理学で重視するテクニカルな問題を解決するスキルといった知識が活かせると考え、2020年6月にAI inside へ入社。

有本 和俊 / Kazutoshi Arimoto
Development Group/ AI Lab Unit
生物や医療関係の職種に就いていたが、将来的なキャリアを見越し、IT系への転身を志して1年間のリスキリングで数学、統計学、プログラミング知識などを学ぶ。退職後はプログラミングスクールの「AIコース」や「機械学習コース」に進み、7カ月ほど朝から晩まで勉強に没頭。2019年11月にAI inside へ入社。

※内容や肩書・所属は記事公開当時のものです

研究開発とビジネスの「橋渡し」

──AI Lab Unitのエンジニアリングチームについて、ミッションや活動内容を教えてください。

有本:大まかに言うと、開発したAIモデルをどうやって効率的にお客様へ提供し、AIの恩恵を届けられるようにするのか。そのインフラストラクチャーを構築し、デプロイしていく部署になります。

チャールズ:具体的に言いますと、1つ目はAIモデルが正しく動き、スケーリングも可能なシステムを作り上げることです。AIには、「学習」と「運用」の両方の側面があります。これは通常のソフトウェア開発とは異なり、更新されるデータに基づいて成り立っています。そのため、データが変わればモデルも変わる可能性があるので、「正しく動く」ことは重要です。2つ目は提供可能なAI技術の種類を増やすことによって、お客様が抱える幅広い課題に対応すること。そして3つ目はそれら技術の組み合わせを可能にし、業務プロセスに組み込みやすい「ソリューション」を作り出すことです。

私たちは新しいモデルを理解し、それをより優れたものへと調整する方法を探求しています。ビジネスとしてAIを活用するには、実証実験を継続的に行い、そこで終わらせずサービス提供まで持っていくこと。一言で表すならば上記を達成するための研究開発サイドとビジネスサイドにおける「橋渡し」の役割ですね。

──「AIの実用化」を果たすための仕事を任されていると。

有本:他にも、AIモデルの開発・改善にとどまらず、社内からAIのユースケースとなり得るタネを見つけて研究開発の検討フェーズに載せたり、当社で提供している「運用基盤」と連携をしたりと、活動領域は幅広いです。

それゆえに、AIモデルだけでなく、インフラについても理解する必要があります。サービスとして提供しているものを理解するために、ビジネスやデザインチームとの連携も不可欠です。さまざまな部署との協力を通じて、AIモデルを実際のビジネスニーズに合わせて開発し、運用していくことが我々の役割です。

なので、我々は常にいろんな部署と関わりますし、個人的にはAI inside の中でもエキサイティングなユニットだと思っています。

──最近ではどのようなプロジェクトや成果に注力していますか?

チャールズ:将来のニーズに対応するための準備として、「運用基盤」の開発に力を入れています。

優れたAIモデルがあっても、それだけでサービスが成立するわけではありません。複数の要素を組み合わせ、さらにはデータの調整をしながら、AIモデルの推論結果を利用する必要があります。何が重要なのか、どういった掛け合わせをすべきなのか、といった見えづらい要素を検証しなくてはなりません。

私たちはこれらの要素を組み合わせ、API形式で簡単に利用できるインテリジェンス*を開発し、AI運用基盤で実行しています。また、お客様が独自に作成したコンテナやロジックを登録し、簡単に運用できるような機能も実装しています。現在は、社内でこれらのシステムを積極的に利用している状況です。

*人間社会で当たり前に存在し、人と協働しながら価値を発揮することができるAI

究極的に目指す姿は「誰でも使えるAI運用基盤」

──AI inside はAI-OCRにとどまらず様々なAI技術を掛け合わせて価値提供をしようとしていますね。

有本:その通りです。私たちはユーザーオリエンテッドでも、企業オリエンテッドでも、どちらでも構わないくらいに「誰でも使える」というAI運用基盤を、究極的に目指す姿として実現しようとしています。

今はAI inside の第二創業期といえる状況で、すでにAI-OCRサービスだけの会社ではありません。あらゆるサービスや機能を複合的に繋ぎ込むことができます。ビジネスとして個社ごとにカスタマイズして提供する時期もありましたが、やはり当社としても個別対応は非常に負荷が高い。

それならば、運用基盤をドラスティックに変革することで、お客様からの要望や質問が出ないくらいに自走する仕組みを構築できれば、お客様も私たちもよりスピーディにAIの恩恵を受けられるようになります。

私たちの目標は、AIのプラットフォームを日本中、そして世界中に浸透させ、GAFAMのようなインフラベースで、サービスを活用しやすい形で提供していくことです。その中心的な役割を果たしているのが、AI Lab Unitと言ってもいいですね。

──ユーザにすぐ使ってもらえるサービスとして提供するための工夫はありますか?

冒頭でも少しお伝えしましたが、社内でユースケースを探し、研究開発チームが自ら主導してドッグフーディングを行っています。例えば、ミーティング動画の自動文字起こしや同時通訳、要約機能などは社内で既に展開しています。グローバルメンバーの業務のサポートになりますし、自動文字起こし機能を展開してから社内で情報の検索がしやすくなりました。社外展開についても別部署と協力しながら進めているところです。

社内で誰もがこれらのモデルを簡単に学習させたり、推論に利用したりできるようにすることが、次なる大きなステップです。自社開発のワークフローを、自分の仕事に簡単に乗せて活用できれば、さまざまな可能性が開かれるはずです。

「ワークフロー」、AI運用の効率化と柔軟性向上に大きな影響を

──他にも注力されていることがあれば教えてください。

チャールズ:私たちは現在「ワークフロー」という概念を拡大させています。「ワークフロー」は様々なインプットから、前処理・中間処理・後処理などの工程を一個ずつ繋げていき、レゴブロックのように一つの処理を組み上げることができるサービスです。この取り組みは、AI運用の効率化と柔軟性の向上に大きな影響を与えると考えています。

有本:「ワークフロー」を中心としたサービス開発により、人の感覚に合致したAIモデルの利用ができるようになります。例えば、人間はAIに対して「会議の音声を文字に起こして、議事録をつくり、さらに文書として要約して」なんて言いたいものですが(笑)、これらの作業を実行するのは非常に複雑なわけです。しかし、それが本当のニーズであるがゆえに、ビジネスユーザやITベンダーにとっては、マウスを一回クリックするだけで、それが実現できることのほうが大切です。

先ほどの例だと、音声を文字に起こすために適切な音声モデルで認識させ、その認識結果を基にしたテキストが出来て、さらに別のAIに入力されてサマリーを生成し……といったように、コンポーネントをつなぎ合わせて最終的なプロダクトを作らなくてはなりません。さらに、使用するうちに精度が悪ければ、AIの「学習基盤」を使って、AIモデルを自分自身で構成できたほうがいい。

そういったように、「作りたい」と思うシステム自体をお客様目線で簡単に作れて、いかなる環境でも作動させられるようなサービスを構築しようとしているのです。

チャールズ:AI運用基盤の重要な役割は、運用を可能な限り簡単にすることです。お客様は、AIの開発やメンテナンスに多くの時間やリソースを割くことなく、サービスの立案から開始までの時間を短縮することができます。

具体的には、お客様が自由に選んだコンポーネントを簡単に実行し、その結果を迅速に得られるようにしています。また、開発チームがプロダクトの作成に集中できるよう、運用面の複雑さを排除することも目指しています。これにより、ユーザのニーズに迅速に対応し、新しいプロダクトの開発に専念できるようになるのです。

世界的AIサービス企業を「追い越す」存在に

──最後に、AI inside の強みや他社との違いを教えてください。

有本:私が考える当社の強みは、高度なAI-OCR技術と、「AnyData」の概念ですね。

「AnyData」として、データがすでに入りやすい統合基盤が十分に調整されているのは、お客様が使いやすいプラットフォームを作る上では、大きな強みといえます。特にRPAなどの業務フローに組み込む際、頻繁なアップデートやデータの収集・分析が必要になるため、強固な基盤が重要になります。

さらに、当社が保有するGPU計算基盤も重要な強みです。LLMを動かす際も、当社の運用基盤で学習や推論が可能です。

チャールズ:そうですね。まずは、優れたAI-OCRに裏付けされたコンピュータービジョン技術にあります。これをベースにして、信頼性のある既存技術を提供できます。また、多様なモデルをエンドツーエンドで提供してきた豊富な経験もあります。この長年の経験があるからこそ、お客様・パートナーとの信頼関係もありますね。

多くの書類の処理から蓄積されたデータは貴重な「資産」であり、もちろん個人情報をのぞいた形での利用ですが、これを「ワークフロー」のブラッシュアップにも活用できるでしょう。AI inside には多様なシーズが存在していますから、今後はそのシーズをどうやって育てて、大きな木にできるかが腕の見せ所です。

このように、当社が優れたAI-OCR技術を提供し続けて来たことによってお客様・パートナーとの信頼関係があり、その関係の元で貴重なデータが入り、それを活用することによってサービスを継続的に改善しお客様の課題により効果的に対応できるという、好循環が回っています。

さらに、「ワークフロー」そのものをシステムに依頼する形で、自動的に構築できるようにすることも目標です。これは単にLLMへ依頼するだけでは実現できません。やはり自社開発のモデルを作る必要があります。

世界的に知られるAIサービスはいくつかありますが、AI inside は彼らを追いかけるだけの立場だけではありません。どこかでしっかりと「追い越す」存在になれるし、なっていきたいと思っています。

(文・写真/長谷川賢人)
・・・・
お問い合わせはこちら