「No More Tools, Work with Buddy」AIエージェントにより人々の働き方が変わる:AI inside Conference 2024が示した指針
AI inside は2024年10月28日、年次カンファレンス「AI inside Conference 2024」を開催しました。
かつてない速度で進化を続ける生成AI。その可能性は、既存のビジネス常識を超えた革新をもたらす一方で、ハルシネーションや一貫性の欠如といった課題も浮き彫りになっています。本カンファレンスでは、AI inside のCEO渡久地が、最新の取り組みや新たなコンセプトを紹介すると共に、日本における生成AIのさらなる利活用に向けたトークセッションを実施しました。
前編の本稿では、CEO渡久地のプレゼンテーションをレポートします。渡久地は「No More Tools, Work with Buddy」という新たな概念を提唱。AIを単なるツールではなく、ビジネスの信頼できるパートナーとして位置づける新しい協業のあり方を示しました。
473億パラメーターの独自日本語LLMで、サービスは飛躍的に進化中
基調講演の冒頭、渡久地はAI inside が昨年4月に発表した日本語LLM(大規模言語モデル)サービスの「PolySphere-1」から話を始めました。140億パラメーターを持つこの基盤モデルは改良を経て、2024年1月17日には主力サービス「DX Suite」へ実装。これにより、AI inside が従来より強みを持つAI-OCRの処理能力が飛躍的に向上することとなりました。
「DX Suite」における大きな進化は、非定型帳票への対応力の強化です。まず渡久地は、定型と非定型それぞれの帳票処理について解説。2017年のサービス開始時から搭載されている定型帳票処理は、基準となる帳票を一度設定すれば、以降は自動で処理できる仕組み。FAXやスキャンデータであっても、向きや角度を自動調整した読み取りが可能です。
一方で「世の中の書類の約8割を占める」という非定型帳票についても、人手による設定なしで必要な情報を抽出し、一定のフォーマットに変換できます。2019年時点では請求書や給与支払報告書といった13種類に対応していましたが、「PolySphere-1」の実装により、対応プリセット数は1,200種類まで拡大。生成AIが帳票の種類や必要項目を自動判断し、設定から学習まで完全自動で行えるようになったのです。
ここで渡久地はさらに、壇上に置かれたシルバーのエッジデバイス「AI inside Cube」を紹介。AI inside のAI-OCR技術は、クラウドだけでなく、エッジデバイスによるオンプレミスでも提供しています。2018年にローンチした「AI inside Cube」は、毎年約30%ずつ処理能力を向上させており、直近では全文OCRもエッジで運用可能となり、契約書や技術文書といった長文ドキュメントにも対応可能に。
この日のデモンストレーションでは、売買契約書の入力作業を例に、従来の手入力では18分かかる作業が、わずか2秒で完了する様子を披露。並列的に処理が可能なため、複数の文書を同時に処理しても速度は変わらないという特徴を持ちます。
こうした技術の進化により、AI-OCRの利用は着実に拡大。現在までの累計AI処理回数は85億回を超え、非定型帳票の処理数は前年比200%の伸びを記録しています。ユーザ数も6万人を突破し、3,000人以上がユーザコミュニティに参加。日々のフィードバックが製品開発に活かされています。
ここまで、AI inside の現在地点について語った渡久地は、さらに「PolySphere-1」を改善した「PolySphere-2」についても紹介。世界的に知られる各社のAIサービスと性能を比較。特筆すべきこととして、非構造化データの「構造化の精度」が89.86%、ハルシネーションの出現率が0.25%と、際立って優れた成果を発揮したことを取り上げます。
経済産業省による生成AIの開発力強化に向けたプロジェクト「GENIAC」へ採択されたことにも触れ、より一層、生成AIの基盤モデル開発に注力していく意志を表しました。
「Work with Buddy」が示す、新しいAIとの協働
続けて渡久地が示したのは、「No More Tools, Work with Buddy」という新しい概念です。
その意図を「現在のAIはツールとして使われており、人間の能力を1から1.2倍、2倍に引き上げることを目指していますが、それは本来的なAIの姿ではありません。AIを相棒(バディ)として共に働くことで、2倍、3倍、4倍という大きな価値を生み出せるはずです」と語ります。
たとえば、従来のデータ入力作業では、精度を高めるために2名が同じ帳票を入力し、差異を第三者がチェックする「コンペア入力」が一般的でした。これは人間のケアレスミスを防ぐための仕組みです。
2017年、AI inside が「DX Suite」をローンチしAI-OCR市場を切り開いたことで、一人目の手入力をAIで自動化することができました。その後、AI-OCR市場の一部では、二人目もAIで自動化しようとする「ダブルエンジン」という手法が広がりました。しかし、このダブルエンジンは、精度の低いAIに引きずられてしまう問題があり、これではワークしません。
「ダブルエンジンは、人間が作業する前提でケアレスミスをする人間のための仕組みです。AIはケアレスミスをしないので、AIには全く必要ありません。」と渡久地は主張します。
そこで、AI inside は「AIの働きを評価するAIを作り、間違いをチェックすることができ、その精度が高ければ問題ない」という答えを導き出しました。そこで、AI inside は「Critic Intelligence」というテクノロジーを開発しました。「Critic Intelligence」は、AIの働きを評価し、出力結果の間違いを見つけ、ユーザに教えてくれるものです。
「これからはAI-OCR処理後に、「Critic Intelligence」がデータの正確性を検証する。「Critic Intelligence」が教えてくれた間違っている可能性のある箇所だけ、人間がチェックする。これからのAI-OCRは、こうあるべきです。」と渡久地は提案しました。
新しい概念の実装にあたって、AI inside では従来のツール的なインターフェースからの脱却を図りました。渡久地は、「DX Suite」AIエージェント搭載の開発過程で検討された複数のボツ案を公開。設定項目の多いツール的なUIから、AIが常駐する「バディ」として進化していく過程を示しました。
最終的に採用されたインターフェースでは、ユーザは自分専用のAIに名前を付け、バディとして存在します。デモでは、渡久地自身が「Vicky(ビッキー)」と名付けたAIが、必要な作業を提案し、ユーザの承認のもとで処理を実行。人間は最終確認だけを行うという、新しい人とAIの協働スタイルが示されました。
これが、バディとともに働く「 Work with Buddy」の世界観です。「これは2017年の「DX Suite」に始まって以来、最も大きな変化です。「No More Tools, Work with Buddy」の考え方は世界的に見ても類を見ない取り組みかもしれませんが、我々はこれこそが正しい未来だと確信しています」と渡久地は力を込め、基調講演を締めくくりました。
新機能である「DX Suite」のAIエージェントは、アーリーアクセス(早期評価版)として受付を開始。2025年以降の実装を目指して開発中です。
ーーー後編に続くーーー
・・・・
(文・長谷川賢人)