見出し画像

「どんな帳票でも読み取れる」時代へ。非定型帳票1,000種類をわずか2ヵ月半で実装したAI-OCRの新次元

AI inside が提供するAI-OCRサービス「DX Suite」は大型アップデートを実施し、これまで読み取ることが難しかった「非定型帳票」のデジタル化を強化しました。非定型帳票とは、請求書や健康診断書、設計図面など発行元によってフォーマットが異なり、あらゆるビジネスシーンでやりとりがなされているものです。

従来のAI-OCRでは、非定型帳票を読み取るためには多くの帳票データを収集し、膨大な費用と1ヶ月以上の期間を要する規模で学習させ、AIモデルを個別開発する必要がありました。しかし、AI inside はわずか2ヵ月半で非定型帳票1,000種類ものプリセットを開発、「DX Suite」に実装してあらゆる帳票でもデジタルデータ化できる環境を整えました。この驚異的な生産性の源泉は、生成AIの応用とAI inside が持つ約2,800社、5万人に及ぶ幅広い業界のユーザとの対話から生まれた知見にあります。

今回は1,000種類の非定型帳票プリセットを開発するプロジェクトを推進した大鐘幹也に、その過程を振り返ってもらうと共に、もたらすインパクトについて聞きました。

大鐘 幹也  / Mikiya Ogane
Business Group/ Manager of Enterprise Solution Sales Unit
証券会社の営業職として税務コンサルタントなどを10年間務めた後に、会計事務所へ転職。コロナ禍やAIの台頭といった時代の変化を前に、IT業界へ転身を決める。2021年にAI inside へ入社。主にDX Suiteのエンドユーザ向けセールスやパートナーセールスを担当。DX Suiteに非定型帳票のプリセットを1,000種類実装する「DXS1000」プロジェクトをオーナーとして先導。

約2,800社のユーザがいるから実現できた非定型読取の革新的な強化


──今回のプロジェクトが立ち上がった経緯から教えてください。

大鐘:DX SuiteはAI-OCR市場シェアNo.1のサービスですが、2024年1月に実施した大型アップデートにより、さらなる進化を遂げました。特に、どんな非定型帳票でも簡単に読み取れるようになった新機能は、これまでのAI-OCRの概念を大きく変革するものです。

そもそも、従来のAI-OCRでは、大量のデータを集めてAIに学習させることで、特定の帳票を読み取れるモデルを開発していました。

ただ、この方式では学習させたい帳票を大量に集めないと精度を上げることができず、学習のための時間や費用も掛かります。よって、どんな帳票でもモデル開発に対応するというわけにはいきませんでした。それでも、顧客からは様々な種類の「非定型帳票を読みたい」というニーズがとても多かったんです。

これらのニーズに応えられるようになったことをユーザのみなさまにすぐに体感してもらうために、「1,000種類の非定型帳票プリセット」を開発するプロジェクトが始まりました。

──どうやってプロジェクトを組み上げていったのでしょうか。

大鐘:ユーザに早く価値を届けることを重視し、私に与えられた期限は「2ヵ月半」。逆算すると1週間ごとに数百個は用意しないと間に合わない状況でした。

期限に間に合わせるために、全社に協力を仰いで部門横断プロジェクトとして進めました。現場で迅速な判断ができるように縦割りの人員配置をして、そこでセールスとエンジニアを組ませるという権限移譲されたフローとしました。また、ミニリーダーのような役割も設け、それらを私が横断的にマネジメントして、日々のKPIや進捗状況を確認していくような形で設計したんです。

「この分野なら誰にも負けない」といった優位性を持った人たちが横断的に一体化できれば、圧倒的なスピード感をもって開発できる。DX Suiteという当社の主力プロダクトを支えている社員が一丸となることで、目標を達成することができました。

──従来では難しかった非定型帳票のプリセットを、なぜAI insideは爆発的に増やせたのですか?

大鐘:当社には2,800社、5万人以上のユーザがいらっしゃいます。普段からどういった帳票を用いているのか、ということには圧倒的な知見があるわけです。「請求書」といった大きなカテゴリーなら想像できても、「製造業に特有の請求書」「保険金の請求書」「商品の売上の請求書」など、業界ごとに違いがあり、より細かなカテゴリーまでは把握しきれない。

「口座振替依頼書」も同様で、預金に対しての口座振替、生命保険料の引き落とし、クレジットカードの引き落とし……といったように、細かく定義していけばいくほど膨大な種類になります。そういった多様な帳票読取に関する課題感が当社には蓄積されているわけです。

加えて、生成AI・LLMの継続した研究開発による技術的進化も大きな要因の一つです。非定型帳票はデザインや記入場所はまちまちでも、帳票に書かれている「項目」は共通しているものが多い。つまり、項目を抽出できれば読めるものが爆発的に増える。それによって必要なデータを全て抜き出し、整理できるようになりました。

帳票のデジタル化はデータ活用の第一歩

──サービス提供が始まっていると思いますが、実際にユーザの反応はどうですか? 

大鐘:「ぜひもっと精度を上げてほしい」と要望をいただいています。ただ、その要望があること自体が、可能性に溢れている証拠かな、と捉えています。実際に、日本企業が抱える非定型帳票を、AI inside のサービスであらゆる処理ができるようになる、というシナリオを描いているユーザもいらっしゃいます。

何よりもサービス提供が始まったことで、非定型帳票の読み取りという、お客様が切望されていた課題解決ができそうな機能拡張ができました。これが最も大きな変化だと思います。弊社でしかできない技術で、お客様の役に立てるということは、営業としてもサービスとしても追い風になっていますね。

基本的な機能として弊社でもプリセットを搭載していますが、ユーザ自身で読み取りたい帳票のプリセットを作ることも可能です。約2,800社、5万人ものユーザがいるので、「プリセット数」でいえば、すぐにでも1万種を超える日が来るかもしれません。

読み取りたい項目を保存するだけですから、プリセットを作ること自体は難しくありません。あとは読み取り精度のチューニングをするだけです。例えば、「請求書番号はTから始まる」というルールをプロンプトで追加指示すれば、次からは「T」をキーにして請求書番号を読み取ることで精度が上がります。

──過去の手書き書類や膨大な紙資料を読み取りたいというニーズもありそうですね。

大鐘:そうですね、過去のデータを読み取りたいというニーズは多いです。現在進行中のプロジェクトでは、過去の蓄積された資料やファイルを読み取りたいというものがあります。1日の処理枚数が7,000〜8,000枚、1年間でとてつもない枚数を処理する案件も出ています。

過去の書類をデータ化し、自社の基幹システムに入れて検索できるようにしたり、過去のナレッジを分析して新しい経営戦略の立案に活かしたりするために、DX Suiteを使うケースも生まれてきていますね。

──従来では諦めざるを得なかった、紙資料という「遺物」をアセットに変え、現在につなぎ、未来へ発展させる。企業にとっても大きなチャンスであり、変化だと感じました。

大鐘:どんな帳票でも読み取れるようにしておくことが、その先のデータ活用への第一歩になりますからね。画像認識AIや予測AIなどの異なるAI技術を掛け合わせれば、売上分析や売上予測などもさらに可能になるでしょう。

BPO業界やSIer業界にとっては、次なる展開のキーアイテムに

──セールスの立場から見て、特に反響が大きそうな業界や、今後狙っていきたい業界はありますか。

大鐘:一つはBPO業界ですね。非定型帳票の読み取りができるようになれば、BPO企業はお客様に対して、さらに営業しやすくなると思います。

たとえば、金融機関では読み取れない非定型帳票を社内で手入力していることもあれば、アウトソーシングしている部分もある。アウトソーシング先のBPO企業からすれば、非定型帳票が新たに読み取れるようになったということは、今まで金融機関内で手入力していた部分まで仕事を取りに行けるチャンスになります。既に非定型帳票の入力作業を受託している場合は、BPO企業の社内プロセスを効率化することに繋がります。

もう一つは、SIer業界ですね。アプリケーションや基幹システムを作っても、非定型帳票の場合はデータ入力のフローはシステム化できず、その部分は全て手作業でやっているケースが多いんです。今までは定型帳票は読み取れても、非定型帳票は諦めざるを得なかった。そこをSIer企業と一緒に進化したAI-OCRで解決していきたいです。

──現場の働き方も変わりそうですね。

大鐘:一つ強調しておきたいのは、弊社はこれらのサービスで人員削減を図る考え方ではなく、「人材をどこまで上手に活用するか」という視点で臨んでいます。人にしかできない業務に集中するためにも、AIを活用してもらう。誰でもできる仕事はAIに任せて、みなさんにはもっと日本の生産性を上げるための働き手として励んでほしいですからね。

(文・写真/長谷川賢人)
・・・・

「DX Suite」に関するお問い合わせはこちら


みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!