あらゆる文書のデータ化を効率化する“次世代AI OCR”の魅力とは?
最終更新日:2023/04/06
<a href = "https://digi-mado.jp/article/49801/" class = "digimado-widget" data-id = "49801" data-post-type = "post" data-home-url = "https://digi-mado.jp" target = "_blank"></a>
<script src = "https://digi-mado.jp/wp-content/themes/digi-mado/js/iframe-widget.js"></script>
『デジタル化の窓口』は、この国のデジタル課題「2025年の崖」に備えるため2022年にサービスをスタートしました。1,500以上のIT製品、4,000以上の導入事例を掲載し、特長・選び方を分かりやすく整理して解説することで、自社に最適な製品・サービスを見つけるお手伝いをする紹介サービスです。
目次
昨今のデジタル化や働き方改革に加えて、電帳法改正やインボイス制度などの観点からも注目を集めているOCR(Optical Character Recognition/Reader:光学文字認識)関連のソリューション。近年では、AI技術を導入することで手書き文字でも高い精度で認識できる「AI OCR」も登場し、その活用の幅をさらに広げている。このような状況のなかで、長年にわたってAI OCRのサービスを提供しているCogent Labs(コージェントラボ)は、“次世代AI OCR”をうたう新しいソリューション「SmartRead」で、文書のデータ化にまつわるさまざまな課題解決にひと役買っている。
作業時間を約75%も削減し、テキスト情報も付加できる
OCRを利用する大きなメリットとして挙げられるのが、紙の帳票や画像化された帳票などのデータ入力業務にかかる「時間とコストの削減」である。そもそも、帳票が発生する業種は多岐にわたり、例えば金融機関では口座振替の依頼書や住宅ローンの申込書、製造業ではFAXで届く注文書や現場のチェックリストなどが挙げられる。そして、これらの帳票を人力でExcel等に手入力する場合にはかなりの労力と人件費がかかるため、「帳票を効率的にデータ化したいというニーズは幅広くある」と、Cogent Labs 営業本部インサイドセールス部長の上森啓右氏は言う。
このようなニーズに対して、独自開発のAIエンジンを採用したSmartReadは、文書の種類を自動で判別・仕分けしたうえで、さまざまな活字や手書き文字を高精度で読み取ることが可能。ある事例では、人が紙の帳票を見ながらExcelに手入力した際の作業時間と比較して、SmartReadを導入したことで「約75%の作業時間を削減できた」という。
また、帳票以外のアナログ文書にSmartReadが利用される事例もある。例えば、製造業の研究開発部門などでは、これまでに蓄積されてきた研究資料が、紙の文書のままで膨大に残っているケースは少なくない。しかも、そのままの状態では「なかなか活用しづらい」という課題もある。そこで、これらの紙文書をPDFとしてスキャンし、そのPDFをSmartReadで処理することで、手書きも含めたすべての文字に透明のテキスト情報を付加したPDFとして作成すること可能。これにより、文書の内容もキーワード検索の対象に含めることができるため、「見つけたい情報を瞬時に見つけられるという点で、大きなメリットとなる」と上森氏は説明する。
そのほかにも、SmartReadは手書き文字の認識だけでなく、レ点や〇などで記入する選択肢の判別も可能なことから、「イベント会場などで集めたアンケートやキャンペーンの応募で届いたハガキなどのデータ化にも活用されている」とのこと。近い将来、「紙のデータ入力はなくなる」という予測もあるが、上森氏は「もちろん今後は減っていくとは思うが、ゼロにはならない」と考えており、依然として残るデータ入力の作業などはOCRに任せ、「より重要なところに大切な人的リソースを使っていくべきだ」と提案する。
手書き文字でも認識精度は99.2%、新機能でベリファイも効率化する
このように、さまざまなケースで活用されているSmartReadだが、その特徴の1つとして挙げられるのが「認識精度の高さ」である。上森氏いわく、帳票の種類や書かれている文字の状態にもよるが、1つのベンチマークとしてその認識精度は「99.2%」とのこと。大きく崩れた手書き文字であってもこれだけの高い精度を期待できるという。
また、独自開発のAIが文字認識に利用されているのはもちろんだが、例えば「帳票の中にどこに文字が書かれているかを認識する部分にも、別のAIが使われている」と上森氏は解説。多彩な機能のAIが複数搭載されて1つのソリューションに仕上がっていることから、「それらAIの掛け算が精度に関連してくる」と補足する。さらに、帳票自体のレイアウトを「どれだけ学習させるか」なども精度に影響してくるため、AIの学習は「現在進行形で続いている」そうだ。
ただ、上森氏は「OCRは認識精度が高いだけでは良い製品とは言えない」とも指摘する。なぜならOCRでは、文字認識させた後の結果をチェック・修正する「ベリファイ」という工程が不可避だが、「出来ればベリファイも簡単に済ませたい」という声がいくつもあがっているからだ。
すでに述べたように、OCRは帳票などのデータ化だけでも大きな労力やコストの削減につながるメリットがある。しかし、認識精度が高いと言っても100%を保証することは現実的に不可能なため、ベリファイはどうしても欠かすことのできない作業であり、当然そこにも労力やコストはかかってしまう。そのため、ユーザーとしてはこのベリファイも効率化したいわけである。そこでSmartReadは、このベリファイの作業を効率化する新機能として「スマートベリファイ」を2022年12月に追加した。
スマートベリファイは、確信度が一定のしきい値を超えているとAIが判断した読み取り項目については「チェックなしで確認済みに出来る」という機能。これにより、ユーザーは確信度が低い項目だけをチェックすれば済むようになっている。さらに、チェックの流れも効率化されており、従来はマウスを使って自分でチェックする項目を選ぶ必要があったが、スマートベリファイではエンターキーだけで操作できるようになった。このように、ベリファイの作業をよりスムーズかつ効率的に進められるという点も、SmartReadの大きな特徴となる。
実際の使い勝手を見せることで魅力をきちんと理解してもらう
さらに上森氏は、営業の立場から「いかに自社の製品が優れており、しかも使いやすいのか。それをユーザー様にきちんと理解してもらうことを意識している」とのこと。例えば、言葉だけで「認識精度が非常に高い」と伝えても、顧客に十分なインパクトを与えることはなかなか難しいが、実際に製品を見てもらうとイメージがわきやすいことから、商談の際には製品のデモンストレーションをほぼ100%実施。実際の使い勝手などを見せることで、「正しく理解してもらうように努めている」と語った。
また、製品の良さを伝えるには「やはり人と人によるコミュニケーションは必要になる」とも付け足す。ただ、これは必ずしも対面である必要はなく「Web対応でもOK」と考えており、コロナ禍でもWeb対応で「滞りなく顧客に製品を紹介できている」と感じているそうだ。そのほか、上森氏は自社で開催している無料のオンラインセミナーの講師も務めており、多彩な内容でOCRや自社製品の魅力を伝えるとともに、その認知度アップにも努めている。
SmartReadについては、インボイス制度にも対応した請求書自動読み取りの新機能が加わるなど、今後もまだまだ進化していく予定。製品が進化していけばいくほど、「それを提案できるターゲットやマーケットはより広がっていくはず」と上森氏は自信を見せる。さらに、現状に満足して足をとどめることなく、さらなる進化を続けていくことが「自分の役割だ」と力強く語った。
SmartRead
<a href = "https://digi-mado.jp/article/49801/" class = "digimado-widget" data-id = "49801" data-post-type = "post" data-home-url = "https://digi-mado.jp" target = "_blank"></a>
<script src = "https://digi-mado.jp/wp-content/themes/digi-mado/js/iframe-widget.js"></script>
おすすめ比較一覧から、
最適な製品をみつける
カテゴリーから、IT製品の比較検索ができます。
1784件の製品から、ソフトウェア・ビジネスツール・クラウドサービス・SaaSなどをご紹介します。