2024.9.26 |
失敗しないAI-OCR製品の選び方とは?メリットや比較するためのポイントをご紹介
近年、働き方改革や新型コロナウイルス感染症の影響により業務の効率化・DX化に取り組む企業・自治体が増えています。その中でもAI-OCRはRPAと共に利用者が拡大しており、各社から数多くのAI-OCRが販売されています。しかし、機能や価格、利用形態の幅が広く、どのように選べばいいか疑問に思っている方もいらっしゃるのではないでしょうか。
そんな方のために、OCRとAI-OCRとの違い、AI-OCRのメリットと効果、そしてAI-OCR製品を選ぶ際のポイントについてまとめました。自社に合ったAI-OCR製品を選ぶため、ぜひ参考にしていただけますと幸いです。
1. AI-OCRとは
最初にOCRとAI-OCRの違いについて簡単に説明します。
1-1. そもそもOCRとは
OCR(Optical Character Recognition: 光学的文字認識)は、イメージデータ(画像データ)やPDFから文字を抽出・認識し、テキストデータに変換する技術です。OCRを使うと、これまで人が行っていた紙帳票のデータ入力作業を自動で行うことができ、転記作業を短時間で大量に行うことが可能になります。またコンピュータで処理するため人的ミスが減り、より正確にデータ化され、チェック作業が省力化できる効果もあります。たとえば、支払依頼の申請書など入力ミスが許されない業務では入力結果の確認を2名で行うことが多いのですが、AI-OCRを導入することでチェック作業を1名で行えるようになります。
1-2. AI-OCRとは
AI-OCRは、従来のOCRにAI技術を組み合わせたものです。AI技術を組み合わせることで、たとえば、一度、認識を誤った文字でも、正しい認識結果をAIに学習させることで認識精度を高めることができます。これにより、手書き文字の認識精度がOCRと比べて飛躍的に向上します。
2. AI-OCRのメリット
AI技術によって進化したAI-OCR。ここではAI-OCRのメリット・特長を3点ご紹介します。
2-1. データ学習により文字の認識精度が改善される
「1-2.AI-OCRとは」でも触れましたが、一番のメリットは認識精度の大幅改善です。 特に手書き文字は人によってクセがありますが、多くの筆跡を認識させ、AIに繰り返し学習させることにより認識精度を向上できます。また、AIにより前後の文字を考慮して認識することも可能です。
次の例は、手書き文字をOCRとAI-OCRで認識した場合の違いを示しています。
「横浜市」の場合、OCRは手書き文字の「横」を「木」と「黄」の2文字として認識してしまいますが、AI-OCRでは前後の文字列や手書き文字の区切りを正しく判断するように学習させているので「横」と正しく認識します。
2-2. 非定型帳票も読み取りできる
これまでは帳票のフォーマットごとに、どのエリアを読み取るか、どのような種類の文字を読み取るか(例:住所、電話番号)など、事前に定義が必要な定型帳票に対応した製品がほとんどでした。
しかし、AI技術の活用により、フォーマットが異なる非定型帳票でも、事前の設定なしに読み取ることができる製品も増えてきました。AIが読み取る項目や位置を自動的に判断し文字認識してくれるため、これまでかかっていた帳票ごとにOCR定義を準備して、分けて読み取る手間や労力を削減できます。
2-3. RPAや外部システムとの連携で、定常業務の自動化が進む
AI-OCRをRPA(Robotic Process Automation)と連携すると、さらに業務の自動化を進めることができます。
RPAとは、これまで人が行っていた作業を自動的に行う技術のことです。人がパソコン画面で行っていた作業手順をシナリオとして記憶し、それにしたがって自動で正確に作業します。
RPAとAI-OCRを連携することで、AI-OCRで紙帳票の文字列をテキストデータ化し、抽出されたテキストデータをRPAがシステムに入力するといった、作業の自動化を実現できます。これにより、繁忙期の業務量の増加に対応できたり、時間外労働や外注コストを減らせたりという効果が期待できます。
3. AI-OCRは本当に効果があるの?
「AI-OCRでも100%認識できるわけじゃないの?」「結局、人の目でチェックが必要なら導入効果はないのでは?」という疑問をお持ちの方もいらっしゃると思います。
データを手入力している場合、どうしても入力モレや打ち間違いが起こります。その入力確認もまた入念に行う必要があり人手と時間がかかります。
AI-OCRを利用しても文字を完全に正しく認識することはできません。しかし、文字の認識・入力作業をAI-OCRが代行してくれるので、人によるチェック・修正が必要だとしても手入力時と比べると手間が軽減され、ミスの削減にもつながります。
AI-OCRの導入で大切なことは「導入すると入力業務を100%任せられる」「OCR結果が100%じゃないと効果が出ない」という意識を変えることです。
入力業務を任せっきりにすることができなくても、AI-OCRの特長を理解し、導入効果が出る業務・帳票を探して適切に導入すれば大きな導入効果を得ることができます。
ここでAI-OCRを活用した事例として、石川県かほく市様の事例をご紹介します。
かほく市の健康福祉課では、乳幼児健診問診票、任意予防接種申請書のデータ入力にAI-OCRソフトウェアを活用し、業務効率化を行いました。
「RICOH fi Series」のスキャナーで問診票や申請書をスキャンし、AI-OCRで文字認識することにより、これまで手入力で行っていたデータ入力作業が不要になり、職員2人で行っていた入力確認も入力者の自己確認+職員1人で対応できるようになりました。
これにより、認識結果の確認作業を含めても、帳票データ入力にかかった時間は年間2916時間から1164時間と、60%削減を実現しました。
人件費を試算するとAI-OCR導入前は580万円だったところが、導入後は230万円となり5年分のライセンス費用を考慮しても1年間で採算がとれる計算となります。
おおよその目安ですが、月に2000~3000枚の帳票のデータ入力作業であれば、手入力と比べると十分にAI-OCRの導入効果を得られます。
なお、かほく市様の事例の詳細については、「改善に対する職員の意識を変え「日本一紙の少ない自治体」を目指して」をご覧ください。
AI-OCRの導入を検討するときは、自社の業務・帳票を見直し、AI-OCRを利用して何をどのように自動化するのかを考え、読み取りたい帳票に合ったAI-OCRを導入することが大切です。
4. AI-OCR製品の比較ポイント7つ
ひとえにAI-OCRといっても、検索すると様々な製品がヒットし、どれを選んだらよいかわからないという方も多いのではないでしょうか。
ここでは、AI-OCR製品を手掛けるPFUが、AI-OCR製品を選ぶ際の比較ポイントを7つご紹介します。
- 使用している帳票フォーマットに対応しているか
- 認識させたい文字が認識できるか
- 事前定義が簡単にできるか
- セキュリティ要件をクリアしているか
- 読み取る項目数・読み取り枚数はどれくらいか
- RPAや外部システムに連携可能なデータで出力できるか
- サポートが充実しているか
順番に説明していきます。
4-1. 使用している帳票フォーマットに対応しているか
AI-OCRで認識可能な帳票は、大きく分けて次の3種類です。認識させたい帳票がどのタイプなのかチェックしましょう。
- 定型帳票
自社で発行するなど、フォーマットが決まっている帳票(申請書、申込書、アンケートなどが多い) - 準定型帳票
項目は共通しているが取引先により記載位置が変わるなど、フォーマットが定まっていない帳票(請求書、納品書、注文書などが多い) - 非定型帳票
項目や記載位置に規則性がなく、フォーマットが定まっていない帳票(契約書、図面などが多い)
定型帳票のみに対応している製品もあれば、複数の帳票タイプに対応している製品もあります。
認識したい帳票のタイプをチェックし、その帳票に対応している製品を選びましょう。
定型帳票を認識できるだけじゃ不十分?
製品の中には、定型帳票にだけ対応している製品があります。だからといって、性能が不十分というわけではありません。
非定型帳票を認識できる方が便利な場面もありますが、ビジネスで使う帳票は、形式や記載する項目が決まっているものがほとんどです。
また、準定型帳票を認識する場合、AI-OCRが「合計金額」などのキーワードを探し、その付近にある文字を認識します。それに対して定型帳票を認識する場合は、帳票のどのエリアの文字を読み取るか事前に定義するため、AI-OCRが認識対象の文字を探し出す必要はありません。そのため、定型帳票の認識のほうが、処理スピードが速くなることが多いです。
認識する帳票の枚数が多い場合は、類似したフォーマットを定型帳票になるように見直すなどして、定型帳票として認識させたほうが、より大きな導入効果が期待できます。
4-2. 認識させたい文字が認識できるか
製品によって認識できる文字が異なるため、認識させたい文字が手書き文字なのか、活字(印字)なのかをチェックし、それに対応している製品を選びましょう。
その際、AI-OCRが手書き文字・活字文字のどちらに対して力を発揮するのかも、併せて確認してください。
たとえば認識させたい文字が活字(印字)だけであれば、活字は手書き文字に比べてクセが出にくいので、AI技術を使用しないOCRでも十分に必要な作業を行えるということもあります。
ここをチェック!
- 手書き文字が認識できるか
- 活字(印字)が認識できるか
- バーコードやチェックマークが認識できるか
4-3. 事前定義が簡単にできるか
特に定型帳票を認識させる場合は、運用時の認識精度や処理スピードを向上させるため、帳票の「どのエリアにある」「どのような文字を認識させるのか」といった事前定義が必要なものが多くあります。
製品導入時はベンダーの担当者が事前定義を行ってくれるケースもありますが、導入後に認識対象の帳票を追加していく場合などは、自社内で対処する必要があります。
デジタル化を加速させるためにも、自社内で事前定義できるように、定義は簡単か、画面は直感的に操作できるかなどについても確認しておくと安心です。
4-4. セキュリティ要件をクリアしているか
AI-OCRを比較する場合、機能面や操作性に目がいきがちですが、セキュリティ要件も重要なポイントになります。
AI-OCR製品には、オンプレミス環境(自社サーバ・自社ネットワーク内)で処理を行うものと、クラウドサーバ上で処理を行うものがあります。
クラウドサーバ上で処理を行う製品の場合、情報漏洩の心配がないか、自社・取引先のセキュリティ要件をクリアしているかチェックしておきましょう。
機微な情報を取り扱っていたり、なるべくオプションなどつけずにセキュリティ要件をクリアしたりする場合は、自社サーバ内にインストールして運用するオンプレミス型の製品を選ぶと安心でしょう。
また、官公庁や自治体で導入する場合も、オンプレミス型の製品を選ぶとLGWAN(総合行政ネットワーク)で利用できるので良いでしょう。
オンプレミス型はクラウドサーバ上で処理を行う製品と比較して、クラウドへのアップロードが不要、かつ処理結果を即時に確認できることから、手を止めることなく作業できます。
4-5. 読み取る項目数・読み取り枚数はどれくらいか
AI-OCR製品の場合、読み取る項目数・読み取り枚数によって、「サブスクリプション型」が適しているか「買取型」が適しているかが変わります。
- 毎月の読み取り枚数が少ない・月によってバラつきがある場合
比較的、低コストで始められる「サブスクリプション型」がおすすめ。
ただし、従量課金制のように、読み取る項目数・文字数・枚数によって細かな料金設定があり、追加費用が発生することがあるため注意が必要です。 -
読み取る項目数や読み取り枚数が多い場合
項目数や枚数に制限がなく、予算化もしやすい「買取型」がおすすめ。
共有マシンにインストールしておけば、複数人・複数部署での利用が可能な製品もあります。
また、帳票の枚数が多い場合は、高速で読み取りできるスキャナー専用機を利用すると、さらに作業効率がアップします。
PFUの業務用イメージスキャナー「fiシリーズ」は、最高毎分140枚のスピードで紙詰まりなく安定したスキャンが可能です。くっきり読みやすい文字とノイズのないクリアな画像を出力し、正確な文字データの抽出を可能にします。デモ機の無料貸し出しサービスも実施しておりますので、この機会にAI-OCRと共にスキャナー専用機の導入もご検討ください。
4-6. RPAや外部システムに連携可能なデータで出力できるか
RPAや外部システムでデータ処理を行う場合、前段階の作業(デジタルデータ化)を効率化するためにAI-OCRを利用することが多いと思います。
そのため、AI-OCRで認識したデータがRPAや外部システムと連携できるのかをチェックしましょう。
たとえ「連携可能」と明記されていなくても、そうしたシステムに連携可能なデータ(CSV形式のファイル)が出力できれば問題ありません。
4-7. サポートが充実しているか
AI-OCRは導入コストが高額になりがちです。また、帳票によって向き不向きがあったり、利用方法によって押さえておくべきポイントが違ったりと、自社だけで判断するのが難しいことも多くあります。
導入に失敗しないために、導入前のサポートが充実しているか、さらにスムーズな運用のため、導入時にも使い方レクチャーなどのサポートがあるか確認することも必要です。
ここをチェック!
- 体験版やトライアルの有無
…使いやすさ、効果、認識率などを確認できます。
AI-OCR 製品と言っても様々な種類があります。自社での利用目的を整理し、ご紹介した比較ポイントを参考にして目的に合った製品を導入してください。
5. DynaEye 11の特長を、他社製品と比較してご紹介!
PFUでは1997年より業務用OCRソフトウェア「DynaEye」シリーズの販売を行い、自治体・金融をはじめ幅広い業種で累計7,900社以上の導入実績があります。ここでは、PFUのAI-OCRソフトウェア「DynaEye 11」の特長を他社のOCR製品と比較してご紹介します。
比較項目 | DynaEye 11 Entry AI-OCR |
A社 | B社 | C社 | |
---|---|---|---|---|---|
運用環境 | オンプレ型 | オンプレ型・ クラウド型 |
クラウド型 | クラウド型・ オンプレ型 |
|
購入形態 | 買取 | 買取 | サブ スクリプション |
サブ スクリプション |
|
利用料金 | 定額 | 定額(オンプレ)・ 従量課金(クラウド) |
従量課金 | 従量課金 | |
認識対象 | 帳票形式 | 定型・準定型 | 定型 | 定型 | 定型・準定型・ 非定型 |
活字 | ○ | ○ | ○ | ○ | |
バーコード | ○ | ○ | ○ | ||
マーク | ○ | ○ | ○ | ○ | |
手書き (固定ピッチ) |
○ | ○ | ○ | ○ | |
手書き (フリーピッチ) |
○ | ○ | ○ | ||
斜め 記入文字 |
○ | ||||
取消線部分の 除外 |
○ | ○ | ○ | ||
外部連携 | 出力ファイル 形式 |
CSV・TEXT・ ACCESS |
CSV・TEXT | CSV | CSV・EXCEL |
導入前 サポート |
トライアル |
|
|
|
|
製品説明 |
|
|
|||
定義 テンプレート |
すぐに業務で使える テンプレート を用意
|
||||
導入支援 |
|
|
5-1. 枚数制限なく定額で使い放題!
読み取る項目数や枚数によって細かく料金設定されがちなAI-OCR。
DynaEye 11なら項目数や枚数の制限なく使えるため、定型帳票を大量に処理しなければいけない企業・自治体に、特におすすめです。
定額なので予算化しやすく、業務繁忙期に処理量が増える可能性があっても安心です。
5-2. クセのある手書き文字にも対応!
Dynaeye 11の社内での認識精度測定結果は99.2%(*)を記録。
これまで認識が難しいとされてきたクセのある手書き文字にも対応しています。
*: 弊社基準帳票を用いた認識精度結果
フリーの記入欄(フリーピッチ文字枠)に記入された文字や、枠外にはみ出した文字も自動的に追跡して認識します。
5-3. オンプレミス型製品で情報漏洩リスクを低減!
自社サーバ・ネットワーク内で利用できるため、AI-OCR導入による情報漏洩の心配はありません。
また、クラウドにアップロードする手間や時間もかからず、読み取りが完了したページから文字の認識を行い、認識を行いながら平行して認識結果の確認・修正ができます。待ち時間が少ないスムーズな業務を実現できます。
5-4. 運用前の定義がかんたん!
画面上のガイドに従い、どのエリアのどのような情報を認識させるのかをマウスで指定していくだけの直観的な操作で、読み取り項目をかんたんに定義できます。
5-5. 60日間の無料トライアルが可能!
他社製品はトライアルが有料または無料でも試用期間が短い場合が多いですが、DynaEye 11の無償評価版のお試し期間は約2か月間、無料です。
無償評価版でも機能制限なく、製品版と同じように利用できるため、実際に使っている帳票で認識精度や効果を十分に検証し、ご納得いただいた上でご購入いただけます。
また、評価版で作ったOCR定義ファイルは、製品版をご購入後にアクティベーションすればそのまま利用することも可能です。
6. 自社の業務に合ったAI-OCRを選びましょう!(まとめ)
今回はAI-OCR のメリットや比較ポイント、そしてAI-OCR ソフトウェア「DynaEye 11」についてご紹介しました。
AI-OCRを使えば、これまでOCRできないとあきらめてきた紙帳票のデータ入力業務を効率化することができます。定常業務を効率化することが、本来の業務に集中するための環境づくりにもつながります。
しかし、AI-OCR製品と言っても様々な種類があります。自社に合わない製品を導入しても効果は発揮されません。対象帳票に合った製品を導入すれば効果がでますので、自社での利用目的を整理し、ご紹介した比較ポイントを参考にして業務や目的に適した製品を選び、まずはトライアル版などで効果を確認してください。