1. OCR(文字認識)とは?
2024.6.20

OCR(文字認識)とは?
~紙書類からのデータ入力業務を効率化!種類やメリットをわかりやすく解説~

労働人口減少の課題が深刻化していく中、大企業だけではなく、中小企業や自治体においても働き方改革を意識した動きがみられるようになってきました。そのため人材に代わる労働力となるRPAやAIなどに興味を持つ企業が増えてきています。そんな中注目を浴びているのが、OCRの存在です。

この記事では、OCRとは何か、どのような種類があるのか、導入するメリット、今OCRが注目される理由についてわかりやすく解説します。
後半には、OCRを活用した実際の業務改善事例を5つご紹介します。取り組みと効果をご覧いただき、みなさんの業務に適したOCR活用方法を見つけて業務改善にお役立ていただけると幸いです。

1. OCR(文字認識)とは

1-1. OCR(文字認識)とは

OCRとは、「Optical Character Recognition:光学的文字認識」の略称で、紙書類をスキャンして電子化した画像データやPDFから文字を抽出・認識し、テキストデータに変換する技術です。
変換したテキストデータは、文字列検索したり表計算ソフトなどで二次利用したりできます。

OCRのイメージ画像

1-2. OCRの歴史

OCRの歴史は古く、すでに1900年頃から文字認識の技術が世界で開発されています。
海外では1920年代に数字とアルファベットのOCRの特許が出願され、日本では1960年代に郵便番号の自動読み取りを目的に開発が進められました。
当初は専用のハードウェアとして開発され、その後はパソコンで利用するソフトウェアが普及し、最近ではスマートフォンで撮影した画像を直接OCRできるようにもなってきています。
さらに、AI(人工知能)技術を組み合わせたAI-OCRの登場により、従来のOCRでは実現することが難しかった手書き文字の読み取りや非定型文書の読み取りなども可能になりました。

1-3. OCRの種類

OCRソフトウェアは、文字認識する対象によって大きく2つに分類されます。

OCRの種類
1) 一般文書向けOCR(全文OCR)

形式が決まっていない紙の書類や文書を対象とするOCRです。
スキャナーやスマートフォンで読み取った書類(画像データ)の、すべてまたは一部の文字を認識して検索可能なPDFに変換したりテキストデータ化したりすることで、キーワードによる検索や引用、翻訳が可能になり文書を活用しやすくなります。

2) 帳票OCR

申請書、注文書、アンケートといった紙の帳票を対象とするOCRです。
帳票をスキャナーなどで読み取り、手書き文字や活字文字を項目ごとにテキストデータ化し、データ化した情報は、表計算ソフトや業務システムなどで利用できます。

帳票OCRには、フォーマットが決まっている帳票に事前に読み取る範囲や項目の種類(住所や電話番号)などを設定する「定型帳票」に対応したものと、フォーマットが定まっていない準定型帳票(項目が共通で記載位置が変わるようなフォーマット)や非定型帳票(項目・記載位置に規則性がないフォーマット)に対応したものがあります。
また一部のスキャナーでは標準機能として定型帳票の特定の部分だけを簡単に認識できるゾーンOCR機能を備えているものもあります。
認識した情報を使って、ファイル名を自動生成することもできます。

また、文字認識する対象物の特徴に合わせた以下のようなOCRソフトウェアもあります。

  • 名刺OCR
  • 運転免許証OCR
  • 保険証OCR
  • レシートOCR

たとえば、運転免許証用のOCRであれば、運転免許証特有の記載形式に対応したり、住所辞書や氏名辞書を活用したりしてOCR認識の補正処理を行います。これにより、運転免許証に特化した高度なOCR認識ができます。

運転免許証用OCRの使用例

OCRソフトウェアの例

PFUでは、以下のOCRソフトウェアを販売しています。

1-4. OCRの提供形態はさまざま

OCRの提供形態は大きく分けると、以下の2つがあります。

  • パソコンやスマートフォンにインストールして利用する「オンプレミス型」
  • インストールせずにインターネット上で提供されている外部サーバーを利用する「クラウド型」

以前はオンプレミス型のパソコン用OCRソフトを購入するのが一般的でしたが、現在はインターネットから利用できるOCRサービスやOCR機能を備えたスマートフォン用のアプリなども多くなっています。

「オンプレミス型」と「クラウド型」の違いやそれぞれの利用場面については、次の記事で詳しく説明しています。

1-5. OCRを利用する際に必要な機器

OCRを利用するためには、基本的には認識結果を保存するパソコンと、紙書類を電子化するためのスキャナーや日付などの文字列を読み取るハンディスキャナーなどの専用ハードウェアが必要です。スキャナーやハンディスキャナーはいろいろな種類があるので業務に合ったものを使用します。
また、最近はスマートフォンのカメラで撮影した画像を使用できるOCRアプリもあります。この場合はパソコンや専用ハードウェアは必要ありません。

2. OCRを導入するメリット

いろいろなOCRがあることが理解できたと思いますので、次にOCRを導入するメリットについてみていきましょう。

OCRのメリットのイメージ画像

2-1. 大量の紙帳票からのデータ入力時間を短縮

請求書や納品書などの帳票類は、まだまだ紙で運用されています。そのため、帳票に記載されている情報をシステムやソフトウェアに入力する場合、人が目視で確認しながら手作業で入力(データ化)する必要があり、この作業に多くの時間と労力を割いているのではないでしょうか。

OCRを利用すると、必要な情報を自動で抽出できるため、手作業で行っていたデータ入力作業が大幅に削減され作業時間の短縮につながります。この効果は、入力する紙帳票の量が多いほど大きくなります。

2-2. 人件費を削減し、業務品質を向上

紙書類の情報を手作業でデータ化していると、入力作業が集中する繁忙期などは残業したり、他部署に応援を依頼したり、外部に作業を依頼したりして対応することがあります。
OCRを利用するとデータ入力作業の時間と手間を削減できるため、残業時間や他部署からの応援人数を減らすことができます。後述する2つのメリットを含め、人件費の削減につながります。

また、削減によって生まれた時間は、これまで残業して対応したりあきらめたりしていた生産性のある仕事に割り振れるようになります。その結果、組織としての生産性向上や業務品質の向上が見込めます。

2-3. データ化の精度向上とチェック時間の短縮

手作業でデータ入力していると、疲労などにより集中力が低下し、誤入力・見落としなどのケアレスミスが発生します。OCRを活用すれば、人的ミスを大幅に削減することができ、データ化の精度が向上します。
OCRによる文字認識は100%ではないので入力結果の確認は必要になりますが、ケアレスミスを発見するために行っていた目視によるダブルチェックが不要になり、チェック時間を短縮できます。

2-4. 検索性の向上

大量の紙書類の中から必要な情報を探すのは大変な労力が必要ですが、紙書類の情報をデータ化するとパソコンで検索できるようになり、必要な情報へのアクセスが容易になります。

2-5. データの共有・活用が容易

紙書類を複数人で同時に参照するのは難しいですが、データ化された情報は複数人で共有しやすく、データを加工して流用することもできるので作業効率がアップします。

3. OCRが注目される理由

OCRはこれまでも多くの企業で導入されてきましたが、近年、ペーパーレス化やDXへの対応が求められる中、改めて注目が集まっています。ここでは、今OCRが注目されている理由について解説します。

3-1. 生産性向上の必要性

近年、労働人口(生産年齢人口)の減少が社会的に課題となっています。内閣府(税制調査会)が公表した「わが国税制の現状と課題―令和時代の構造変化と税制のあり方―」によると、15歳から64歳までの生産年齢人口は平成7(1995)年をピークに、総人口に占める割合(生産年齢人口割合)は低下し続け、令和4(2022)年では 59.4%になっていると記載されています。
このような生産年齢人口の減少により人手不足が進む中で生産力を維持/向上するためには、生産性を高めていくことが必要です。

この課題の解決策として、人間がするべき仕事とロボットなどの機械にさせる仕事の分業が始まっており、「仕事」ではなく「作業」となるものは、すべてロボットによる自動化という時代の流れになっています。
そうした作業の自動化を実現していくために必要不可欠な存在がAIの発展でありRPAの出現なのです。このRPAが扱うためのデータとして、OCRの利用が注目されてきています。

OCRが注目される理由

3-2. AIの発展

AIの発展によりOCRにAI技術を組み合わせることで大量の文字データを学習させ、飛躍的に認識精度を高めることができるようになりました(AI-OCR)。これにより、従来はうまく認識できなかった手書き文字の認識精度が向上しました。これもOCRの需要を高めた一因といえるでしょう。

次の記事では、「AI-OCRって何?」「AI-OCRは本当に効果があるの?」という疑問や、導入を検討する際の製品選びに役立つ7つの比較ポイントについて解説しています。

3-3. RPAのひろがり

RPAとは、「Robotic Process Automation」の略称で、パソコンの画面上で行っていたオフィスの定型業務やルーチンワークなどを自動化するためのソフトウェア技術のことです。
このRPAの出現により、さまざまな企業で人が行っていた定型業務を自動化できるようになりました。
たとえば、申請書などの紙帳票を業務システムに入力する業務の場合、OCRで紙の情報をデータ化し、業務システムへの入力作業や集計作業をRPAで自動化できます。
このようにRPAで業務システムへのデータ入力などを自動化する際にOCRの存在が重要となり、その需要が高まってきたと考えられます。

RPAとの連携イメージ

4. OCRの活用事例と効果

ここからはOCRを活用して業務改善した5つの事例をご紹介します。OCRの活用パターンはいろいろありますので、みなさんの業務課題に適した事例を見つけて参考にしてください。

4-1. ゾーンOCRで製品コードや受注No.をファイル名として自動付与【三井金属鉱業株式会社様】

三井金属鉱業株式会社様では、スキャン後に手作業で行っていたファイル名の付け直し作業を、スキャナーの標準機能であるゾーンOCR機能を使って自動付与し、事務担当者の手間を削減されました。

背景・課題
  • 製造過程で発生する「中間検査表」などを現場で閲覧しやすいように複合機でスキャンしてデータ化していた。
  • ファイル名は、原本を見ながら手作業で付け直していた。数字が並ぶ長い文字列の入力は手間になっていた。
  • ファイル名に製品コードや受注No.を含めるため、入力ミスの修正にも時間がかかっていた。
取り組み
  • PFUのA4 高速スキャナー「fi-8170」でのスキャンに変更。
  • 標準添付ソフトウェアPaperStream CaptureのゾーンOCR機能(特定の部分だけ認識する機能)を使用して書類の「製品コード」や「受注No.」をファイル名に自動で設定。
効果 PaperStream Captureの自動仕分け機能の利用、場所を移動せずにスキャンできるようになったことを含めると、スキャン作業とイメージデータ保存に要する時間が75パーセント削減された。
詳細

4-2. 「検索可能なPDF」化で共有と検索が楽になり、一時保管スペースが大幅に縮小【横浜環境保全株式会社様】

横浜環境保全株式会社様では、産廃マニフェスト(産業廃棄物管理票)の管理と契約書の電子化にスキャナーを使用し、検索可能なPDFで保存することで検索作業の効率化を実現されました。
また、社内伝票の入力にスキャナーと業務用OCRソフトウェアを導入し、17名で手分けして行っていた専用システムへの入力作業の大幅な効率化にも成功されています。

背景・課題
  • 毎日大量に発生する産廃マニフェスト(カーボン複写式伝票)に事務所のスペースが圧迫されている。
  • 過去の伝票確認時は、閉じたファイルから手作業で探し出している。
  • 産廃マニフェストは本社まで車で届けるため、1日のタイムラグが発生。
  • 社内伝票と契約書のシステムへの入力に多大な時間を要し、連日の時間外勤務が発生している。
取り組み
  • PFUのA4高速スキャナー「fi-7160」で産廃マニフェストを電子化。標準添付ソフト「PaperStream Capture」のOCR機能で「検索可能なPDF」に。
  • 業務用OCRソフトウェア「DynaEye」を導入し、産廃マニフェスト・社内伝票・契約書の電子化やOCRを開始。
効果
  • 産廃マニフェストの電子化により記録・閲覧が楽になり一時保管スペースが1/3に縮小。本社ともタイムラグなく共有可能。
  • 書類の電子化とOCRによって手間のかかる事務作業が大幅に効率化し、社内伝票で2,700時間、契約書で1,700時間を削減。
詳細

4-3. 大量の活字/手書きの申請書/請求書からのデータ抽出・確認時間を大幅に短縮【七尾市 健康福祉部 健康推進課様】

七尾市役所様では、OCRの利用により、手書き文字(数字)が含まれるアンケート用紙のデータ入力時間を1/6に短縮することに成功されました。

背景・課題 毎月実施している「健やか親子21アンケート」の回答を集計するために、回答を1枚ずつ手作業でExcelに転記(データ入力)しており、時間と手間がかかっていた。
取り組み
  • PFUのA3高速スキャナー「fi-7480」と業務用OCRソフトウェア「DynaEye」を導入し、回答のデータ入力業務を自動化。
  • OCRで認識しやすいように乳幼児健診時の「健やか親子21アンケート」(定型帳票)の形式を、該当する項目にマルをつける形式からチェックボックスで回答する形に変更。
効果
  • 1か月分のアンケートの回答のデータ入力にかかる時間が1/6に短縮。
  • 空いた時間で個別相談の対応時間を増やすなど、本来の保健師業務に集中できるように。
詳細

4-4. RPAツールとの連携で払出請求書の処理を自動化し、人の作業を最小化【朝日生命保険相互会社様】

朝日生命保険相互会社様では多様な保険・金融サービスに付随する膨大な事務を効率化するために、RPAを積極的に取り入れて効果を上げられています。その中で、「一般財形貯蓄の払出請求書」は手書き文字があり、かつ、帳票はお客様独自の書式である準定型帳票であることが多いため、「この欄の文字をここに入力」といった指示を登録しRPAと連携して処理されています。

背景・課題 月400通が郵送で届き、随時送金処理が必要な「一般財形貯蓄の払出請求書」の請求内容をシステムに手入力するため、担当部署では毎日、午前中に時間を割いて対応していた。
取り組み RPAツール導入をきっかけに、AI-OCRとPFUのスキャナー「fi-7800」を連携させて入力作業を自動化する仕組みを構築。
効果
  • 年間約300時間の入力作業が削減され、チェックも楽になった。
  • 特に件数の多い日の効果が大きく、時間外労働が減る、他の業務にも余裕を持って当たれるといった好循環が生まれた。
詳細

4-5. 手書き文字をAI-OCRでテキスト抽出してシステムに連携し、入力までを自動化【株式会社北國フィナンシャルホールディングス様】

株式会社北國フィナンシャルホールディングス様では、手書き文字が多い口座振替依頼書をスキャンしてAI-OCRでテキスト抽出して自動入力するシステムを開発し、登録業務の効率化を実現されています。

背景・課題
  • 旧来システムでの登録業務ではオペレーターによる手入力が必要だった。
  • 旧来システムの更新時期を迎えたが抜本的に効率化するにはコストがかかる。
取り組み 口座振替依頼書をコンパクトスキャナー「fi-7460」でスキャンし、AI-OCRソフトウェア「DynaEye 11」で文字をテキスト抽出し、入力までを自動で行う「口座振替依頼書登録システム」を自社開発。
効果 従来の手入力作業がなくなり、25%の作業量削減、30%の作業時間短縮が実現したほか、ランニングコストも低減。
詳細

5. まとめ

今回は、業務改善・生産性の向上には欠かせないOCRについてご紹介してきました。OCRは、ここ数年で多くの技術改良がされており、手書き文字でも文字認識をするほど性能を上げています。そのため、RPAなどとの連携により、人がこれまで行っていた作業レベルの仕事も一連の流れで仕組み化し、自動化することが可能です。これからの社会において、AIやRPAとOCRを利用して人に代わる労働力を導入していくことが必要になってくるといえるでしょう。

4.OCRの活用事例と効果」でご覧いただいたさまざまな活用事例の中から、みなさんの業務改善に適用できそうな事例を参照してOCR活用の参考にしていただければ幸いです。

なお、PFUでは、活用事例でも使用されていたAI-OCRソフトウェアの最新版「DynaEye 11」を販売しております。DynaEye 11の導入によって業務がどのように変わるのかをわかりやすくまとめた資料と、無償で試せる無償評価版をご用意しております。次のバナーからダウンロードできますので、ぜひご活用ください。

関連記事

Top of Page