1. 改正電子帳簿保存法に対応し、省コストと業務効率化を実現する「AI-OCR」とは
2024.9.19

改正電子帳簿保存法に対応し、省コストと業務効率化を実現する「AI-OCR」とは

「改正電子帳簿保存法」によって、電子取引におけるデータ保存が完全義務化となり、これまでのように紙で出力して保存することができなくなりました。データ保存する際は電子帳簿保存法によって定められた要件を満たす必要がありますが、この要件対応において「AI-OCR」が改めて注目を集めています。そこで今回は、「改正電子帳簿保存法」におけるAI-OCRの活用メリット、OCRとAI-OCRの違い、読み取れる書類など、AI-OCRの基礎について紹介します。

1. 「改正電子帳簿保存法」への対応で注目される「AI-OCR」

電子帳簿保存法は、ほぼすべての法人と個人事業主を対象に、原則、紙での保存が義務づけられていた国税関連の帳簿書類を、一定の要件を満たすことで電子データとして保存することを認める法律です。

同法は、2022年の改正によりルールが緩和されました。その一つが「検索要件」の緩和です。検索要件はこれまで、「取引年月日」、「勘定科目」、「取引金額」の他、「取引関係帳簿書類の種類に応じた主要な記録項目」を条件にしてデータ検索できる必要がありましたが、改定後は「取引年月日」、「取引金額」、「取引先」の3つに限定されています。

ルール緩和の一方で、改正後、宥恕期間にあった「電子取引」のデータ保存が2024年1月から完全義務化されました。これにより、「電子取引」で受領したデータも、前述の「検索要件」へ対応した形で保存する必要があります。

検索要件に対応する方法には次の2つがあります。

  • 1) 保存するデータのファイル名に「取引年月日・取引金額・取引先」を含める
  • 2) エクセルによる索引簿や文書管理システムを導入し、「取引年月日・取引金額・取引先」の項目で検索できるようにする

いずれの方法においてもファイル名や検索項目の設定を手入力で行うとなると大きな負担がかかり、入力ミスのリスクもあります。このような人による煩雑な作業に対して、今、再注目を集めているのが「AI-OCR」です。「AI-OCR」は、書類の画像データからテキスト情報を抽出するOCR技術に、AI技術を融合させることで文字認識精度などを向上させたITツールです。「AI-OCR」の活用によって、データ入力の負担が大幅に軽減されるため、業務を効率化するとともに、改正電子帳簿保存法へのスムーズな対応が可能になります。

2. 「OCR」と「AI-OCR」の効果と技術の違い

2-1. 「OCR」とその効果

OCR(Optical Character Recognition:光学的文字認識)は、紙書類をスキャンして電子化した画像データやPDFから文字を抽出・認識し、テキストデータに変換する技術です。
OCRツールで処理することで、例えば請求書から取引年月日、その他の日付、取引金額、取引先名など、検索に必要な属性情報を抜き出すことが可能になります。また、データ入力や整理などの単純で時間のかかる作業を自動化することにより、入力作業の負担を軽減するとともに、データの正確性を向上させ、入力ミスや確認作業の手間を減らすことができます。

OCRのイメージ画像

2-2. 「AI-OCR」とその効果

「AI-OCR」とは、OCRの光学的文字認識機能と深層学習(deep learning)を含む「機械学習(machine learning)」などのAI技術を組み合わせることで、OCRの文字認識精度やレイアウト解析精度を飛躍的に向上させる技術です。
AI-OCRを活用することで、OCRが認識できるロジックの範囲外のパターンや、レイアウトが異なる帳票への対応も可能になります。ただし、OCRより文字認識精度が向上するとはいえ、AI-OCRの文字認識精度は100%を保証するわけではありません。「認識結果の確認」や「修正プロセスの効率化」などの業務改善は必須で、それを理解した上での利用が重要です。

2-3. AI-OCRで読み取れる帳票

AI-OCRツールが認識できる帳票は、大きく次の3種類に区分できます。

1) 定型帳票

レイアウトが固定されている帳票(申請書、申込書、アンケートなど)

2) 準定型帳票

記載項目は共通しているが、取引先ごとに記載位置が変わるなど、レイアウトが定まっていない帳票(請求書、納品書、注文書など)

3) 非定型帳票

項目や記載位置に規則性がなく、レイアウトがまったく決まっていない帳票 (契約書、図面など)

2-4. AI-OCRの利用形態

AI-OCRツール(サービス)は、クラウドサービス型とオンプレミス型の2つの利用形態が選べます。

1) クラウドサービス型

インターネット上にサーバーがあり、ブラウザなどを介してサービスを利用できるのが「クラウド型のAI-OCR」です。
サーバーなどを自社で用意する必要がないため、初期費用を抑えながら、すぐに利用開始できること、インターネットにアクセスできる環境さえあれば、場所を問わずシステムにアクセスできるため、テレワーク中の社員や出先からでもサービスを利用できることが大きな特徴です。また、システムのバージョンアップやデータのバックアップ、緊急時の対応など、システムの保守やメンテナンスはベンダー側が行うため、社内のリソースが必要ないこともメリットです。

2) オンプレミス型

社内のPCやサーバーなどにインストールして利用するのが「オンプレミス型のAI-OCR」です。
オンプレミス型は、社内に環境を構築しなければならない分、初期費用が高くなりがちなのが難点です。しかし、読み取った情報を自社のサーバー内で管理するため、強固なセキュア環境を構築できるのが大きなメリットとなっています。
また、オンプレミス型のAI-OCRは、インターネットへのアップロードやダウンロードが不要なため、それらにかかる時間を省くことができ、大量の書類をOCRする作業に向いています。

このように、AI-OCRは2つの利用形態があるため、自社での使い方や課題感に合わせて適切なツール(サービス)を選ぶ必要があります。詳しい解説はこちらをご覧ください。

3. オンプレミス型のAI-OCRソフトウェア「DynaEye 11」

PFUが提供する「DynaEye(ダイナアイ) 11」は、定型帳票と準定型帳票対応のオンプレミス型AI-OCRソフトウェアです。
これまで認識が困難とされてきた癖の強いフリーピッチの日本語の手書き文字や、枠外にはみ出した文字、取り消し線や押印を含む文字も、高精度に認識できるのが特徴で、手書き文字・活字・バーコードなど幅広い文字種に対応して、99.2%(※当社基準帳票を用いた認識精度結果)もの高精度な文字認識を実現し、業務システムへのデータ入力業務の効率化を強力に支援します。

3-1. 「ベリファイOCR」機能で確認・修正時間を短縮

DynaEye 11の「ベリファイOCR」機能*は、「2つの異なるOCRエンジン(従来のOCRエンジンとAI-OCRエンジン)」の認識結果を突合し、認識結果に不一致の項目のみをピックアップすることで、人による目視の確認・修正作業を大幅に削減します。

*:標準アプリケーションでは、手書き英数字と活字が対象。エントリーアプリケーションでは、活字のみ対象。

ベリファイOCR機能のイメージ画像 ベリファイOCR機能のイメージ画像

3-2. オンプレミス型だから実現できる、高いセキュリティ

DynaEye 11は、インストールしたPC内でOCRを完結するオンプレミス型で提供しています。読み込んだデータをすべてクローズド環境で管理できるため、高いセキュリティが求められる業務でも情報漏えいのリスクを抑えた利用が可能です。

3-3. 「RICOH fi Series」とのシームレスな連携で、さらにAI-OCRの精度を向上

DynaEye 11は、業務用イメージスキャナー「RICOH fi Series」と連携させることで、さらにAI-OCRの精度を向上させることが可能です。
RICOH fi Seriesは、高度な画像処理機能によって、文字の視認性が高い画像を生成し、OCRおよびAI-OCRの精度を向上します。また、高速・両面読みで短時間に大量の書類を処理できるだけではなく、バーコード認識結果をファイル名やフォルダー名に指定して自動的に保存するなど、紙の証憑を業務で活用可能なデジタル情報へとすばやく変換して、社内のワークフローのペーパーレス化を支援します。

こちらでは、「RICOH fi Series」の高度な画像処理技術について詳しく解説しております。
OCRの精度向上に興味がある方はぜひご覧ください。

4. まとめ

今回は、活用することで改正電子帳簿保存法に対応するだけでなく、業務効率化とコスト削減を実現する「AI-OCR」についてご紹介しました。ビジネスにおけるAIの活用は、近年、急速に進んでおり、企業のデジタライズやDX推進には欠かせない技術となっています。OCRにAI技術を付加したAI-OCRは、業務システムと連携することで、さらに進化し、ビジネスを加速する重要なツールとして定着していくでしょう。
DynaEye 11の提供を通じて、PFUはお客様のビジネス変革の実現をサポートいたします。

  • 改正電子帳簿保存法の対策にAI-OCRを活用したい
  • DynaEye 11について、もっと知りたい

といったお悩みをお抱えの方は、お気軽にPFUへご相談ください。

関連記事

Top of Page