帳票レイアウト識別機能
異なる様式の帳票を一括して帳票認識する機能を、異種帳票処理と呼びます。 異種帳票処理により、スキャナー入力する前に帳票をあらかじめ様式ごとに仕分けしておく手間が不要になります。
異種帳票処理の方式としては、帳票レイアウト識別と帳票ID識別の二種類があります。 ここでは、帳票レイアウト識別について説明します。
帳票レイアウト識別の概要
DynaEyeの帳票レイアウト識別機能は、帳票上の表罫線などにより形成される線分のパターン情報と、活字文字列や色情報とを使って、入力された帳票のイメージが、あらかじめ登録された書式群の中のどの書式であるかを特定する機能です。
この帳票レイアウト識別機能により、帳票上に帳票IDのような識別用の情報を印刷することなく、異なる様式の帳票を混在させて処理する異種帳票処理を実現しています。
帳票レイアウト識別機能では、帳票サイズやイメージ解像度が異なる書式(定義)を混在させることも可能です(同一書式のサイズ違いや解像度違いは不可)。
帳票レイアウト識別の特長
- 帳票ID識別機能はあらかじめ帳票上に帳票IDと呼ぶ識別のための文字を印刷しておく必要があったり、この帳票IDを認識するための基準マークを印刷しなければならないという課題がありました。帳票レイアウト識別機能はこのような課題を解消し、既存帳票や多種類の帳票を運用する環境への導入を容易にします。
- 新たな様式の帳票が登録される場合に、既登録の帳票との類似度をチェックする機能を備えています。識別不能な様式が誤って登録されることはありません。
- 90度単位のローテーション機能により、帳票イメージの向きが回転していても、正しい書式を特定することができます。
- 最大550種類の帳票を同時に識別できます。書式登録はキャビネット単位で行われるため、キャビネットを分ければ、更に多くの書式を扱うことができます。
帳票レイアウト識別の留意点
- 罫線パターンによる帳票レイアウト識別を行う場合、帳票上に罫線(20mm以上のもの)が5本以上あり、帳票中の罫線の2割以上のものが、ほかの帳票と異なる位置や長さであることが必要です。また、網掛けのような不安定な要素が大きな面積を占めるものは扱えません。
- 活字文字列による帳票レイアウト識別を行う場合、ほかの帳票では印刷されていない文字で構成されている活字文字列を識別フィールドに指定してください。1フィールドあたりの桁数は、最大16文字までです。字形は、MS 明朝 / MS ゴシックフォント(10 ~ 36 ポイント)です。
- 色付き領域による帳票レイアウト識別を行う場合、ほかの帳票では印刷されていない色で構成されている色付き領域を識別フィールドに指定してください。白・黒・グレー系ではない色で、濃く明度の高い鮮やかな色が印刷されている必要があります。領域サイズは、幅(10mm ~ 50mm)、高さ(10mm ~ 50mm)となります。
- 活字文字列による帳票識別フィールドと色付き領域による帳票識別フィールドの合計が最大15フィールドまでです。