フォーム処理とは、データフィールドに入力された情報を取得し、電子形式に変換するプロセスです。これは手動でも自動でも実行できますが、一般的なプロセスとしては、紙媒体のデータが人間によって入力され、それぞれのフィールドから「取得」されてデータベースやその他の電子形式に入力されます。
概要
最も広い意味では、フォーム処理システムは、小規模な申請書から複数ページに及ぶ大規模なアンケートフォームまで、多岐にわたります。手作業によるフォーム処理には、いくつかの共通の課題があります。膨大な人的労力、ユーザーが入力したデータに誤字脱字が生じる可能性、そしてこの長時間の処理に長時間の労力がかかることなどが挙げられます。フォームをコンピュータソフトウェア駆動型アプリケーションで処理すれば、これらの共通の課題は解決され、大幅に軽減されます。フォーム処理のほとんどの方法は、以下の領域に対応しています。
手動データ入力
このデータ処理方法では、人間のオペレーターがフォーム上のデータを入力します。手作業によるデータ入力には、速度、精度、コストの面で多くのデメリットがあります。プロのタイピストの平均的なタイピング速度が50~80 wpmであることを考慮すると、[1] 1単語のフィールドが15個あるフォームの場合、1時間あたり約200ページと多めに見積もることができます(ページの読み取りと並べ替えの時間は除く)。対照的に、最新の市販のスキャナーは1分間に最大200ページをスキャンしてデジタル化できます。[2] 手作業によるデータ入力の2つ目の大きなデメリットは、タイプミスが発生する可能性があることです。人件費と作業スペースのコストを考慮すると、手作業によるデータ入力は非常に非効率的なプロセスです。
自動フォーム処理
この方法では、事前に定義されたテンプレートと設定を使用してデータ処理を自動化できます。この場合のテンプレートとは、フォームまたは文書内のデータフィールドの配置場所を詳細に示す文書マップのことです。手動のデータ入力プロセスと比較して、自動フォーム入力システムは、手動データ処理中に発生する問題を軽減できるため、より効果的です。
自動フォーム入力システムでは、機械印刷の場合は光学式文字認識(OCR)、チェック/マーク感知ボックスの場合は光学式マーク読み取り(OMR)、バーコードの場合はバーコード認識 (BCR)、手書きの場合はインテリジェント 文字認識(ICR)など、さまざまなタイプの認識方法が使用されます。
自動化されたフォーム処理システム テクノロジーを使用すると、ユーザーはスキャンした画像から文書を ANSI、XML、CSV、PDF などのコンピューターで読み取り可能な形式に変換したり、データベースに直接入力したりすることができます。
フォーム処理は、基本的なデータ取得の域を超えて進化しています。フォーム処理は、認識プロセスだけでなく、文書のスキャンからデータの抽出、そして多くの場合はバックエンドシステムへの配信に至るまで、文書のライフサイクル全体の管理にも役立ちます。場合によっては、計算や分析を通じて、適切にフォーマットされた結果の処理や生成も含まれることがあります。毎日数百、数千もの画像を処理する必要がある場合、自動化されたフォーム処理システムは大きなメリットをもたらします。
第一ステップ: フォーム構造の評価
自動フォーム処理を理解するための第一歩は、データ抽出の対象となるフォームの種類を分析することです。フォームは、データ抽出の目的に応じて、大きく分けて2つのカテゴリに分類できます。4つのカテゴリが提案されています[3]が、ドキュメントキャプチャ業界では以下の2つに絞られています。
- 固定フォーム。このタイプのフォームは、抽出対象となるデータがページ上の常に同じ絶対位置にあるフォームとして定義されます。これにより、文書全体と、その後に同じ文書が出現するたびに、レンズグリッドを適用してデータを抽出することができます。固定フォームの例として、典型的なクレジットカード申込書が挙げられます。[4]
- 半構造化(または非構造化)フォーム。このフォームは、データの位置とデータを保持するフィールドが文書ごとに異なるフォームです。このタイプの文書は、固定されたフォームではないという事実によって最も簡単に定義できます。文書キャプチャ業界では、半構造化フォームは非構造化フォームとも呼ばれます。このタイプのフォームの例としては、手紙、契約書、請求書などがあります。AIIMの調査によると、組織内の文書の約80%が半構造化定義に該当します。[5]
どちらのタイプのフォームからデータを抽出するために使用されるコンポーネント (以下に説明) は同じですが、これらを適用する方法はドキュメントのタイプによって大きく異なります。
コンポーネント
自動フォーム入力システムを使用したデータ処理に含まれるさまざまなコンポーネントには、
- OCR –光学文字認識
- OMR –光学マーク認識
- ICR –インテリジェント文字認識
- BCR –バーコード認識
- MICR –磁気インク文字認識
OCR は、機械印刷された大文字/小文字のアルファベット、数字、アクセント付き文字、多くの通貨記号、数字、算術記号、拡張句読点文字などを認識します。
ICR は、大文字、小文字、大文字と小文字が混在するアルファベット、数字、通貨 ($ (ドル)、¢ (セント)、€ (ユーロ)、£ (ポンド)、¥ (円) を含む)、算術記号、句読点 (ピリオド、カンマ、一重引用符、二重引用符、! & ( ) ? @ { } \ # % * + – / : ; < = > を含む) などの 定義済み文字セットを使用して、手書きのアメリカ英語とヨーロッパ英語の文字を認識します。
MICRは、小切手のMICRフォントの処理を容易にする認識技術です。これにより、小切手の決済におけるエラーの可能性を最小限に抑えることができます。また、資金移動をより容易かつ迅速に行うためにも役立ちます。MICRは、安全かつ高速に情報をスキャンおよび処理する方法を提供します。
光学式マーク認識(OMR)は、手書きで記入されたバブルや印刷されたフォーム上のチェックボックスを識別します。通常、OMRは単一マークと複数マークの認識をサポートします。認識対象となるフィールドは、グリッド(行×列)または単一のバブルとして指定できます。
バーコード認識機能は、Code39、 CODABAR、Interleaved 2 of 5 、Code93など、20種類以上の業界標準の1Dおよび2Dバーコードを読み取ることができます。画像内または画像内の指定領域内のすべてのバーコードを自動的に検出します。
プロセス
自動フォーム処理のプロセスには、通常、次の手順が含まれます。
- 記入済みのフォームを高速スキャナで一括スキャンします
- 画像はドキュメント画像処理アルゴリズムでクリーニングされ、精度が向上します
- フォームは元のテンプレートフォームに基づいて分類され、適切な認識コンポーネントを使用してフィールドが抽出されます。
- システムが信頼性が低いとフラグ付けしたフィールドは、人間のオペレーターによる検証のためにキューに入れられます。
- 検証されたデータはデータベースに保存されるか、CSV、XML、PDFなどの検索可能なテキスト形式でエクスポートされます。
前提条件
自動フォーム処理は手動データ入力に比べて多くの利点がありますが、それでもいくつかの制限があります。最高の精度を実現するには、いくつかの前提条件を満たす必要があります。
- スキャン形式: スキャンしたファイルの形式、解像度とDPI、カラーモードが含まれます
- 設定: この自動化ではスキャンした画像のレイアウトを設定する必要があります
- 認識: 事前に定義された出力形式
- 結果 / 分析: キャプチャ値データの結果の表示の特定の形式。
非常に重要な考慮事項の一つはインデックス作成です。インデックスとは、ドキュメントに含まれるデータを記述するために使用されるメタデータを決定するものです。この属性は、おそらくフォーム処理ソリューションにおいて他のどの要素よりも大きな役割を果たします。
外部リンク
- AIIM市場情報レポート
参考文献
- ^ Teresia R. Ostrach (1997)、「タイピング速度:平均速度はどれくらいか」(PDF) 、 2012年5月2日時点のオリジナル(PDF)からアーカイブ
- ^ 「コダック、毎分200ページ印刷可能なi1860商用スキャナーを発表」Engadget 2011年11月4日閲覧。
- ^ Kuznetsov, Sergei O.; Mandal, Deba P.; Kundu, Malay K.; Pal, Sankar Kumar (2011-06-25). パターン認識と機械知能:第4回国際会議、PReMI 2011、モスクワ、ロシア、2011年6月27日~7月1日、議事録. Springer. ISBN 9783642217869。
- ^ Vassylyev, Artur (2008年6月10日). 「半構造化フォームと文書のキャプチャ:課題と利用可能なテクノロジー」(PDF) . 2017年4月28日時点のオリジナル(PDF)からアーカイブ。 2017年4月4日閲覧。
- ^ 「フォーム処理 - テキストおよび手書き認識(OCR/ICR)のユーザーエクスペリエンス」(PDF) 。 2017年4月28日時点のオリジナル(PDF)からアーカイブ。 2017年4月4日閲覧。