フォームからのデータの抽出を理解する
フォームやその他のドキュメントには、 セマンティックな意味を持つテキスト データがあります。 セマンティック意味とは、特定のコンテキストにおける単語、語句、または記号の意図された意味または解釈を指します。 セマンティックの意味は、単語 (構文) のリテラル定義だけでなく、単語または文が実際に伝えるものに焦点を当てています。
ドキュメント インテリジェンス は、テキストを処理し、抽出されたテキストにセマンティックな意味をアタッチする AI 機能を記述します。 光学式文字認識 (OCR) の拡張機能として、ドキュメント インテリジェンスは情報の抽出と理解のプロセスを自動化します。
経費請求、プロジェクト コスト、およびその他の会計目的で多数の領収書を処理する必要がある組織を考えてみましょう。 ドキュメント インテリジェンスを使用して、会社はレシートのスキャンされた画像を取得し、OCR を使用してテキストをデジタル化し、セマンティックな意味を抽出できます。 フォーム内のデータの意味は、フィールドと値のペアで記述できます。
- フィールド名は、データ入力のキーまたは型です。
- フィールドの説明は、フィールド名が表す内容の定義です。
- 値はフィールド名に対応し、コンテンツに固有のデータです。
たとえば、請求書では、認識されるフィールドには次のものが含まれる場合があります。
- マーチャントの名前、住所、電話番号
- 購入日時
- 各購入品目の名前、数量、価格
- 合計、小計、税額
フォーム内のデータは 境界ボックスで認識されます。
たとえば、レシートの住所情報は、座標 [4.1, 2.2]、[4.3, 2.2]field name
、[4.3, 2.4]、[4.1, 2.4]、[4.1, 2.4]を持つaddress
、value
、123 Main Street
として保存されます。 機械学習モデルは、境界ボックス座標位置のパターンを認識するようにトレーニングされているため、ドキュメントまたはフォーム内のデータを解釈できます。
データ抽出の結果は、各フィールドとデータ ペアの 信頼度レベル に関連付けられます。 この 信頼度レベル は 0 ~ 1 のパーセンテージで、精度の高いレベルを示します。 高い信頼度スコア (1 に近い) で抽出されたデータは、元のコンテンツの内容を実際に表すために、より自信を持って依存できます。