次の方法で共有


ドキュメント処理モデル

このコンテンツの適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青のチェックマークv3.1 (GA)青のチェックマークv3.0 (GA)青のチェックマークv2.1 (GA)

このコンテンツの適用対象:チェックマークv3.1 (GA) | 最新バージョン:紫のチェックマークv4.0 (GA) | 以前のバージョン:青のチェックマークv3.0青のチェックマークv2.1

このコンテンツの適用対象:チェックマークv3.0 (GA) | 最新バージョン:紫のチェックマークv4.0 (GA)紫のチェックマークv3.1 | 以前のバージョン:青のチェックマークv2.1

このコンテンツの適用対象:checkmarkv2.1 | 最新バージョン: 青のチェックマークv4.0 (GA)

Azure AI ドキュメント インテリジェンスでは、インテリジェントなドキュメント処理をアプリやフローに追加するために使用できるさまざまなモデルがサポートされています。 事前構築済みのドメイン固有のモデルを使用することも、特定のビジネス ニーズやユース ケースに合わせてカスタマイズされたカスタム モデルをトレーニングすることもできます。 ドキュメント インテリジェンスは、REST API または Python、C#、Java、JavaScript クライアント ライブラリで使用できます。

Note

財務データ、保護された健康データ、個人データ、または機密性の高いデータを含むドキュメント処理プロジェクトには、細心の注意が必要です。 すべての国/地域の要件および業界固有の要件に必ず従うようにしてください。

モデルの概要

次の表は、各安定した API の一般公開 (GA) モデルを示しています。

モデルの種類 モデル 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
ドキュメント分析モデル 読み取り ✔️ ✔️ ✔️ 使用不可
ドキュメント分析モデル レイアウト ✔️ ✔️ ✔️ ✔️
ドキュメント分析モデル 一般的なドキュメント** でサポートされています
レイアウト モデル
✔️ ✔️ 使用不可
事前構築済みのモデル 銀行小切手 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 銀行取引明細書 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル payStub ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 契約書 ✔️ ✔️ 使用不可 使用不可
事前構築済みのモデル 医療保険カード ✔️ ✔️ ✔️ 使用不可
事前構築済みのモデル 身分証明書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 請求書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 領収書 ✔️ ✔️ ✔️ ✔️
事前構築済みのモデル 米国統一税* ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国 1040 税* ✔️ ✔️ 使用不可 使用不可
事前構築済みのモデル 米国 1095 税* ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国 1098 税* ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国 1099 税* ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国 W2 税 ✔️ ✔️ ✔️ 使用不可
事前構築済みのモデル 米国 W4 税 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国住宅ローン 1003 URLA ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国住宅ローン 1004 URAR ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国住宅ローン 1005 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国住宅ローン 1008 の概要 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 米国住宅ローン決算開示 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 結婚証明書 ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル クレジット カード ✔️ 使用不可 使用不可 使用不可
事前構築済みのモデル 名刺 使用されていない ✔️ ✔️ ✔️
カスタム分類モデル カスタム分類子 ✔️ ✔️ 使用不可 使用不可
カスタム抽出モデル カスタム ニューラル ✔️ ✔️ ✔️ 使用不可
カスタム抽出モデル カスタム テンプレート ✔️ ✔️ ✔️ ✔️
カスタム抽出モデル カスタム構成済み ✔️ ✔️ ✔️ ✔️
すべてのモデル アドオン機能 ✔️ ✔️ 使用不可 使用不可

* サブモデルが含まれています。 サポートされているバリエーションとサブタイプについては、モデル固有の情報を参照してください。
** 一般的なドキュメント モデルのすべての機能は、レイアウト モデルで使用できます。 一般的なモデルはサポートされなくなりました。

Latency

待機時間は、API サーバーが受信要求を処理し、クライアントに送信応答を配信するためにかかる時間です。 ドキュメントの分析にかかる時間は、サイズ(例えばページ数)や各ページの関連コンテンツによって異なります。 ドキュメント インテリジェンスはマルチテナント非同期サービスであり、類似したドキュメントの待機時間は同等ですが、常に同じとは限りません。 待機時間とパフォーマンスの変動は、イメージと大規模なドキュメントを大規模に処理するマイクロサービスベースのステートレス サービスに固有です。 Microsoft では、ハードウェア、容量、スケーリング機能を継続的にスケールアップしていますが、実行時に待ち時間の問題が発生する可能性は依然として存在します。

アドオン機能

ドキュメント インテリジェンスでは、次のアドオン機能を使用できます。 名刺モデルを除くすべてのモデルについて、ドキュメント インテリジェンスでは、より高度な分析を可能にするアドオン機能がサポートされるようになりました。 ドキュメント抽出のシナリオに応じて、これらのオプション機能を有効または無効にすることができます。 2023-07-31 (GA) 以降の API バージョンでは、次のアドオン機能を使用できます。

アドオン機能 アドオン/無料 2024-11-30 (GA) 2023-07-31 (GA) 2022-08-31 (GA) v2.1 (GA)
Font プロパティの抽出 アドオン ✔️ ✔️ 使用不可 使用不可
数式の抽出 アドオン ✔️ ✔️ 使用不可 使用不可
高解像度抽出 アドオン ✔️ ✔️ 使用不可 使用不可
バーコード抽出 Free ✔️ ✔️ 使用不可 使用不可
言語検出 Free ✔️ ✔️ 使用不可 使用不可
キーと値のペア Free ✔️ 使用不可 使用不可 使用不可
クエリ フィールド アドオン* ✔️ 使用不可 使用不可 使用不可
検索可能な PDF アドオン* ✔️ 使用不可 使用不可 使用不可

モデル分析機能

モデル ID コンテンツ抽出 クエリ フィールド 段落 段落ロール 選択マーク テーブル キーと値のペア 言語 バーコード ドキュメント分析 数式* スタイル フォント* 高解像度* 検索可能な PDF
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (各種) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (各種) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - Premium 機能には追加コストが発生します

クエリ フィールドの価格は、他のアドオン機能とは異なります。 詳細については、「 価格」を参照してください。

境界ボックスと多角形の座標

境界ボックス (v3.0 以降のバージョンでpolygon ) は、ドキュメント内のテキスト要素を囲む抽象的な四角形です。 境界ボックスは、オブジェクト検出の参照ポイントとして使用されます。

  • 境界ボックスでは、4 つの数値ペアの配列で表される xy 座標平面を使用して位置を指定します。 各ペアが、左上、右上、右下、左下の順序でこのボックスの角を表します。
  • 画像の座標はピクセル単位で表示されます。 PDF の場合、座標はインチ単位で表示されます。

言語のサポート

ディープ ラーニングに基づくドキュメント インテリジェンスのユニバーサル モデルでは、多くの言語がサポートされています。 モデルでは、言語が混在するテキスト行など、画像やドキュメントから多言語テキストを抽出できます。 言語サポートは、Document Intelligence サービスの機能によって異なります。 完全な一覧については、以下の記事を参照してください。

リージョン別の提供状況

Document Intelligence は、60 を超える Azure グローバル インフラストラクチャ リージョンの多くで一般提供されています。

自分と顧客に最適なリージョンの選択に役立つ情報については、 Azure の地域を参照してください。

モデルの詳細

このセクションでは、各モデルで期待できる出力について説明します。 大部分のモデルの出力はアドオン機能を使用することで拡張できます。

OCR の読み取り

Read API では、光学式文字認識 (OCR) を使用して、行と単語、場所、検出された言語、手書きスタイル (検出された場合) を分析および抽出します。

このサンプル ドキュメントは、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio Read を使用して処理されたサンプル ドキュメントを示すスクリーンショット。

レイアウト分析

レイアウト分析モデルは、テキスト、テーブル、選択マーク、およびタイトル、セクション見出し、ページ ヘッダー、ページ フッターなどのその他の構造要素を分析して抽出します。

このサンプル ドキュメントは、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用して処理された新聞ページのサンプルを示すスクリーンショット。

健康保険証

医療保険カード モデルは、強力な OCR 機能とディープ ラーニング モデルを組み合わせて、米国の医療保険カードから重要な情報を分析および抽出します。

このサンプルの米国医療保険カードは 、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio での米国医療保険カード分析のサンプルを示すスクリーンショット。

米国税務書類

米国税務書類モデルでは、税務書類の選択グループから主要なフィールドと明細を分析して抽出します。 この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国税ドキュメントの分析をサポートしています。 現在サポートされているモデルは次のとおりです。

モデル 説明 モデル ID
米国税 W-2 課税対象の報酬の詳細を抽出します。 prebuilt-tax.us.w2
米国税 W-4 課税対象の報酬の詳細を抽出します。 prebuilt-tax.us.w4
米国税 1040 住宅ローンの利息の詳細を抽出します。 prebuilt-tax.us.1040 (バリエーション)
米国税 1095 医療保険の詳細を抽出します。 prebuilt-tax.us.1095 (バリエーション)
米国税 1098 住宅ローンの利息の詳細を抽出します。 prebuilt-tax.us.1098 (バリエーション)
米国税 1099 雇用主以外のソースから受け取った所得を抽出します。 prebuilt-tax.us.1099 (バリエーション)

このサンプル W-2 ドキュメントは、 Document Intelligence Studio を使用して処理されました。

W-2 ドキュメントのサンプルを示すスクリーンショット。

米国の住宅ローン ドキュメント

米国の住宅ローンドキュメント モデルでは、住宅ローンドキュメントの選択されたグループから、借り手、ローン、および不動産情報を含む主要なフィールドを分析および抽出します。 この API は、電話でキャプチャされた画像、スキャンされたドキュメント、デジタル PDF など、さまざまな形式と品質の英語の米国住宅ローン ドキュメントの分析をサポートしています。 現在、次のモデルがサポートされています。

モデル 説明 モデル ID
1003 End-User 使用許諾契約書 ローン、借り手、不動産の詳細を抽出します。 prebuilt-mortgage.us.1003
1004 均一住宅評価報告書(URAR) ローン、借り手、不動産の詳細を抽出します。 prebuilt-mortgage.us.1004
1005 雇用の検証 ローン、借り手、不動産の詳細を抽出します。 prebuilt-mortgage.us.1005
1008 概要ドキュメント 借り手、売り手、不動産、住宅ローン、引受の詳細を抽出します。 prebuilt-mortgage.us.1008
決算開示 決算、取引コスト、ローンの詳細を抽出します。 prebuilt-mortgage.us.closingDisclosure

このサンプルのクロージング開示ドキュメントは、 Document Intelligence Studio を使用して処理されました。

クローズ開示のサンプルを示すスクリーンショット。

コントラクト

契約モデルは、当事者、管轄区域、契約 ID、役職など、契約契約の主要なフィールドと品目を分析して抽出します。 このモデルでは現在、英語の契約文書がサポートされています。

このサンプル コントラクトは 、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用したコントラクト モデルの抽出を示すスクリーンショット。

米国の銀行小切手

契約モデルでは、チェックの詳細、勘定の詳細、金額、メモなど、米国の銀行小切手の主要なフィールドが分析および抽出されます。

この銀行小切手のサンプルは 、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した銀行チェック モデルの抽出を示すスクリーンショット。

米国の銀行明細書

銀行取引明細書モデルでは、米国の銀行明細書の口座番号、銀行詳細、明細書の詳細、トランザクションの詳細から、主要なフィールドと明細を分析および抽出します。

このサンプル銀行報告書は 、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した銀行取引明細書モデルの抽出を示すスクリーンショット。

payStub

payStub モデルは、給与に関連する情報を含むドキュメントやファイルの主要なフィールドと明細を分析および抽出します。

このサンプルの支払いスタブは 、Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio を使用した payStub モデルの抽出を示すスクリーンショット。

請求書

請求書モデルは、請求書の処理を自動化して、顧客名、請求先住所、期限、金額、明細、およびその他のキー データを抽出します。

このサンプル請求書は 、Document Intelligence Studio を使用して処理されました。

請求書のサンプルを示すスクリーンショット。

Receipt

レシート モデルを使用して、販売者の名前、日付、品目、数量、および印刷されたレシートと手書きのレシートの合計の売上レシートをスキャンします。 バージョン v3.0 では、単一ページのホテルレシート処理もサポートされています。

このサンプルレシートは 、Document Intelligence Studio を使用して処理されました。

レシートのサンプルを示すスクリーンショット。

ID ドキュメント

ID ドキュメント (ID) モデルを使用して、米国の運転免許証 (50 州とコロンビア特別区すべて) と国際パスポート (ビザやその他の旅行書類を除く) の略歴ページを処理して、重要なフィールドを抽出します。

このサンプルの米国の運転免許証は 、Document Intelligence Studio を使用して処理されました。

サンプル ID カードを示すスクリーンショット。

結婚証明書

結婚証明書モデルを使用して、米国の結婚証明書を処理して、個人、日付、場所などの主要なフィールドを抽出します。

このサンプルの米国結婚証明書は 、Document Intelligence Studio を使用して処理されました。

結婚証明書のサンプルを示すスクリーンショット。

クレジット カード

クレジット カード モデルを使用して、クレジット カードとデビット カードを処理し、主要なフィールドを抽出します。

このサンプル クレジット カードは 、Document Intelligence Studio を使用して処理されました。

クレジット カードのサンプルを示すスクリーンショット。

カスタム モデル

カスタム モデルは、大きく 2 種類に分類されます。 つまり、"ドキュメントの種類" の分類をサポートするカスタム分類モデルと、特定のドキュメントの種類から定義されたスキーマを抽出できるカスタム抽出モデルです。

カスタム モデルの種類と関連するモデル ビルド モードを示す図。

カスタム ドキュメント モデルでは、ビジネスに固有のフォームやドキュメントからデータを分析し、抽出することができます。 個別のコンテンツ内のフォーム フィールドを認識し、キーと値のペアとテーブル データを抽出します。 開始するには、フォームの種類の例が 1 つだけ必要です。

バージョン v3.0 以降のカスタム モデルでは、カスタム テンプレート (フォーム) 内の署名検出と、テンプレートとニューラルの両モデル内のページをまたぐ表がサポートされています。 署名検出では、ドキュメントに署名した人物の ID ではなく、署名の存在を探します。 モデルが署名検出に対して未署名を返した場合、そのモデルでは、定義されたフィールドに署名が見つかりませんでした。

このサンプル カスタム テンプレートは、 Document Intelligence Studio を使用して処理されました。

カスタム フォームを分析するドキュメント インテリジェンスを示すスクリーンショット。

カスタム抽出

カスタム抽出モデルには、カスタム テンプレートとカスタム ニューラルの 2 種類があります。 カスタム抽出モデルを作成するには、抽出する値を持つドキュメントのデータセットにラベルを付け、ラベル付けされたデータセットに対してモデルをトレーニングします。 作業を開始するには、同じフォームまたはドキュメントの種類の例が 5 つだけ必要です。

このサンプルのカスタム抽出は、 Document Intelligence Studio を使用して処理されました。

Document Intelligence Studio でのカスタム抽出モデル分析を示すスクリーンショット。

カスタム分類子

カスタム分類モデルを使用すると、抽出モデルを呼び出す前にドキュメントの種類を識別できます。 分類モデルは、2023-07-31 (GA) API 以降で使用できます。 カスタム分類モデルをトレーニングするには、少なくとも 2 つの個別のクラスと、クラスごとに少なくとも 5 つのサンプルが必要です。

作成済みモデル

作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタム モデルを割り当てることができます。 200 個までのトレーニングされたカスタム モデルを 1 つの作成済みモデルに割り当てることができます。

このサンプル構成済みモデルは 、Document Intelligence Studio にあります

Document Intelligence Studio Compose カスタム モデル ペインを示すスクリーンショット。

入力の要件

次のファイル形式がサポートされています。

モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIF
Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
Read
レイアウト
一般的なドキュメント
事前構築済み
カスタム抽出
カスタム分類
  • 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
  • PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
  • ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
  • 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
  • パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
  • テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
  • カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
  • カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
  • カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
  • Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 この制限は、ドキュメント インテリジェンス サービスではなくツールから派生します。

バージョンの移行

ドキュメント インテリジェンス v3.1 移行ガイドの手順に従って、アプリケーションで ドキュメント インテリジェンス v3.0 を使用する方法について説明します。

モデル 説明
ドキュメント分析
レイアウト ドキュメントからテキストとレイアウトの情報を抽出します。
事前構築済み
請求書 英語とスペイン語の請求書から重要な情報を抽出します。
領収書 英語のレシートから重要な情報を抽出します。
身分証明書 米国の運転免許証と国際パスポートから重要な情報を抽出します。
名刺 英語の名刺から重要な情報を抽出します。
Custom
Custom ビジネスに固有のフォームとドキュメントからデータを抽出します。 カスタム モデルは、特定のデータとユース ケースに合わせてトレーニングされます。
構成 カスタム モデルのコレクションを作成し、フォームの種類から構築された 1 つのモデルに割り当てます。

レイアウト

Layout API を使って、ドキュメントを分析し、テキスト、テーブルとヘッダー、選択マーク、構造情報を抽出することができます。

このサンプル ドキュメントは、 サンプル ラベル付けツールを使用して処理されました。

サンプル ラベル付けツールを使用したレイアウト分析を示すスクリーンショット。

請求書

請求書モデルは、販売請求書から主要な情報が分析されて抽出されます。 API によって、さまざまな書式の請求書が分析され、顧客名、請求先住所、期限、請求額などの主要な情報が抽出されます。

このサンプル請求書は、 サンプル ラベル付けツールを使用して処理されました。

サンプル ラベル付けツールを使用したサンプル請求書分析を示すスクリーンショット。

Receipt

領収書モデルでは、印刷された領収書と手書きのレシートから重要な情報を分析して抽出します。

このサンプルレシートは、 サンプルラベル付けツールを使用して処理されました。

レシートのサンプルを示すスクリーンショット。

身分証明書

身分証明書モデルでは、次のドキュメントから重要な情報を分析して抽出します。

  • 米国の運転免許証 (50 州すべておよびコロンビア特別区)
  • 国際パスポートの個人情報ページ (査証やその他の旅行ドキュメントを除く)。 API は ID ドキュメントを分析して抽出します。

このサンプル米国の運転免許証は、 サンプル ラベル付けツールを使用して処理されました。

サンプル ID カードを示すスクリーンショット。

名刺

名刺モデルでは、名刺の画像から主要な情報が分析されて抽出されます。

このサンプル 名刺は、 サンプル ラベル付けツールを使用して処理されました。

サンプル 名刺を示すスクリーンショット。

Custom

カスタム モデルを使って、ビジネスに固有のフォームやドキュメントからデータを分析し、抽出することができます。 この API は、個別のコンテンツ内のフォーム フィールドを認識し、キーと値のペアとテーブル データを抽出するようにトレーニングされた機械学習プログラムです。 作業を開始するには、同じフォームの種類の例が 5 つだけ必要です。 ラベル付きデータセットの有無にかかわらず、カスタム モデルをトレーニングできます。

このサンプル カスタム モデルは、 サンプル ラベル付けツールを使用して処理されました。

カスタム フォーム ウィンドウを分析するドキュメント インテリジェンス ツールを示すスクリーンショット。

作成済みカスタム モデル

作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 1 つのモデル ID で呼び出される構成済みモデルに複数のカスタム モデルを割り当てることができます。 100 個までのトレーニングされたカスタム モデルを 1 つの構成済みモデルに割り当てることができます。

この構成済みのモデル ペインは、 サンプル ラベル付けツールを使用して処理されました。

Document Intelligence Studio Compose カスタム モデル ペインを示すスクリーンショット。

モデル データの抽出

モデル テキスト抽出 言語検出 選択マーク テーブル 段落 段落ロール キーと値のペア Fields
レイアウト
請求書
領収書
身分証明書
名刺
カスタム フォーム

入力の要件

次のファイル形式がサポートされています。

モデル PDF 画像:
JPEG/JPG、PNG、BMP、TIFF、HEIF
Office:
Word (DOCX)、Excel (XLSX)、PowerPoint (PPTX)、HTML
Read
レイアウト
一般的なドキュメント
事前構築済み
カスタム抽出
カスタム分類
  • 写真とスキャン: 最良の結果を得るには、ドキュメントごとに 1 つの明確な写真または高品質のスキャンを提供します。
  • PDF とTIFF: PDF とTIFF の場合、最大 2,000 ページを処理できます。 (Free レベルのサブスクリプションでは、最初の 2 ページのみが処理されます)。
  • ファイル サイズ: ドキュメントを分析するためのファイル サイズは、有料 (S0) レベルでは 500 MB、Free (F0) レベルでは 4 MB です。
  • 画像の寸法: 寸法は、50 ピクセル x 50 ピクセルから 10,000 ピクセル x 10,000 ピクセルの間である必要があります。
  • パスワード ロック: PDF がパスワードロックされている場合は、提出前にロックを解除する必要があります。
  • テキストの高さ: 抽出するテキストの最小高さは、1024 x 768 ピクセルの画像で 12 ピクセルです。 このディメンションは、1 インチあたり 150 ドットの約 8 ポイントのテキストに対応します。
  • カスタム モデル トレーニング: トレーニング データの最大ページ数は、カスタム テンプレート モデルの場合は 500 ページ、カスタム ニューラル モデルの場合は 50,000 ページです。
  • カスタム抽出モデルトレーニング: トレーニング データの合計サイズは、テンプレート モデルの場合は 50 MB、ニューラル モデルの場合は 1 GB です。
  • カスタム分類モデル トレーニング: トレーニング データの合計サイズは 1 GB で、最大 10,000 ページです。 2024-11-30 (GA) の場合、トレーニング データの合計サイズは 2 GB で、最大 10,000 ページです。
  • Office ファイルの種類 (DOCX、XLSX、PPTX): 文字列の最大長の制限は 800 万文字です。

Note

サンプル ラベル付けツールでは、BMP ファイル形式はサポートされていません。 この制限は、ドキュメント インテリジェンスではなくツールから派生します。

バージョンの移行

ドキュメント インテリジェンス v3.1 移行ガイドの手順に従って、アプリケーションでドキュメント インテリジェンス v3.0 を使用する方法について説明します。