次の方法で共有


Azure AI Document Intelligence とは

このコンテンツの適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青のチェックマークv3.1 (GA)青のチェックマークv3.0 (GA)青のチェックマークv2.1 (GA)

このコンテンツの適用対象:チェックマークv3.1 (GA) | 最新バージョン:紫のチェックマークv4.0 (GA) | 以前のバージョン:青のチェックマークv3.0青のチェックマークv2.1

このコンテンツの適用対象:チェックマークv3.0 (GA) | 最新バージョン:紫のチェックマークv4.0 (GA)紫のチェックマークv3.1 | 以前のバージョン:青のチェックマークv2.1

このコンテンツの適用対象:チェックマークv2.1 | 最新バージョン:青のチェックマークv4.0 (GA)

Azure AI ドキュメント インテリジェンスは、インテリジェントなドキュメント処理ソリューションを構築するために使用できるクラウドベースの Azure AI サービス です。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 ドキュメント インテリジェンスを使用すると、データの収集と処理の速度を効果的に管理できます。 ドキュメント インテリジェンスは、運用の改善、情報に基づくデータドリブンの意思決定、および対応されたイノベーションの鍵となります。 リージョン アクセスの詳細については、「 リージョン別の製品の可用性」を参照してください。

|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |

ドキュメント分析モデル

ドキュメント分析 (一般的な抽出) モデルを使用すると、フォームやドキュメントからテキストを抽出し、組織のアクション、使用、または開発のために構造化されたビジネス対応コンテンツを返します。

読み取り |印刷されたテキストと手書きのテキストを抽出します。

レイアウト |テキスト、テーブル、およびドキュメント構造を抽出します。

読み取り |印刷された
と手書きのテキストを抽出します。

レイアウト |テキスト、テーブル、
およびドキュメント構造を抽出します。

一般的なドキュメント |テキスト、構造体、および
キーと値のペアを抽出します。

事前構築済みモデル

事前構築済みのモデルを使用すると、独自のモデルをトレーニングして構築しなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。

銀行取引明細書 |口座情報と詳細を銀行明細書から抽出します。

チェック |チェックから関連情報を抽出します。

契約 |契約とパーティーの詳細を抽出します。

クレジットカード |支払いカード情報を抽出します。

請求書 |顧客とベンダーの詳細を抽出します。

支払いスタブ |支払いスタブの詳細を抽出します。

レシート |販売トランザクションの詳細を抽出します。

米国税

米国の統一税 |サポートされている米国の税フォームから抽出します。

米国税 W-2 |課税対象の報酬の詳細を抽出します。

米国税 1098 |1098 バリエーションの詳細を抽出します。

米国税 1099 |1099 バリエーションの詳細を抽出します。

米国税 1040 |1040 バリエーションの詳細を抽出します。

米国住宅ローン

米国住宅ローン1003 |ローン申請の詳細を抽出します。

米国住宅ローン1004 |評価から情報を抽出します。

米国住宅ローン1005 |雇用の検証から情報を抽出します。

米国住宅ローン1008 |ローン転送の詳細を抽出します。

米国住宅ローン開示 |最終決算ローン条件を抽出します。

個人識別

健康保険証 |保険の対象範囲の詳細を抽出します。

ID |検証の詳細を抽出します。

結婚証明書 |認定された結婚情報を抽出します。

請求書 |顧客
とベンダーの詳細を抽出します。

レシート |売上
トランザクションの詳細を抽出します。

ID |識別
と検証の詳細を抽出します。

健康保険証 |医療保険の詳細を抽出します。

名刺 |ビジネス用連絡先の詳細を抽出します。

契約 |契約
とパーティーの詳細を抽出します。

米国税 W-2 |課税対象の
コンポーネントの詳細を抽出します。

米国税 1098 |1098 バリエーションの詳細を抽出します。

カスタム モデル

カスタム モデルは、ラベル付けされたデータセットを使用してトレーニングされ、ユース ケースに固有のフォームやドキュメントから個別のデータを抽出します。 スタンドアロンのカスタム モデルを組み合わせて、構成済みのモデルを作成できます。

ドキュメント フィールド抽出モデル

✔️ ドキュメント フィールド抽出モデルをトレーニングして、ドキュメントからラベル付きフィールドを抽出します。

カスタム ニューラル |混合型ドキュメントからデータを抽出します。

カスタム テンプレート |静的レイアウトからデータを抽出します。

カスタム構成済み |モデルのコレクションを使用してデータを抽出します。

カスタム分類モデル

✔️ カスタム分類子では、抽出モデルを呼び出す前に、ドキュメントの種類を特定します。

カスタム分類子 |抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を識別します。

アドオン機能

ドキュメント インテリジェンスでは、ドキュメント抽出シナリオに応じて有効または無効にできるオプションの機能がサポートされています。

分析機能

モデル ID コンテンツ抽出 クエリ フィールド Paragraphs 段落ロール 選択マーク Tables キーと値のペア Languages Barcodes ドキュメント分析 Formulas* スタイル フォント* 高解像度* 検索可能な PDF
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (各種) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (各種) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - Premium 機能には追加コストが発生します

モデルと開発のオプション

ドキュメント インテリジェンスを使用して、アプリケーションとワークフローのドキュメント処理を自動化し、データドリブン戦略を強化し、ドキュメント検索機能を強化します。 表のリンクを使用して、各モデルの詳細を確認し、開発のオプションを参照します。

Read

Document Intelligence Studio を使用した読み取りモデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済み読み取り ● ドキュメントからテキストを抽出します。
データを抽出します
● 文書
のデジタル化● コンプライアンスと監査
● 翻訳前の手書きメモの処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

レイアウト

Document Intelligence Studio を使用したレイアウト モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済みレイアウト ● ドキュメントからテキストとレイアウト情報を抽出します。
データを抽出します
● 構造別のドキュメントのインデックス作成と取得
● 財務および医療レポートの分析
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般的なドキュメント (2023-10-31 プレビューで非推奨)

Document Intelligence Studio を使用した一般的なドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済みドキュメント ● ドキュメントからテキスト、レイアウト、キーと値のペアを抽出します。
データとフィールドを抽出します
● キー/値ペア抽出
● フォーム処理
● 調査データの収集と分析
ドキュメント インテリジェンス スタジオ
REST API

Invoice

Document Intelligence Studio を使用した請求書モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済み請求書 ● 請求書からのキー情報の抽出.
データとフィールドを抽出します
● 買掛金処理
● 税の自動記録とレポート
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Receipt

Document Intelligence Studio を使用したレシート モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済みレシート ● レシートからキー情報を抽出します。
データとフィールドの抽出.
● レシート モデル v3.0 では、単一ページのホテルレシートの処理がサポートされています。
● 経費管理
● 消費者行動データ分析
● 顧客ロイヤルティ プログラム
● 商品返品処理
● 税記録とレポートの自動化
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

ID (ID)

Document Intelligence Studio を使用した ID (ID) ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-idDocument パスポートと ID カードからキー情報を抽出します。
伝票タイプ.
● 米国の運転免許証から保証、制限、および車両分類を抽出します。
● 顧客 (KYC) 金融サービスガイドラインのコンプライアンスを把握する
● 医療アカウント管理
● ID チェックポイントとゲートウェイ
● ホテルの登録
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Check

Document Intelligence Studio を使用してモデル分析を確認する方法を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
事前構築済みチェック ● checks.
からキー情報を抽出する● データとフィールドを抽出します
● 与信管理
● 自動貸し手管理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

支払いスタブ

Document Intelligence Studio を使用した支払いスタブ モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-paystub ● 支払いスタブからキー情報を抽出します。
データとフィールドを抽出します
● 従業員給与明細の検証
● 雇用に対する不正行為の検出
● 税処理の自動化
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

銀行取引明細書

Document Intelligence Studio を使用した Bank ステートメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-bankStatement ● 銀行取引明細書からキー情報を抽出します。
データとフィールドを抽出します
● 税処理のユース ケース
● 自動会計管理
● 貸方借方管理
● ローン書類処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

健康保険証

Document Intelligence Studio を使用した医療保険カード モデルの分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-healthInsuranceCard.us ● 米国の健康保険証から重要な情報を抽出します。
データとフィールドを抽出します
● カバレッジと適格性検証
● 予測モデリング
● 価値ベースの分析
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

コントラクト モデル

Document Intelligence Studio を使用したコントラクト モデルの抽出を示すスクリーンショット。

モデル ID Description 開発オプション
事前構築済みコントラクト ● 契約契約とパーティの詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

クレジット カード モデル

Document Intelligence Studio を使用したクレジット カード画像モデルの分析を示すスクリーンショット。

モデル ID Description 開発オプション
prebuilt-creditCard ● 契約契約とパーティの詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

結婚証明書モデル

Document Intelligence Studio を使用した結婚証明書ドキュメント モデルの分析を示すスクリーンショット。

モデル ID Description 開発オプション
prebuilt-marriageCertificate.us ● 契約契約とパーティの詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1003 のフォーム

Document Intelligence Studio を使用した米国住宅ローン 1003 ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1003 ● 1003 ローン申請から重要な情報を抽出します。
データとフィールドを抽出します
Fannie Mae と Freddie Mac のドキュメント要件 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1004 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1004 ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1004 ● 1004 件の評価から重要な情報を抽出します。
データとフィールドを抽出します
● Fannie Mae と Freddie Mac のドキュメント要件
● サブジェクトプロパティの市場価値を貸し手/顧客に役立つ均一住宅評価レポート
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1005 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1005 ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1005 ●雇用の1005検証から重要な情報を抽出します。
データとフィールドを抽出します
● Fannie Mae と Freddie Mac のドキュメント要件
● 将来の mortgagor としての資格を決定するための雇用書類の検証
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1008 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1008 ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.1008 統一引受転送概要書から主要な情報を抽出します。
データとフィールドを抽出します。 概要データを使用したローン引受処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン開示フォーム

Document Intelligence Studio を使用した米国住宅ローンのクローズ開示ドキュメント モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-mortgage.us.closingDisclosure 統一引受転送概要書から主要な情報を抽出します。
データとフィールドを抽出します
住宅ローンの最終詳細要件 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 W-2 モデル

Document Intelligence Studio を使用した W-2 モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-tax.us.w2 IRS US W2 税フォーム (2018 年から 2021 年) から重要な情報を抽出します。
● 自動税務書類管理
● 住宅ローン申請処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1098 (およびバリエーション) フォーム

ドキュメント インテリジェンス スタジオで分析された US 1098 税フォームを示すスクリーンショット。

モデル ID Description 開発オプション
prebuilt-tax.us.1098{variation} 1098 形式のバリエーションから重要な情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1099 (およびバリエーション) フォーム

ドキュメント インテリジェンス スタジオで分析された US 1099 税フォームを示すスクリーンショット。

モデル ID Description 開発オプション
prebuilt-tax.us.1099{variation} 1099 形式のバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1040 (およびバリエーション) フォーム

Document Intelligence Studio を使用した米国税 1040 税フォーム モデルの分析を示すスクリーンショット。

モデル ID Description 開発オプション
prebuilt-tax.us.1040{variation} 1040 形式のバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

統一米国税フォーム

モデル ID Description 開発オプション
prebuilt-tax.us サポートされているいずれかの米国税フォームから情報を抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

名刺

Document Intelligence Studio を使用した名刺モデル分析を示すスクリーンショット。

モデル ID Description 自動化のユース ケース 開発オプション
prebuilt-businessCard ● 名刺からキー情報を抽出します。
データとフィールドを抽出します
セールス リードとマーケティング管理 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

カスタム モデルの概要

Document Intelligence Studio を使用したカスタム モデルトレーニングを示すスクリーンショット。

About Description 自動化のユース ケース 開発オプション
カスタム モデル 代表的なトレーニング ドキュメント セットのセットから作成されたモデルに基づいて、フォームとドキュメントから構造化データに情報を抽出します。 ビジネスやユース ケースに固有のフォームとドキュメントから個別のデータを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム ニューラル

Document Intelligence Studio を使用したカスタム ニューラル モデル分析を示すスクリーンショット。

Note

カスタム ニューラル モデルをトレーニングするには、buildMode プロパティを neural に設定します。 詳細については、「 ニューラル モデルのトレーニング」を参照してください。

About Description 自動化のユース ケース 開発オプション
カスタム ニューラル モデル 構造化 (アンケート、アンケート)、半構造化 (請求書、発注書)、および非構造化ドキュメント (コントラクト、レター) からラベル付きデータを抽出します。 構造化されたドキュメントと構造化されていないドキュメントから、テキスト データ、チェックボックス、表形式フィールドを抽出します。 ドキュメント インテリジェンス スタジオ
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム テンプレート

Document Intelligence Studio を使用したカスタム テンプレート モデル分析を示すスクリーンショット。

Note

カスタム テンプレート モデルをトレーニングするには、buildMode プロパティを template に設定します。 詳細については、「 テンプレート モデルのトレーニング」を参照してください。

About Description 自動化のユース ケース 開発オプション
カスタム テンプレート モデル 構造化ドキュメントと半構造化ドキュメントからラベル付き値とフィールドを抽出します。
定義されたビジュアル テンプレートまたは一般的なビジュアル レイアウトとフォームを使用して、高度に構造化されたドキュメントからキー データを抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

カスタム構成済み

About Description 自動化のユース ケース 開発オプション
構成済みのカスタム モデル 作成済みモデルは、カスタム モデルのコレクションを取得し、目的のフォームの種類から構築された 1 つのモデルに割り当てることで作成します。 複数のモデルをトレーニングし、それらをグループ化して、発注書などの同様のフォームの種類を分析する場合に便利です Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム分類モデル

Document Intelligence Studio でのカスタム分類モデルのラベル付けを示すスクリーンショット。

About Description 自動化のユース ケース 開発オプション
構成済み分類モデル カスタム分類モデルでは、レイアウトと言語機能を組み合わせて、入力ファイル内のドキュメントを検出、識別、分類します。 ● 申請フォーム、支払伝票、および銀行明細書を含むローン申請パッケージ
● スキャンされた請求書のコレクション
ドキュメントインテリジェンススタジオ
REST API

Azure AI Document Intelligence は、開発者がインテリジェントなドキュメント処理ソリューションを構築するためのクラウドベースの Azure AI サービスです。 ドキュメント インテリジェンスは、機械学習に基づく光学式文字認識 (OCR) とドキュメント理解テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、キーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化、半構造化、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルの詳細については、概念に関する記事を参照してください。

モデルの種類 モデル名
ドキュメント分析モデル レイアウト 解析モデル
事前構築済みモデル 請求書モデル
レシート モデル
ID (ID) モデル
名刺モデル
カスタム モデル カスタム モデル
構成済みモデル

このコンテンツの適用対象:チェックマークv2.1 | 最新バージョン:青のチェックマークv4.0 (GA)

Document Intelligence のモデルおよび開発オプション

Tip

エクスペリエンスの向上と高度なモデル品質については、 ドキュメント インテリジェンス v3.0 Studio をお試しください。

  • v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
  • v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。

各モデルの詳細を確認し、API 参照を参照するには、次の表のリンクを使用します。

Model Description 開発オプション
レイアウト分析 フォームとドキュメントからのテキスト、選択マーク、テーブル、境界ボックス座標の抽出と分析 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
カスタム モデル 個別のビジネス データとユース ケースに固有のフォームやドキュメントからのデータの抽出と分析 ドキュメント インテリジェンス ラベル付けツール
REST API
サンプル ラベル付けツール
ドキュメント インテリジェンス Docker コンテナー
請求書モデル 売上請求書からのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
レシート モデル 売上領収書の主要な情報の自動データ処理と抽出。 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
ID ドキュメント (ID) モデル 米国の運転免許証と国際パスポートからのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
名刺モデル 名刺からのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー

データのプライバシーとセキュリティ

すべての AI サービスと同様に、ドキュメント インテリジェンスを使用する開発者は、顧客データに関する Microsoft のポリシーに注意する必要があります。 詳細については、「 ドキュメント インテリジェンスのデータ、プライバシー、セキュリティ」を参照してください。