次の方法で共有


事前構築済みドキュメント処理の概要

注:

2025 年 12 月まで、従量課金制を設定している場合は、限られた量の事前構築済みドキュメント処理やその他の選択されたコンテンツ サービスを無償で試すことができます。 詳細と制限事項については、「 従量課金制サービスを試す」を参照してください。

ドキュメント処理では、 カスタム モデルの使用に加えて、ドキュメントからの情報抽出を自動化するのに役立つ事前構築済みのモデルが用意されています。トレーニングは必要ありません。 これらのモデルは使用する準備が整っており、一般的なドキュメントの種類とデータ パターンを認識するように設計されているため、すばやく開始して効率的にスケーリングできます。

注:

Microsoft は、モデルのトレーニングと処理に使用するデータのプライバシーと所有権を尊重します。 お客様のorganizationのデータは、AI モデル、大言語モデル、またはその他のモデルをトレーニングするために Microsoft によって使用または転送されることはありません。 データは、organizationのテナント内に安全に保持されます。 詳細については、「 Microsoft データ保護とプライバシー」を参照してください。

事前構築済みモデルの概要

事前構築済みのドキュメント処理では、一般的なドキュメントの種類を認識し、構造化された情報を抽出するように既に構成されている事前トレーニング済みモデルが使用されます。 カスタム モデルをゼロから構築する代わりに、事前構築済みのモデルから開始し、organizationのニーズに固有のフィールドを追加して調整できます。

これらのモデルは、光学式文字認識 (OCR) とディープ ラーニングを組み合わせて、定義済みのテキストフィールドとデータ フィールドを識別して抽出します。 開始するには、事前構築済みのモデルを使用してサンプル ファイルを分析します。 次に、シナリオに関連するフィールドを選択します。 モデルで必要なフィールドが検出されない場合は、別のファイルを分析してみてください。

他のモデルと同様に、事前構築済みのモデルは コンテンツ センターで作成および管理されます。 SharePoint ドキュメント ライブラリにモデルを適用すると、コンテンツ タイプにリンクされ、抽出された情報を格納するための列が含まれます。

モデルを発行したら、コンテンツ センターを使用して、アクセスできる任意の SharePoint ドキュメント ライブラリに適用します。

使用可能な事前構築済みモデル

現時点では、 契約請求書領収書機密情報および単純なドキュメントの 5 つの事前構築済み処理モデルを使用できます。

  • コントラクト 事前構築済みの コントラクト処理モデル は、コントラクト ドキュメントからキー情報を分析および抽出します。 API は、さまざまな形式でコントラクトを分析し、クライアント名と住所、契約期間、更新日などの主要なコントラクト情報を抽出します。

  • 請求書 請求書処理モデルは、売上請求書から重要な情報を分析および抽出します。 API は、さまざまな形式で請求書を分析し、顧客名、請求先住所、期日、支払金額などの 主要な請求書情報を抽出 します。

  • 領収書 レシート処理モデルは、売上受領書から重要な情報を分析および抽出します。 API は、印刷されたレシートと手書きの領収書を分析し、マーチャント名、マーチャント電話番号、取引日、税金、取引合計などの キーレシート情報を抽出 します。

  • 機密情報 機密情報モデルは、ドキュメントから重要な情報を分析、検出、抽出します。 API は、ドキュメントをさまざまな形式で分析し、個人と財務の識別番号、物理的および電子メール アドレス、電話番号などの 重要な機密情報を検出して抽出します。

  • 単純なドキュメント シンプルなドキュメント処理モデルは、基本的な構造化ドキュメントからキーと値のペア、選択マーク、名前付きエンティティを抽出するための柔軟で事前トレーニングされたソリューションを提供します。 このモデルでは、バーコードと言語検出もサポートされています。

追加の事前構築済みモデルは、今後のリリースで利用できるようになります。

要件と制限事項

このモデルを選択するときに考慮すべき要件については、 事前構築済みのドキュメント処理の要件と制限事項に関するページを参照してください。