非構造化ドキュメント処理の概要

注:

2025 年 12 月まで、従量課金制を設定している場合は、限定された量の非構造化ドキュメント処理やその他の選択されたコンテンツサービスを無償で試すことができます。詳細と制限事項については、「従量課金制サービスを試す」を参照してください。

非構造化ドキュメント処理モデル (教育方法) を使用して、ファイルを自動的に分類し、情報を抽出します。文字やコントラクトなどの非構造化ドキュメントに最適です。

注:

Microsoft は、モデルのトレーニングと処理に使用するデータのプライバシーと所有権を尊重します。お客様のorganizationのデータは、AI モデル、大言語モデル、またはその他のモデルをトレーニングするために Microsoft によって使用または転送されることはありません。データは、organizationのテナント内に安全に保持されます。詳細については、「 Microsoft データ保護とプライバシー」を参照してください。

非構造化モデルの概要

非構造化ドキュメント処理モデルでは、人工知能 (AI) を使用してドキュメントの情報を分析および抽出します。これらのモデルは、文書の分類と抽出するデータの両方を決定するために、フレーズまたはパターンに基づいて識別可能なテキストに依存します。

注:

ドキュメント処理サービスとシナリオの例を使用する方法の詳細については、「ドキュメント処理とシナリオの導入を促進する」および「ドキュメント処理のユースケース」を参照してください。

SharePoint コンテンツセンターで非構造化ドキュメント処理モデルを作成および管理します。 SharePoint ドキュメントライブラリにモデルを適用すると、抽出された情報を格納するための列を含むコンテンツタイプに関連付けられます。新しいコンテンツタイプを作成することも、SharePoint コンテンツタイプギャラリーから既存のコンテンツタイプを使用することもできます。

注:

読み取り専用またはシールされたコンテンツタイプは更新できないため、モデルでは使用できません。

非構造化ドキュメント処理モデルに分類子と抽出器を追加して、次のアクションを実行します。

分類子は、ドキュメントライブラリにアップロードされたドキュメントを識別および分類するために使用されます。たとえば、分類子を "トレーニング" して、ライブラリにアップロードされているすべての契約更新ドキュメントを識別させることができます。契約更新コンテンツタイプは、分類子を作成するときにユーザーが定義します。
抽出子は、これらのドキュメントから情報を引き出します。たとえば、ドキュメントライブラリで識別される契約更新ドキュメントごとに、各ドキュメントの サービス開始日 と クライアント を示す列が表示されます。

サンプルファイルを使用して、分類子と抽出器をトレーニングしてテストします。これらのファイルは、モデルがデータを識別して抽出するときに検索する内容を学習するのに役立ちます。たとえば、organizationの実際の契約更新ドキュメントを使用して、契約更新モデルをトレーニングします。これらのファイルを使用して、モデルの精度を検証することもできます。

モデルを公開したら、コンテンツセンターを使用して、アクセスできる SharePoint ドキュメントライブラリにモデルを適用します。

要件と制限事項

このモデルを選択するときに考慮すべき要件については、非構造化ドキュメント処理の要件と制限事項に関するページを参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2025-08-09

次の方法で共有

非構造化ドキュメント処理の概要

非構造化モデルの概要

要件と制限事項

フィードバック

その他のリソース