注:
2025 年 12 月まで、従量課金制を設定している場合は、限定された量の非構造化ドキュメント処理やその他の選択されたコンテンツ サービスを無償で試すことができます。 詳細と制限事項については、「 従量課金制サービスを試す」を参照してください。
非構造化ドキュメント処理モデル (教育方法) を使用して、ファイルを自動的に分類し、情報を抽出します。 文字やコントラクトなどの非構造化ドキュメントに最適です。
注:
Microsoft は、モデルのトレーニングと処理に使用するデータのプライバシーと所有権を尊重します。 お客様のorganizationのデータは、AI モデル、大言語モデル、またはその他のモデルをトレーニングするために Microsoft によって使用または転送されることはありません。 データは、organizationのテナント内に安全に保持されます。 詳細については、「 Microsoft データ保護とプライバシー」を参照してください。
非構造化モデルの概要
非構造化ドキュメント処理モデルでは、人工知能 (AI) を使用してドキュメントの情報を分析および抽出します。 これらのモデルは、文書の分類と抽出するデータの両方を決定するために、フレーズまたはパターンに基づいて識別可能なテキストに依存します。
注:
ドキュメント処理サービスとシナリオの例を使用する方法の詳細については、「ドキュメント処理とシナリオの導入を促進する」および「ドキュメント処理のユース ケース」を参照してください。
SharePoint コンテンツ センターで非構造化ドキュメント処理モデルを作成および管理します。 SharePoint ドキュメント ライブラリにモデルを適用すると、抽出された情報を格納するための列を含むコンテンツ タイプに関連付けられます。 新しいコンテンツ タイプを作成することも、SharePoint コンテンツ タイプ ギャラリーから既存のコンテンツ タイプを使用することもできます。
注:
読み取り専用またはシールされたコンテンツ タイプは更新できないため、モデルでは使用できません。
非構造化ドキュメント処理モデルに 分類子 と 抽出器 を追加して、次のアクションを実行します。
分類子は、ドキュメント ライブラリにアップロードされたドキュメントを識別および分類するために使用されます。 たとえば、分類子を "トレーニング" して、ライブラリにアップロードされているすべての契約更新ドキュメントを識別させることができます。 契約更新コンテンツ タイプは、分類子を作成するときにユーザーが定義します。
抽出子は、これらのドキュメントから情報を引き出します。 たとえば、ドキュメント ライブラリで識別される契約更新ドキュメントごとに、各ドキュメントの サービス開始日 と クライアント を示す列が表示されます。
サンプル ファイルを使用して、分類子と抽出器をトレーニングしてテストします。 これらのファイルは、モデルがデータを識別して抽出するときに検索する内容を学習するのに役立ちます。 たとえば、organizationの実際の契約更新ドキュメントを使用して、契約更新モデルをトレーニングします。 これらのファイルを使用して、モデルの精度を検証することもできます。
モデルを公開したら、コンテンツセンターを使用して、アクセスできる SharePoint ドキュメントライブラリにモデルを適用します。
要件と制限事項
このモデルを選択するときに考慮すべき要件については、 非構造化ドキュメント処理の要件と制限事項に関するページを参照してください。