トレーニング可能な分類子
この分類方法は、手動または自動のパターンマッチングメソッドを使用して簡単に識別できないコンテンツに適しています。 この分類方法は、分類子を使用して、アイテム内にある要素 (パターン マッチング) ではなく、アイテムの内容に基づいて項目を識別するように設計されています。 分類子は、検出するコンテンツの数百の例を見て、コンテンツの種類を識別する方法を学習します。
注:
プレビュー: コンテンツ エクスプローラーでトレーニング可能な分類子を表示するには、フィルター パネルで [ トレーニング可能な分類子] を展開します。 トレーニング可能な分類子は、ラベル付けを必要とせずに、SharePoint、Teams、OneDrive で見つかったインシデントの数を自動的に表示します。 この機能を使用しない場合は、Microsoft サポートで要求を提出する必要があります。 この要求により、コンテンツ エクスプローラー内のラベル付けポリシーで使用されていない機密データの表示が無効になります。 データのスキャンを無効にすることもできます。 スキャンがオフになっている場合、これらの分類子を使用した秘密度ラベル付けと DLP ポリシーは機能しません。
分類子を使用できる場所
次の条件として分類子を使用します。
- 秘密度ラベルを使用した Office ファイルの自動ラベル付け
- 条件に基づくアイテム保持ラベル ポリシーの自動的な適用
- 通信コンプライアンス では、Microsoft が提供するトレーニング可能な分類子のみがサポートされます。
- 秘密度ラベルの条件。 (「 Microsoft 365 データに秘密度ラベルを自動的に適用する」を参照してください)
- データ損失防止
重要
分類子は、暗号化されていないアイテムでのみ機能します。
分類子のタイプ
-
Microsoft が提供する事前トレーニング済み分類子 - Microsoft は、トレーニングなしで使用を開始できる複数の分類子を作成し、事前トレーニングしました。 これらの分類子は、
Ready to useの状態で表示されます。 - カスタムトレーニング可能な分類子 - 事前トレーニング済みの分類子がカバーするものを超えてコンテンツを識別して分類する必要がある場合は、独自の分類子を作成してトレーニングできます。
すべての事前トレーニング済み分類子の完全な一覧については、「 トレーニング可能な分類子の定義」を参照してください。
カスタム分類子
重要
言語の制限: カスタム分類子のサポートは英語に制限されています。
Microsoft が提供する事前トレーニング済み分類子がニーズを満たしていない場合は、独自の分類子を作成してトレーニングできます。 独自の作成に関連する作業は増えますが、organizationのニーズに合わせて調整した方が適切です。
カスタムトレーニング可能な分類子を作成するには、まず、カテゴリに確実に含まれる 1 つの例セットと、間違いなく存在しない別の例セットを提供することから始めます。 Microsoft Purview はこれらの例を処理し、分類子は、特定の項目が構築中のカテゴリに分類されるかどうかを予測します。 次に、結果を確認し、真陽性、真陰性、偽陽性、偽陰性を並べ替えて、予測の精度を高めます。
分類子を発行すると、SharePoint、Exchange、OneDrive などの場所のアイテムを並べ替え、コンテンツを分類します。
たとえば、次のトレーニング可能な分類子を作成できます。
- 法的書類 - 弁護士クライアント特権、決算セット、作業明細書など
- 戦略的ビジネスドキュメント - プレスリリース、合併と買収、取引、ビジネスまたはマーケティング計画、知的財産、特許、設計ドキュメントなど
- 価格情報 - 請求書、価格見積もり、作業指示書、入札ドキュメントなど
- 財務情報 - 組織の投資、四半期または年次の結果など
カスタム分類子を作成するためのプロセス フロー
次のフロー図は、リテンション ポリシーや通信監督など、コンプライアンス ソリューションで使用する分類子を作成して公開するプロセスを示しています。 カスタムトレーニング可能な分類子の作成の詳細については、「 トレーニング可能な分類子の概要」を参照してください。
ヒント
シード データの新しい SharePoint サイトとフォルダーを作成する場合は、そのシード データを使用するトレーニング可能な分類子を作成する前に、その場所のインデックスを作成するために少なくとも 1 時間を許可します。
分類子の再トレーニング
発行されたカスタム分類子の再トレーニングはサポートされていません。 発行したトレーニング可能な分類子の精度を向上させる必要がある場合は、分類子を削除し、 より大きなサンプル セットからやり直します。
発行されていない分類子の精度を向上させるには、テスト結果を確認し、追加のデータでデータ セットを更新し、トレーニングを再開します。