保護された材料検出フィルターは、大規模言語モデル (LLM) の出力をスキャンして、既知の保護されたマテリアルを識別してフラグを設定します。 これは、著作権で保護されたテキストやコードと密接に一致するコンテンツの生成を組織が防ぐのに役立ちます。
保護された素材テキスト フィルターは、大きな言語モデルが出力する可能性がある既知のテキスト コンテンツ (曲の歌詞、記事、レシピ、選択した Web コンテンツなど) にフラグを設定します。
保護されたマテリアル コード フィルターは、大きな言語モデルが出力する可能性がある保護されたコード コンテンツにフラグを設定します。 これは、既知の GitHub リポジトリにあるコンテンツであり、ソフトウェア ライブラリ、ソース コード、アルゴリズム、およびその他の独自のプログラミング コンテンツが含まれます。
Important
保護された材料の検出、接地検出、およびカスタム カテゴリ (標準) のコンテンツ フィルタリング モデルは、英語でのみ機能します。
その他のコンテンツ フィルタリング モデルは、中国語、英語、フランス語、ドイツ語、スペイン語、イタリア語、日本語、ポルトガル語の言語で特別にトレーニングおよびテストされます。 しかし、これらのサービスはその他の多くの言語でも機能します (品質は言語によって異なる場合があります)。 いずれの場合も、独自のテストを実行して、アプリケーションに対して動作することを確認する必要があります。
注意事項
Content Safety サービスのコード スキャナー/インデクサーは、2023 年 4 月 6 日までのみ最新です。 この日付より後に GitHub に追加されたコードは検出されません。 コード用の保護されたマテリアルを使用して最近のコードの本文を検出する場合は、お客様の独自の判断で使用してください。
保護されたマテリアルの開示を検出して防止することで、組織は知的財産法に確実に準拠し、コンテンツの独創性を維持し、評判を保護することができます。
このガイドでは、保護済み素材の API が検出するコンテンツの種類について詳しく説明します。
ユーザー シナリオ
クリエイティブ ライティングのためのコンテンツ生成プラットフォーム
- シナリオ: クリエイティブな文章作成 (ブログ投稿、ストーリー、マーケティング コピーなど) に生成 AI を使用するコンテンツ生成プラットフォームに、テキスト用保護済み素材機能を統合して、著作権で保護された既知の素材と密接に一致するコンテンツの生成を防ぎます。
- ユーザー: プラットフォーム管理者とコンテンツ作成者。
- アクション: プラットフォームで、Azure AI Content Safety を使用して、AI によって生成されたコンテンツをユーザーに提供される前にスキャンします。 生成されたテキストが保護された素材と一致する場合、コンテンツにフラグが設定され、ブロックまたは変更します。
- 結果: プラットフォームは潜在的な著作権侵害を回避し、生成されたすべてのコンテンツがオリジナルであり、知的財産法に確実に準拠するようにします。
ソーシャル メディア コンテンツの自動作成
- シナリオ: デジタル マーケティング エージェンシーは、生成 AI を使用してソーシャル メディア コンテンツの作成を自動化します。 このエージェンシーは、テキスト用保護済み素材機能を統合して、曲の歌詞や書籍からの抜粋など、著作権で保護されたテキストを含んだ AI によって生成されたコンテンツを発行しないようにします。
- ユーザー: デジタル マーケティング担当者とソーシャル メディア マネージャー。
- アクション: エージェンシーは、Azure AI Content Safety を使用して、AI によって生成されたすべてのソーシャル メディア コンテンツに、保護された素材のデータベースに対する一致がないかを確認します。 一致するコンテンツには変更のフラグが設定されるか、投稿がブロックされます。
- 結果: エージェンシーは、著作権法への準拠を維持し、承認されていないコンテンツの投稿に関連する評判のリスクを回避します。
AI 支援のニュース作成
- シナリオ: 報道機関では、生成 AI を使用して、ジャーナリストの記事やレポートの作成を支援します。 コンテンツに、保護されたニュース記事やその他の著作権で保護された資料が誤って複製されないように、報道機関はテキスト用保護済み素材機能を使用します。
- ユーザー: ジャーナリスト、編集者、コンプライアンス責任者。
- アクション: 報道機関は、Azure AI Content Safety をコンテンツ作成ワークフローに統合します。 AI によって生成された下書きに保護されたコンテンツがないか、査読レビューに提出する前に自動的にスキャンします。
- 結果: 報道機関は偶発的な著作権侵害を防ぎ、そのレポートの整合性と独創性を維持します。
AI を使用してコンテンツを生成する E ラーニング プラットフォーム
- シナリオ: E ラーニング プラットフォームでは、生成 AI を使用して、概要、クイズ、説明テキストなどの教育コンテンツを生成します。 プラットフォームでは、テキスト用保護済み素材機能を使用して、生成されたコンテンツに教科書、記事、学術論文の保護された素材が含まれていないことを確認します。
- ユーザー: 教育コンテンツ作成者およびコンプライアンス責任者。
- アクション: プラットフォームに、AI によって生成された教材をスキャンする機能を統合します。 既知の保護された学術資料と一致するコンテンツがある場合は、変更のフラグが設定されるか、自動的に削除されます。
- 結果: プラットフォームは教育コンテンツの品質を維持し、著作権法に準拠し、AI によって生成された学習リソースで保護された資料を使わないようにします。
AI を利用したレシピ ジェネレーター
- シナリオ: 食品とレシピの Web サイトでは、生成 AI を使用して、ユーザーの好みに基づいて新しいレシピを生成します。 有名な料理本や Web サイトの保護されたレシピと一致するコンテンツを生成しないように、Web サイトにテキスト用保護済み素材機能が統合されています。
- ユーザー: コンテンツ マネージャーとプラットフォーム管理者。
- アクション: Web サイトでは、Azure AI Content Safety を使用して、AI によって生成されたレシピを既知の保護済みコンテンツのデータベースに照らし合わせます。 生成されたレシピが保護されたレシピと一致する場合、フラグが設定され、変更するかブロックします。
- 結果: Web サイトは、AI によって生成されたすべてのレシピがオリジナルであることを確認し、著作権侵害のリスクを軽減します。
保護された素材テキストの例
保護されたマテリアルのテキスト検出の主要カテゴリの詳細については、この表を参照してください。 API を呼び出すと、4 つのカテゴリすべてが適用されます。
カテゴリ | Scope | 許容範囲内と見なされる | 有害と見なされる |
---|---|---|---|
レシピ | レシピに関連する著作権で保護されたコンテンツ。 他の有害または機密テキストは、レシピの IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|
Web コンテンツ | URL ドメイン名に webmd.com を含むすべての Web サイト。 選択した Web コンテンツに関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。 他の有害または機密テキストは、選択した Web コンテンツの害と交差しない限り、このタスクの範囲外です。 |
|
|
News | ニュースに関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。 他の有害または機密テキストは、ニュースの IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|
歌詞 | 曲に関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。 他の有害または機密テキストは、曲の IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|