次の方法で共有


カスタムの名前付きエンティティ認識のデータとプライバシー

Von Bedeutung

英語以外の翻訳は便宜上のみ提供されています。 詳細なバージョンについては、このドキュメントの EN-US バージョンを参照してください。

この記事では、カスタムの名前付きエンティティ認識 (NER) によるデータの処理方法に関する概要について説明します。 お客様は、お客様に適用されるすべての法令への準拠を含め、このテクノロジの使用方法と実装方法について責任を負います。 たとえば、次の手順を実行するのはユーザーの責任です。

  • アプリケーションの規制上の義務を満たすために、カスタム NER サービスによってデータが処理および格納される場所を理解します。

  • カスタム NER モデルを構築するための基礎として使用され、運用環境でのカスタム NER のデプロイまたは使用時に評価されるコンテンツに対して、データセット内のコンテンツに必要なすべてのライセンス、所有権、またはその他のアクセス許可があることを確認します。

カスタム NER ではどのようなデータが処理されますか?

カスタム NER は、次のデータを処理します。

  • ユーザーのデータセットとタグ ファイル: カスタム NER プロジェクトを作成するための前提条件として、ユーザーは自分のデータセットを Azure Blob Storage コンテナーにアップロードする必要があります。 タグ ファイルは、ユーザーのタグ付けされたエンティティへの参照を含む JSON 形式のファイルです。 ユーザーのデータセットにはトレーニング セットとテスト セットが含まれ、開発者はタグ ファイルで事前に定義できます。また、トレーニング中にランダムに選択できます。 トレーニング セットとタグ ファイルはトレーニング中に処理され、カスタム NER モデルが作成されます。 テスト セットは後でトレーニング済みモデルによって処理され、そのパフォーマンスが評価されます。

  • カスタム NER モデル: モデルをトレーニングするユーザーの要求に基づいて、カスタム NER は指定されたタグ付きデータを処理して、トレーニング済みのモデルを出力します。 ユーザーは、新しいモデルをトレーニングするか、既存のモデルを上書きすることを選択できます。 その後、トレーニング済みのモデルがサービス側に格納され、モデル評価の処理に使用されます。 開発者は、モデルのパフォーマンスに関するコンテンツを提供した後、使用するためにモデルをデプロイするよう要求します。 デプロイされたモデルはサービス側にも格納されます。これは、Analyze API を使用して予測に対するユーザーの要求を処理するために使用されます。

  • 抽出のために送信されるデータ: これは、カスタム NER モデルによるエンティティ抽出のために処理される、 Analyze API を介してクライアント アプリケーションから送信されるユーザーのテキストです。 処理されたデータの出力には、抽出されたエンティティとその信頼度スコアが含まれます。 これは、ユーザーの要求を満たすアクションを実行するためにクライアントのアプリケーションに返されます。

トレーニング、テスト、または抽出のためにアップロードされたユーザーのデータは、顧客データです。 カスタムNERは、製品改善のために一般的な機械学習モデルを改善するために顧客データを使用しません。 サービス監視の目的で、使用されている API や各サブスクリプションとリソースからの呼び出しの数などの集計テレメトリを使用します。

カスタム NER ではデータはどのように処理されますか?

次の図は、データの処理方法を示しています。

データの処理方法を示す図。

データはどのように保持され、どのような顧客コントロールを利用できますか?

カスタム NER は、GDPR を目的としたデータ プロセッサです。 GDPR ポリシーに準拠して、カスタム NER ユーザーは、顧客データを表示、エクスポート、または削除するためのフル コントロールを持ちます。 ユーザーは、 Language Studio を使用するか、Language API を使用してプログラムでこれらのアクションを実行できます。

データは、Azure ストレージ アカウントにのみ格納されます。 カスタム NER には、トレーニングと評価中にのみ、そこから読み取るアクセス権があります。 カスタム NER では、予測 API を使用して抽出タスクのために顧客から送信されたデータはログに記録または格納されません。

顧客コントロールには次のものが含まれます。

  • モデルをトレーニングするための前提条件としてユーザーによって提供されるタグ付きデータは、作成時にプロジェクトに接続されている顧客の Azure ストレージ アカウントに保存されます。 お客様は、Language Studio を使用していつでもタグを編集または削除できます。

  • カスタム NER プロジェクト メタデータは、顧客がプロジェクトを削除するまで、サービス側に格納されます。 プロジェクトを作成するときに、プロジェクト名、説明、言語、接続された BLOB コンテナーの名前、タグ ファイルの場所などのメタデータ フィールドを入力します。

  • トレーニング済みのカスタム NER モデルは、顧客が削除するまで、サービスの Azure ストレージ アカウントに格納されます。 ユーザーがモデルを再トレーニングするたびに、モデルは上書きされます。

  • デプロイされたカスタム NER モデルは、顧客がデプロイを削除するか、モデル自体を削除するまで、サービスの Azure ストレージ アカウントに保持されます。 モデルは、ユーザーが同じデプロイ名にデプロイするたびにオーバーライドされます。

顧客のデータのセキュリティ

Azure サービスは、クラウド内の顧客データを保護するための適切な技術的および組織的な手段を維持しながら実装されます。

Microsoft のセキュリティ コミットメントの詳細については、 Microsoft セキュリティ センターを参照してください。

次のステップ