合成音声の開示設計パターン

2025-06-26

Von Bedeutung

英語以外の翻訳は便宜上のみ提供されています。バインドのバージョンについては、このドキュメントの EN-US バージョンを参照してください。

テキスト読み上げアバターエクスペリエンスに適したレベルの開示を決定したので、潜在的な設計パターンを調べるのに適したタイミングです。

概要

合成音声エクスペリエンスには、さまざまな開示設計パターンを適用できます。開示評価の結果が "高開示" の場合は、明示的な開示をお勧めします。これは、合成音声の起源を完全に伝えるということです。暗黙的な開示には、必要な開示レベルが高いか低いかに関係なく、音声エクスペリエンスに役立つ手掛かりと相互作用パターンが含まれます。

開示パターンのスペクトルの図。

カテゴリ	例示
明示的な開示パターン	明確な概要口頭による明確な紹介明示的署名カスタマイズと調整保護者による開示音声がどのように行われたかについて詳しく知る機会を提供する
暗黙的な開示パターン	機能の開示暗黙的な手掛かりとフィードバック会話の透明性

合成音声に適用されるパターンを直接参照するには、次のグラフを使用します。このグラフのその他の条件の一部は、シナリオにも適用される場合があります。

合成音声エクスペリエンスが…	推奨事項	デザインパターン
徹底した開示が必要	少なくとも 1 つの明示的なパターンと暗黙的な手掛かりを前もって使用して、ユーザーが関連付けを構築できるようにします。	明示的な開示暗黙的な開示
低開示を要求する	開示は最小限または不要ですが、一部の暗黙的なパターンの恩恵を受ける可能性があります。	機能の開示会話の透明性
高いレベルのエンゲージメントを持つ	長期的に構築し、ユーザー体験に沿って開示するための複数のエントリポイントを提供します。オンボーディングエクスペリエンスを使用することを強くお勧めします。	明確な概要カスタマイズと調整機能の開示
主要な対象ユーザーとして子を含めます	主な開示対象ユーザーとして親を対象とし、子どもに効果的に開示を伝えることができることを確認します。	保護者による開示口頭による明確な紹介暗黙的な開示会話の透明性
主な対象ユーザーとして視覚障害のあるユーザーや弱視の方を含む	すべてのユーザーを含め、あらゆる形式の視覚的開示に、代替テキストまたは効果音が関連付けられていることを確認します。コントラスト比と表示サイズに関するアクセシビリティ標準に準拠します。聴覚キューを使用して開示を伝えます。	口頭による明確な紹介聴覚の手がかり触覚手がかり会話の透明性アクセシビリティ標準
画面レス、デバイスレス、または対話のプライマリモードまたは唯一モードとして音声を使用する	聴覚キューを使用して開示を伝えます。	口頭による明確な紹介聴覚の手がかり
複数のユーザー/リスナーが含まれる可能性があります (複数の世帯のパーソナルアシスタントなど)	さまざまなユーザーコンテキストと理解レベルに留意し、ユーザー体験で開示する複数の機会を提供します。	わかりやすい紹介 (2 回目以降のユーザー) 音声がどのように行われたかについて詳しく知る機会を提供する会話の透明性

明示的な開示

合成音声エクスペリエンスでハイディスクロージャーが必要な場合は、次の明示的なパターンの少なくとも 1 つを使用して、合成の性質を明確に示すのが最善です。

透明な紹介

音声エクスペリエンスが始まる前に、音声の起源とその機能について完全に透過的にデジタルアシスタントを導入します。このパターンを使用する最適なタイミングは、新しいユーザーをオンボードするとき、または戻ってくるユーザーに新機能を導入するときです。導入時に暗黙的な手掛かりを実装すると、ユーザーはデジタルエージェントの合成の性質に関するメンタルモデルを形成するのに役立ちます。

初めてのユーザーエクスペリエンス

初回実行時の透過的な導入の図。
合成音声は、新しいユーザーのオンボード中に導入されます。

推奨事項

音声が人為的であることを説明する (例: "digital")
エージェントが実行できる機能について説明する
音声の配信元を明示的に指定する
合成音声の詳細を確認するためのエントリポイントを提供する

ユーザーエクスペリエンスを返す

ユーザーがオンボードエクスペリエンスをスキップした場合は、ユーザーが初めて音声をトリガーするまで、Transparent Introduction エクスペリエンスへのエントリポイントを引き続き提供します。

リターンユーザーエクスペリエンス中の透過的な導入の図。
合成音声エクスペリエンスへの一貫したエントリポイントを提供します。ユーザー体験の任意の時点で初めて音声をトリガーするときに、ユーザーがオンボードエクスペリエンスに戻れるようにします。

音声による透過的な紹介

デジタルアシスタントの音声の起源を示す音声プロンプトは、開示を実現するのに十分な明示的な内容です。このパターンは、音声が使用可能な唯一の対話モードであるハイディスクロージャーシナリオに最適です。

口頭による明確な紹介の図。
ユーザー体験において、人物の声をすでに紹介または属性付けしている瞬間がある場合は、透明な導入を使用してください。

一人称での口頭による透明な紹介の図。
さらに透明性を高める目的で、声優は合成音声の起源を最初の人物に開示できます。

明示的署名

ユーザーがオーディオプレーヤーまたは対話型コンポーネントと対話して音声をトリガーする場合は、このパターンを使用します。

ニュースメディアにおける明示的なバイラインの図。
明示的なバイラインは、音声の出典を明記することです。

推奨事項

合成された音声の詳細を確認するためのエントリポイントを提供する

カスタマイズと調整

デジタルアシスタントが応答する方法 (つまり、音声がどのように聞こえるか) をユーザーに制御できるようにします。ユーザーが自分の用語で特定の目標を念頭に置いてシステムと対話する場合、定義上、実際の人ではないことを既に理解しています。

ユーザーコントロール

合成音声エクスペリエンスに有意かつ顕著な影響を与える選択肢を提供します。

ユーザー設定の図。
ユーザー設定を使用すると、ユーザーはエクスペリエンスをカスタマイズして向上させることができます。

推奨事項

ユーザーが音声をカスタマイズできるようにする (言語と音声の種類の選択など)
独自の音声 (音声調整、カスタムコマンドなど) に応答するようにシステムに教える方法をユーザーに提供する
ユーザーが生成した操作やコンテキストに応じた対話 (リマインダーなど) を最適化する

ペルソナのカスタマイズ

デジタルアシスタントの音声をカスタマイズする方法を提供します。音声が著名人または広く認識可能な人物に基づいている場合は、ユーザーが音声をプレビューするときに、ビジュアルと音声の両方の概要を使用することを検討してください。

音声のカスタマイズの図。
音声のセットから選択する機能を提供すると、人工の性質を伝えるのに役立ちます。

推奨事項

ユーザーが各音声のサウンドをプレビューできるようにする
各音声の紹介は正確なものを使用します
合成された音声の詳細を確認するためのエントリポイントを提供する

保護者による開示

COPPA 規制に準拠するだけでなく、主な対象ユーザーが小さなお子様で、露出レベルが高い場合は、保護者に開示を提供します。機密性の高い使用の場合は、成人が合成音声の使用を認めるまでエクスペリエンスを得ることを検討してください。子供にメッセージを伝えるよう親に勧めます。

親向けの開示図。
親向けに最適化された透過的な導入により、子供が音声とやり取りする前に、大人が音声の合成の性質を認識することが保証されます。

推奨事項

開示対象の主な対象ユーザーとして親を対象にする
子供に開示を伝えるよう親に勧める
合成された音声の詳細を確認するためのエントリポイントを提供する
両親に簡単な「セーフガード」の質問をして、開示を読んだことを示すことで、エクスペリエンスをゲートする

音声がどのように作成されたかを詳しく学ぶ機会を提供する

状況依存のエントリポイントを、合成音声テクノロジに関する詳細情報を提供するページ、ポップアップ、または外部サイトに提供します。たとえば、オンボーディング中や会話中にユーザーが詳細情報を求めたときに、リンクを表示してさらに学べるようにすることができます。

詳細については、エントリポイントの図を参照してください。
合成された音声の詳細を確認する機会を提供するエントリポイントの例。

ユーザーが合成音声に関する詳細情報を要求したら、主な目標は、合成音声の起源についてユーザーを教育し、テクノロジについて透過的になることです。

合成音声に関する詳細情報をユーザーに提供する図。
詳細については、外部サイトのヘルプサイトを参照してください。

推奨事項

複雑な概念を簡素化し、法律や技術専門用語の使用を避ける
プライバシーおよび利用規約にこのコンテンツを埋め込まない
コンテンツを簡潔に保ち、使用可能な場合は画像を使用する

暗黙的な開示

一貫性は、ユーザー体験全体を通じて暗黙的に開示を実現するための鍵です。デバイス間および対話モード間で視覚的および聴覚的な手掛かりを一貫して使用すると、暗黙的なパターンと明示的な開示の間の関連付けを構築するのに役立ちます。

暗黙的なキューの整合性の図。

暗黙的な手掛かりとフィードバック

擬人化は、エージェントの実際の視覚的表現から、音声、音、光のパターン、バウンスする形状、デバイスの振動まで、さまざまな方法で現れます。ペルソナを定義するときは、人間のようなアバターを目指すのではなく、暗黙的な手掛かりとフィードバックパターンを活用します。これは、より明示的な開示の必要性を最小限に抑える 1 つの方法です。

視覚的な手掛かりとフィードバックの図。
これらの手掛かりは、あまりにも人間のようにならずにエージェントを擬人化するのに役立ちます。また、時間の経過と同時に一貫して使用すると、効果的な開示メカニズムになる可能性もあります。

次の種類のキューを組み込む場合は、エクスペリエンスのさまざまな対話モードを検討してください。

カテゴリ	例示
視覚的な手掛かり	アバター応答性の高いリアルタイムキュー (アニメーションなど) 画面以外のキュー (デバイス上のライトやパターンなど)
聴覚の手がかり	Sonicon (例: 短い独特の音、一連の音楽ノート)
触覚の手掛かり	振動

機能の開示

デジタルアシスタントの能力に対する正確な期待を設定することで、暗黙的に開示を実現できます。ユーザーがデジタルアシスタントと対話する方法を学習し、エクスペリエンスの初期段階で合成音声の詳細を学習するためのコンテキストヘルプを提供できるように、サンプルコマンドを提供します。

作成できる会話に対する既定の応答の例の図。

会話の透明性

会話が予期しないパスに入った場合は、期待値のリセット、透明性の強化、ユーザーの成功パスへの誘導に役立つ既定の応答を作成することを検討してください。会話でも明示的な開示を使用する機会があります。

予期しないパスの処理の図。
エージェントに向けられたオフタスクまたは "個人的な" 質問は、エージェントの合成の性質をユーザーに思い出させ、適切に関与させるか、実際の人にリダイレクトするようにユーザーを誘導する良い時期です。

本題から外れたな質問に対処する図。

開示するタイミング

ユーザー体験全体を通じて、多くの開示の機会があります。最初の使用、2 回目の使用、n 番目の使用...を設計しますが、システムが間違いを犯した場合や、ユーザーがエージェントの機能の制限を検出したときなど、透明性を強調するために"失敗" の瞬間も受け入れます。

ユーザー体験全体の開示機会の図。
さまざまな開示機会を強調する標準的なデジタルアシスタントユーザー体験の例。

事前

開示のための最適な瞬間は、人が合成音声と対話する最初の時間です。  個人用音声アシスタントのシナリオでは、初回セットアップや、ユーザーが初めてエクスペリエンスを体験する際のことを指します。他のシナリオでは、合成音声が初めて Web サイト上のコンテンツを読み取るか、ユーザーが初めて仮想キャラクターと対話する場合があります。

明確な概要
機能の開示
カスタマイズと調整
暗黙の手がかり

要求に応じて

ユーザーは、追加の情報に簡単にアクセスし、基本設定を制御し、要求されたときにユーザー体験中の任意の時点で透過的な通信を受け取ることができる必要があります。

音声がどのように行われたかについて詳しく知る機会を提供する
カスタマイズと調整
会話の透明性

継続的に

ユーザーエクスペリエンスを継続的に強化する暗黙的な設計パターンを使用します。

機能の開示
暗黙の手がかり

システムが失敗した場合

穏やかに失敗する機会として開示を利用します。

会話の透明性
音声がどのように行われたかについて詳しく知る機会を提供する
人間への引き継ぎ

次の方法で共有

合成音声の開示設計パターン

概要

明示的な開示

透明な紹介

初めてのユーザー エクスペリエンス

ユーザー エクスペリエンスを返す

音声による透過的な紹介

明示的署名

カスタマイズと調整

ユーザー コントロール

ペルソナのカスタマイズ

保護者による開示

音声がどのように作成されたかを詳しく学ぶ機会を提供する

暗黙的な開示

暗黙的な手掛かりとフィードバック

機能の開示

会話の透明性

開示するタイミング

事前

要求に応じて

継続的に

システムが失敗した場合

その他のリソース

こちらも参照ください

フィードバック

その他のリソース

初めてのユーザーエクスペリエンス

ユーザーエクスペリエンスを返す

ユーザーコントロール