次の方法で共有


合成音声の開示設計パターン

Von Bedeutung

英語以外の翻訳は便宜上のみ提供されています。 バインドのバージョンについては、このドキュメントの EN-US バージョンを参照してください。

テキスト読み上げアバター エクスペリエンスに適したレベルの開示を決定したので、潜在的な設計パターンを調べるのに適したタイミングです。

概要

合成音声エクスペリエンスには、さまざまな開示設計パターンを適用できます。 開示評価の結果が "高開示" の場合は、 明示的な開示をお勧めします。これは、合成音声の起源を完全に伝えるということです。 暗黙的な開示 には、必要な開示レベルが高いか低いかに関係なく、音声エクスペリエンスに役立つ手掛かりと相互作用パターンが含まれます。

開示パターンのスペクトルの図。

カテゴリ 例示
明示的な開示パターン
暗黙的な開示パターン

合成音声に適用されるパターンを直接参照するには、次のグラフを使用します。 このグラフのその他の条件の一部は、シナリオにも適用される場合があります。

合成音声エクスペリエンスが… 推奨事項 デザイン パターン
徹底した開示が必要 少なくとも 1 つの明示的なパターンと暗黙的な手掛かりを前もって使用して、ユーザーが関連付けを構築できるようにします。
低開示を要求する 開示は最小限または不要ですが、一部の暗黙的なパターンの恩恵を受ける可能性があります。
高いレベルのエンゲージメントを持つ 長期的に構築し、ユーザー体験に沿って開示するための複数のエントリ ポイントを提供します。 オンボーディング エクスペリエンスを使用することを強くお勧めします。
主要な対象ユーザーとして子を含めます 主な開示対象ユーザーとして親を対象とし、子どもに効果的に開示を伝えることができることを確認します。
主な対象ユーザーとして視覚障害のあるユーザーや弱視の方を含む すべてのユーザーを含め、あらゆる形式の視覚的開示に、代替テキストまたは効果音が関連付けられていることを確認します。 コントラスト比と表示サイズに関するアクセシビリティ標準に準拠します。 聴覚キューを使用して開示を伝えます。
画面レス、デバイスレス、または対話のプライマリ モードまたは唯一モードとして音声を使用する 聴覚キューを使用して開示を伝えます。
複数のユーザー/リスナーが含まれる可能性があります (複数の世帯のパーソナル アシスタントなど) さまざまなユーザー コンテキストと理解レベルに留意し、ユーザー体験で開示する複数の機会を提供します。

明示的な開示

合成音声エクスペリエンスでハイ ディスクロージャーが必要な場合は、次の明示的なパターンの少なくとも 1 つを使用して、合成の性質を明確に示すのが最善です。

透明な紹介

音声エクスペリエンスが始まる前に、音声の起源とその機能について完全に透過的にデジタル アシスタントを導入します。 このパターンを使用する最適なタイミングは、新しいユーザーをオンボードするとき、または戻ってくるユーザーに新機能を導入するときです。 導入時に暗黙的な手掛かりを実装すると、ユーザーはデジタル エージェントの合成の性質に関するメンタル モデルを形成するのに役立ちます。

初めてのユーザー エクスペリエンス

初回実行時の透過的な導入の図。
合成音声は、新しいユーザーのオンボード中に導入されます。

推奨事項

  • 音声が人為的であることを説明する (例: "digital")
  • エージェントが実行できる機能について説明する
  • 音声の配信元を明示的に指定する
  • 合成音声の詳細を確認するためのエントリ ポイントを提供する

ユーザー エクスペリエンスを返す

ユーザーがオンボード エクスペリエンスをスキップした場合は、ユーザーが初めて音声をトリガーするまで、Transparent Introduction エクスペリエンスへのエントリ ポイントを引き続き提供します。

リターン ユーザー エクスペリエンス中の透過的な導入の図。
合成音声エクスペリエンスへの一貫したエントリ ポイントを提供します。 ユーザー体験の任意の時点で初めて音声をトリガーするときに、ユーザーがオンボード エクスペリエンスに戻れるようにします。

音声による透過的な紹介

デジタル アシスタントの音声の起源を示す音声プロンプトは、開示を実現するのに十分な明示的な内容です。 このパターンは、音声が使用可能な唯一の対話モードであるハイ ディスクロージャー シナリオに最適です。

口頭による明確な紹介の図。
ユーザー体験において、人物の声をすでに紹介または属性付けしている瞬間がある場合は、透明な導入を使用してください。

一人称での口頭による透明な紹介の図。
さらに透明性を高める目的で、声優は合成音声の起源を最初の人物に開示できます。

明示的署名

ユーザーがオーディオ プレーヤーまたは対話型コンポーネントと対話して音声をトリガーする場合は、このパターンを使用します。

ニュースメディアにおける明示的なバイラインの図。
明示的なバイラインは、音声の出典を明記することです。

推奨事項

  • 合成された音声の詳細を確認するためのエントリ ポイントを提供する

カスタマイズと調整

デジタル アシスタントが応答する方法 (つまり、音声がどのように聞こえるか) をユーザーに制御できるようにします。 ユーザーが自分の用語で特定の目標を念頭に置いてシステムと対話する場合、定義上、実際の人ではないことを既に理解しています。

ユーザー コントロール

合成音声エクスペリエンスに有意かつ顕著な影響を与える選択肢を提供します。

ユーザー設定の図。
ユーザー設定を使用すると、ユーザーはエクスペリエンスをカスタマイズして向上させることができます。

推奨事項

  • ユーザーが音声をカスタマイズできるようにする (言語と音声の種類の選択など)
  • 独自の音声 (音声調整、カスタム コマンドなど) に応答するようにシステムに教える方法をユーザーに提供する
  • ユーザーが生成した操作やコンテキストに応じた対話 (リマインダーなど) を最適化する

ペルソナのカスタマイズ

デジタル アシスタントの音声をカスタマイズする方法を提供します。 音声が著名人または広く認識可能な人物に基づいている場合は、ユーザーが音声をプレビューするときに、ビジュアルと音声の両方の概要を使用することを検討してください。

音声のカスタマイズの図。
音声のセットから選択する機能を提供すると、人工の性質を伝えるのに役立ちます。

推奨事項

  • ユーザーが各音声のサウンドをプレビューできるようにする
  • 各音声の紹介は正確なものを使用します
  • 合成された音声の詳細を確認するためのエントリ ポイントを提供する

保護者による開示

COPPA 規制に準拠するだけでなく、主な対象ユーザーが小さなお子様で、露出レベルが高い場合は、保護者に開示を提供します。 機密性の高い使用の場合は、成人が合成音声の使用を認めるまでエクスペリエンスを得ることを検討してください。 子供にメッセージを伝えるよう親に勧めます。

親向けの開示図。
親向けに最適化された透過的な導入により、子供が音声とやり取りする前に、大人が音声の合成の性質を認識することが保証されます。

推奨事項

  • 開示対象の主な対象ユーザーとして親を対象にする
  • 子供に開示を伝えるよう親に勧める
  • 合成された音声の詳細を確認するためのエントリ ポイントを提供する
  • 両親に簡単な「セーフガード」の質問をして、開示を読んだことを示すことで、エクスペリエンスをゲートする

音声がどのように作成されたかを詳しく学ぶ機会を提供する

状況依存のエントリ ポイントを、合成音声テクノロジに関する詳細情報を提供するページ、ポップアップ、または外部サイトに提供します。 たとえば、オンボーディング中や会話中にユーザーが詳細情報を求めたときに、リンクを表示してさらに学べるようにすることができます。

詳細については、エントリ ポイントの図を参照してください。
合成された音声の詳細を確認する機会を提供するエントリ ポイントの例。

ユーザーが合成音声に関する詳細情報を要求したら、主な目標は、合成音声の起源についてユーザーを教育し、テクノロジについて透過的になることです。

合成音声に関する詳細情報をユーザーに提供する図。
詳細については、外部サイトのヘルプ サイトを参照してください。

推奨事項

  • 複雑な概念を簡素化し、法律や技術専門用語の使用を避ける
  • プライバシーおよび利用規約にこのコンテンツを埋め込まない
  • コンテンツを簡潔に保ち、使用可能な場合は画像を使用する

暗黙的な開示

一貫性は、ユーザー体験全体を通じて暗黙的に開示を実現するための鍵です。 デバイス間および対話モード間で視覚的および聴覚的な手掛かりを一貫して使用すると、暗黙的なパターンと明示的な開示の間の関連付けを構築するのに役立ちます。

暗黙的なキューの整合性の図。

暗黙的な手掛かりとフィードバック

擬人化は、エージェントの実際の視覚的表現から、音声、音、光のパターン、バウンスする形状、デバイスの振動まで、さまざまな方法で現れます。 ペルソナを定義するときは、人間のようなアバターを目指すのではなく、暗黙的な手掛かりとフィードバック パターンを活用します。 これは、より明示的な開示の必要性を最小限に抑える 1 つの方法です。

視覚的な手掛かりとフィードバックの図。
これらの手掛かりは、あまりにも人間のようにならずにエージェントを擬人化するのに役立ちます。 また、時間の経過と同時に一貫して使用すると、効果的な開示メカニズムになる可能性もあります。

次の種類のキューを組み込む場合は、エクスペリエンスのさまざまな対話モードを検討してください。

カテゴリ 例示
視覚的な手掛かり
  • アバター
  • 応答性の高いリアルタイム キュー (アニメーションなど)
  • 画面以外のキュー (デバイス上のライトやパターンなど)
聴覚の手がかり
  • Sonicon (例: 短い独特の音、一連の音楽ノート)
触覚の手掛かり
  • 振動

機能の開示

デジタル アシスタントの能力に対する正確な期待を設定することで、暗黙的に開示を実現できます。 ユーザーがデジタル アシスタントと対話する方法を学習し、エクスペリエンスの初期段階で合成音声の詳細を学習するためのコンテキスト ヘルプを提供できるように、サンプル コマンドを提供します。

作成できる会話に対する既定の応答の例の図。

会話の透明性

会話が予期しないパスに入った場合は、期待値のリセット、透明性の強化、ユーザーの成功パスへの誘導に役立つ既定の応答を作成することを検討してください。 会話でも明示的な開示を使用する機会があります。

予期しないパスの処理の図。
エージェントに向けられたオフタスクまたは "個人的な" 質問は、エージェントの合成の性質をユーザーに思い出させ、適切に関与させるか、実際の人にリダイレクトするようにユーザーを誘導する良い時期です。

本題から外れたな質問に対処する図。

開示するタイミング

ユーザー体験全体を通じて、多くの開示の機会があります。 最初の使用、2 回目の使用、n 番目の使用...を設計しますが、システムが間違いを犯した場合や、ユーザーがエージェントの機能の制限を検出したときなど、透明性を強調するために"失敗" の瞬間も受け入れます。

ユーザー体験全体の開示機会の図。
さまざまな開示機会を強調する標準的なデジタル アシスタント ユーザー体験の例。

事前

開示のための最適な瞬間は、人が合成音声と対話する最初の時間です。  個人用音声アシスタントのシナリオでは、初回セットアップや、ユーザーが初めてエクスペリエンスを体験する際のことを指します。 他のシナリオでは、合成音声が初めて Web サイト上のコンテンツを読み取るか、ユーザーが初めて仮想キャラクターと対話する場合があります。

要求に応じて

ユーザーは、追加の情報に簡単にアクセスし、基本設定を制御し、要求されたときにユーザー体験中の任意の時点で透過的な通信を受け取ることができる必要があります。

継続的に

ユーザー エクスペリエンスを継続的に強化する暗黙的な設計パターンを使用します。

システムが失敗した場合

穏やかに失敗する機会として開示を利用します。

その他のリソース

こちらも参照ください