フレーズリストを使用して認識精度を向上させる

フレーズリストは、認識機能を高めるために、事前に提供される、単語またはフレーズの一覧です。フレーズリストにフレーズを追加すると、その重要性が増加するため、認識される可能性が高くなります。フレーズリストは、リアルタイムの文字起こしと高速文字起こしで追加できます。

フレーズの例を、以下に示します。

フレーズリストはシンプルで軽量です。

サポートされるフレーズリストロケールについては、Speech サービスの言語と音声のサポートに関する記事を参照してください。

Speech Studio、Speech SDK、または Speech コマンドラインインターフェイス (CLI) でフレーズリストを使用できます。リアルタイム文字起こしと高速文字起こし API でサポートされています。バッチ文字起こし API はフレーズリストをサポートしていません。

フレーズリストは、標準とカスタム音声の両方で使用できます。状況によっては、フレーズを含むカスタムモデルをトレーニングすることが、精度を高める最善の方法と考えられます。たとえば、以下の場合では Custom Speech を使用することになります。

フレーズリストの重み

リアルタイム文字起こしで Speech SDK を使用する場合は、既定の辞書に対するフレーズリストフレーズの重みを制御できます。この設定は、フレーズリストが音声テキスト変換の結果に与える影響を決定します。

フレーズリストの重みは、0.0から2.0までの範囲内で設定できます。

重みを大きくすると、リストの語句が既定の辞書の代替語句よりも認識される可能性が高くなります。この設定は、完全な一覧に適用されます。

Speech Studio を使用して、フレーズリストの支援によってオーディオの認識を向上させる方法をテストできます。運用環境のアプリケーションにフレーズリストを実装するには、Speech SDK または Speech CLI を使用します。

たとえば、音声サービスに次の文を認識させたいとしましょう: "Hi Rehaan, I'm Jessie from Contoso bank."

フレーズが次のように誤認識される場合があります: "Hi everyone, I'm Jesse from can't do so bank."

上のシナリオでは、"Rehaan"、"Jessie"、"Contoso" をフレーズリストに追加する必要があるでしょう。これで、名前が正しく認識されるはずです。

次に、Speech Studio を使用して、フレーズリストで認識精度がどのように向上するかを確認します。

注意

Azure サブスクリプションと Speech リソースを選択し、リージョンの課金を確認するように求められます。

Speech Studio のリアルタイム音声テキスト変換に移動します。
音声認識をテストするには、オーディオファイルをアップロードするか、マイクでオーディオを録音します。たとえば、[マイクでオーディオを録音する] を選択してから、"Hi Rehaan, I'm Jessie from Contoso bank." と話します。 " と話してから、赤いボタンを選択して録音を停止します。
文字起こしの結果が [テスト結果] テキストボックスに表示されます。 "Rehaan"、"Jessie"、または "Contoso" が誤って認識された場合は、次の手順で語句をフレーズリストに追加できます。
[詳細オプションの表示] を選択し、[フレーズリスト] をオンにします。
フレーズリストのテキストボックスに「Contoso;Jessie;Rehaan」と入力します。複数のフレーズは、セミコロンで区切る必要があります。
マイクを使用して認識を再度テストします。それ以外の場合は、オーディオファイルの横にある再試行矢印を選択して、オーディオを再実行できます。 "Rehaan"、"Jessie"、または "Contoso" という用語を認識する必要があります。