プロフェッショナル音声モデルをエンドポイントとしてデプロイする

プロフェッショナルな音声モデルを正常に作成して微調整したら、カスタム音声エンドポイントにデプロイします。

注

標準 (S0) 音声リソースを使用して最大 50 個のエンドポイントを作成できます。それぞれに独自のカスタム音声を使用できます。

微調整されたプロフェッショナル音声を使用するには、音声モデル名を指定し、HTTP 要求でカスタム URI を直接使用し、同じ Speech リソースを使用してテキストから音声サービスへの認証を通過する必要があります。

デプロイメントエンドポイントの追加

プロフェッショナルな音声エンドポイントを作成するには:

エンドポイントをデプロイするには、次の手順に従います。

Microsoft Foundry ポータルにサインインします。
左側のウィンドウから [微調整 ] を選択し、[ AI サービスの微調整] を選択します。
プロフェッショナル音声作成に関する記事で説明されているように、開始したプロフェッショナル音声の微調整タスク（モデル名別）を選択します。
Deploy model>モデルのデプロイ を選択します。
このエンドポイントに関連付ける音声モデルを選択し、[ 次へ] を選択します。
カスタム エンドポイントのエンドポイント名 と説明を入力します。
シナリオに応じて エンドポイントの種類 を選択します。リソースがサポートされているリージョンにある場合、エンドポイントの種類の既定の設定は 高パフォーマンス です。それ以外の場合、リソースがサポートされていないリージョンにある場合、使用可能な唯一のオプションは [高速再開] です。
- 高パフォーマンス: 会話型 AI、コールセンターボットなど、リアルタイムおよび大量の合成要求を使用するシナリオに最適化されています。エンドポイントのデプロイまたは再開には約 5 分かかります。 ハイパフォーマンス エンドポイントの種類がサポートされているリージョンの詳細については、リージョンの表の脚注を参照してください。
- 高速再開: 合成要求の頻度が低いオーディオコンテンツ作成シナリオ向けに最適化されています。 1 分未満でエンドポイントを簡単かつ迅速にデプロイまたは再開できます。高速再開エンドポイントの種類は、テキスト読み上げが利用可能なすべてのリージョンでサポートされています。
[次へ] を選択します。
チェックボックスをオンにして利用規約に同意し、[ 次へ] を選択します。
設定を確認し、モデルホスティングコストを受け入れるボックスを選択します。
[デプロイ] を選択してエンドポイントを作成します。

ご自分のエンドポイントがデプロイされると、エンドポイント名はリンクとして表示されます。リンクを選択すると、エンドポイントキー、エンドポイントの URL、サンプルコードなどの、ご使用のエンドポイントに固有の情報が表示されます。デプロイの状態が [Succeeded](成功) の場合、エンドポイントを使用する準備ができています。

カスタム音声を使用する

カスタムエンドポイントの機能は、テキスト読み上げ要求に使用される標準のエンドポイントと同じです。

1 つ違うのは、Speech SDK を介してカスタム音声を使用するには、EndpointId を指定する必要があることです。テキスト読み上げのクイックスタートから始めて、EndpointId と SpeechSynthesisVoiceName でコードを更新できます。詳しくは、「カスタムエンドポイントを使用する」をご覧ください。

音声合成マークアップ言語 (SSML) でカスタム音声を使うには、音声名としてモデル名を指定します。この例では、YourCustomVoiceName 音声を使用します。

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

製品上で新しい音声モデルに切り替える

音声モデルを最新のエンジンバージョンに更新した後、または製品の新しい音声に切り替える場合は、新しい音声モデルを新しいエンドポイントに再デプロイする必要があります。既存のエンドポイントでの新しい音声モデルの再デプロイはサポートされていません。デプロイ後、新しく作成したエンドポイントにトラフィックを切り替えます。最初に、テスト環境の新しいエンドポイントにトラフィックを転送し、トラフィックが正常に動作するのを確認してから、運用環境の新しいエンドポイントにトラフィックを転送することをお勧めします。切り替え中は、以前のエンドポイントを保持する必要があります。切り替え中に新しいエンドポイントで問題が発生した場合は、以前のエンドポイントに再び切り替えることができます。新しいエンドポイントでトラフィックが約 24 時間 (推奨値) 正常に実行された場合は、以前のエンドポイントを削除してかまいません。

注

音声名が変更され、音声合成マークアップ言語 (SSML) を使用している場合は、必ず SSML で新しい音声名を使用してください。

エンドポイントを中断して再開する

エンドポイントを一時停止または再開して支出を制限し、使用されていないリソースを節約できます。エンドポイントが中断されている間は課金されません。エンドポイントを再開すると、アプリケーションで引き続き同じエンドポイント URL を使用して音声を合成できます。

注

中断操作はほぼ直ちに完了します。再開操作の完了には、新しいデプロイとほぼ同じ時間がかかります。

このセクションでは、Microsoft Foundry ポータルでカスタム音声エンドポイントを中断または再開する方法について説明します。

エンドポイントを中断する

エンドポイントを一時停止および非アクティブ化するには:

Microsoft Foundry ポータルにサインインします。
左側のウィンドウから [微調整 ] を選択し、[ AI サービスの微調整] を選択します。
プロフェッショナル音声作成に関する記事で説明されているように、開始したプロフェッショナル音声の微調整タスク（モデル名別）を選択します。
[ モデルのデプロイ] を選択します。
中断するエンドポイントを選択し、[ 中断] を選択します。
表示されたダイアログボックスで、[ 中断] を選択します。エンドポイントが中断されると、状態が [成功] から [中断済み] に変わります。

エンドポイントを再開する

エンドポイントを再開してアクティブ化するには、Microsoft Foundry ポータルの [モデルのデプロイ] タブから [再開] を選択します。
表示されるダイアログボックスで、[Submit] (送信) を選択します。エンドポイントを正常に再アクティブ化すると、状態が [Suspended] (中断) から [Succeeded] (成功) に変わります。

次のステップ

カスタム音声の詳細については、概要を参照してください。
カスタムアバターの詳細については、概要を参照してください。

音声モデルを正常に作成してトレーニングしたら、それをカスタム音声エンドポイントにデプロイします。

注

標準 (S0) 音声リソースを使用して最大 50 個のエンドポイントを作成できます。それぞれに独自のカスタム音声を使用できます。

カスタム音声を使用するには、音声モデル名を指定し、HTTP 要求でカスタム URI を直接使用し、同じ Speech リソースを使用してテキストから音声サービスへの認証を通過する必要があります。

デプロイメントエンドポイントの追加

カスタム音声エンドポイントを作成するには:

Speech Studio にサインインします。
[Custom Voice]> [プロジェクト名] >[モデルのデプロイ]>[モデルのデプロイ] の順に選択します。
このエンドポイントに関連付ける音声モデルを選択します。
カスタムエンドポイントの [名前] と [説明] を入力します。
シナリオに応じて エンドポイントの種類 を選択します。リソースがサポートされているリージョンにある場合、エンドポイントの種類の既定の設定は 高パフォーマンス です。それ以外の場合、リソースがサポートされていないリージョンにある場合、使用可能な唯一のオプションは [高速再開] です。
- 高パフォーマンス: 会話型 AI、コールセンターボットなど、リアルタイムおよび大量の合成要求を使用するシナリオに最適化されています。エンドポイントのデプロイまたは再開には約 5 分かかります。 ハイパフォーマンス エンドポイントの種類がサポートされているリージョンの詳細については、リージョンの表の脚注を参照してください。
- 高速再開: 合成要求の頻度が低いオーディオコンテンツ作成シナリオに最適化されています。 1 分未満でエンドポイントを簡単かつ迅速にデプロイまたは再開できます。 高速再開 エンドポイントの種類は、テキスト読み上げが利用可能なすべてのリージョンでサポートされています。
[デプロイ] を選択してエンドポイントを作成します。

ご自分のエンドポイントがデプロイされると、エンドポイント名はリンクとして表示されます。リンクを選択すると、エンドポイントキー、エンドポイントの URL、サンプルコードなどの、ご使用のエンドポイントに固有の情報が表示されます。デプロイの状態が [Succeeded](成功) の場合、エンドポイントを使用する準備ができています。

アプリケーションの設定

REST API の要求パラメーターとして使用するアプリケーション設定は、Speech Studio の [モデルのデプロイ] タブから入手できます。

[エンドポイントキー] は、エンドポイントが関連付けられている Speech リソースキーを示します。 Ocp-Apim-Subscription-Key 要求ヘッダーの値としてエンドポイントキーを使用します。
[Endpoint URL] (エンドポイント URL) には、サービスリージョンが表示されます。 voice.speech.microsoft.com の前にある値をサービスリージョン要求パラメーターとして使用します。たとえば、エンドポイント URL が eastus の場合は https://eastus.voice.speech.microsoft.com/cognitiveservices/v1 を使用します。
[Endpoint URL] (エンドポイント URL) には、エンドポイント ID が表示されます。エンドポイント ID 要求パラメーターの値として、?deploymentId= クエリパラメーターに追加された値を使用します。

カスタム音声を使用する

カスタムエンドポイントの機能は、テキスト読み上げ要求に使用される標準のエンドポイントと同じです。

1 つ違うのは、Speech SDK を介してカスタム音声を使用するには、EndpointId を指定する必要があることです。テキスト読み上げのクイックスタートから始めて、EndpointId と SpeechSynthesisVoiceName でコードを更新できます。詳しくは、「カスタムエンドポイントを使用する」をご覧ください。

音声合成マークアップ言語 (SSML) でカスタム音声を使うには、音声名としてモデル名を指定します。この例では、YourCustomVoiceName 音声を使用します。

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

製品上で新しい音声モデルに切り替える

音声モデルを最新のエンジンバージョンに更新した後、または製品の新しい音声に切り替える場合、新しい音声モデルを新しいエンドポイントに再デプロイする必要があります。既存のエンドポイントに新しい音声モデルを再デプロイすることはサポートされていません。デプロイ後、新しく作成したエンドポイントにトラフィックを切り替えます。最初に、テスト環境の新しいエンドポイントにトラフィックを転送し、トラフィックが正常に動作するのを確認してから、運用環境の新しいエンドポイントにトラフィックを転送することをお勧めします。切り替え中は、以前のエンドポイントを保持する必要があります。切り替え中に新しいエンドポイントで問題が発生した場合は、以前のエンドポイントに再び切り替えることができます。新しいエンドポイントでトラフィックが約 24 時間 (推奨値) 正常に実行された場合は、以前のエンドポイントを削除してかまいません。

注

音声名が変更され、音声合成マークアップ言語 (SSML) を使用する場合は、SSML で新しい音声名を使用する必要があります。

エンドポイントを中断して再開する

エンドポイントの中断と再開により、使用を制限し、使用されていないリソースを節約できます。エンドポイントが中断されている間は課金されません。エンドポイントを再開すると、アプリケーションで引き続き同じエンドポイント URL を使用して音声を合成できます。

注

中断操作はほぼ直ちに完了します。再開操作の完了には、新しいデプロイとほぼ同じ時間がかかります。

このセクションでは、Speech Studio ポータルでカスタム音声エンドポイントを中断または再開する方法について説明します。

エンドポイントを中断する

エンドポイントを中断して非アクティブにするには、Speech Studio の [Deploy model] (モデルのデプロイ) タブから [Suspend] (中断) を選択します。
表示されるダイアログボックスで、[Submit] (送信) を選択します。エンドポイントが中断されると、Speech Studio に [Successfully suspended endpoint] (エンドポイントが正常に中断されました) という通知が表示されます。

エンドポイントを再開する

エンドポイントを再開してアクティブにするには、Speech Studio の [Deploy model] (モデルのデプロイ) タブから [Resume] (再開) を選択します。
表示されるダイアログボックスで、[Submit] (送信) を選択します。エンドポイントを正常に再アクティブ化すると、状態が [Suspended] (中断) から [Succeeded] (成功) に変わります。

次のステップ

カスタム音声の詳細については、概要を参照してください。
Speech Studio に関する詳細については、概要を参照してください。

音声モデルを正常に作成してトレーニングしたら、それをカスタム音声エンドポイントにデプロイします。

注

標準 (S0) 音声リソースを使用して最大 50 個のエンドポイントを作成できます。それぞれに独自のカスタム音声を使用できます。

デプロイメントエンドポイントの追加

エンドポイントを作成するには、カスタム音声 API の Endpoints_Create 操作を使用します。次の手順に従って要求本文を作成します。

必須の projectId プロパティを設定します。プロジェクトの作成に関する記事を参照してください。
必須の modelId プロパティを設定します。音声モデルのトレーニングに関する記事を参照してください。
必須の description プロパティを設定します。説明は後で変更できます。

HTTP PUT 要求は、以下の Endpoints_Create の例に示したように URI を使用して行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
EndpointId を任意のエンドポイント ID に置き換えます。 ID は GUID である必要があり、Azure Cognitive Service for Speech リソース内で一意である必要があります。 ID はプロジェクトの URI で使われ、後で変更することはできません。

curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/EndpointId?api-version=2024-02-01-preview"

次の形式で応答本文を受け取る必要があります。

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

応答ヘッダーに Operation-Location プロパティが含まれています。この URI を使用して、Endpoints_Create 操作の詳細を取得します。応答ヘッダーの例を次に示します。

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/aaaabbbb-0000-cccc-1111-dddd2222eeee?api-version=2024-02-01-preview
Operation-Id: aaaabbbb-0000-cccc-1111-dddd2222eeee

後続の API 要求でエンドポイント Operation-Location を使用して、エンドポイントの中断および再開と、エンドポイントの削除を行います。

カスタム音声を使用する

カスタム音声を使用するには、音声モデル名を指定し、HTTP 要求でカスタム URI を直接使用し、同じ Speech リソースを使用してテキストから音声サービスへの認証を通過する必要があります。

カスタムエンドポイントの機能は、テキスト読み上げ要求に使用される標準のエンドポイントと同じです。

1 つ違うのは、Speech SDK を介してカスタム音声を使用するには、EndpointId を指定する必要があることです。テキスト読み上げのクイックスタートから始めて、EndpointId と SpeechSynthesisVoiceName でコードを更新できます。詳しくは、「カスタムエンドポイントを使用する」をご覧ください。

音声合成マークアップ言語 (SSML) でカスタム音声を使うには、音声名としてモデル名を指定します。この例では、YourCustomVoiceName 音声を使用します。

<speak version="1.0" xmlns="http://www.w3.org/2001/10/synthesis" xml:lang="en-US">
    <voice name="YourCustomVoiceName">
        This is the text that is spoken. 
    </voice>
</speak>

エンドポイントを中断する

エンドポイントの中断と再開により、使用を制限し、使用されていないリソースを節約できます。エンドポイントが中断されている間は課金されません。エンドポイントを再開すると、アプリケーションで引き続き同じエンドポイント URL を使用して音声を合成できます。

エンドポイントを中断するには、カスタム音声 API の Endpoints_Suspend 操作を使用します。

HTTP POST 要求は、以下の Endpoints_Suspend の例に示したように URI を使用して行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
YourEndpointId を、エンドポイントの作成時に受信したエンドポイント ID に置き換えます。

curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:suspend?api-version=2024-02-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

次の形式で応答本文を受け取る必要があります。

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Disabling",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

エンドポイントを再開する

エンドポイントを再開するには、カスタム音声 API の Endpoints_Resume 操作を使用します。

HTTP POST 要求は、以下の Endpoints_Resume の例に示したように URI を使用して行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
YourEndpointId を、エンドポイントの作成時に受信したエンドポイント ID に置き換えます。

curl -v -X POST "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId:resume?api-version=2024-02-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "content-type: application/json" -H "content-length: 0"

次の形式で応答本文を受け取る必要があります。

{
  "id": "9f50c644-2121-40e9-9ea7-544e48bfe3cb",
  "description": "Endpoint for Jessica voice",
  "projectId": "ProjectId",
  "modelId": "JessicaModelId",
  "properties": {
    "kind": "HighPerformance"
  },
  "status": "Running",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

エンドポイントの削除

エンドポイントを削除するには、カスタム音声 API の Endpoints_Delete 操作を使用します。

次の Endpoints_Delete の例で示すように、URI を使って HTTP DELETE 要求を行います。

YourResourceKey をSpeech リソースキーに置き換えます。
YourResourceRegion を Azure Cognitive Service for Speech リソースのリージョンに置き換えます。
YourEndpointId を、エンドポイントの作成時に受信したエンドポイント ID に置き換えます。

curl -v -X DELETE "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/endpoints/YourEndpointId?api-version=2024-02-01-preview" -H "Ocp-Apim-Subscription-Key: YourResourceKey"

状態コード 204 の応答ヘッダーを受け取ります。

製品上で新しい音声モデルに切り替える

音声モデルを最新のエンジンバージョンに更新した後、または製品の新しい音声に切り替える場合、新しい音声モデルを新しいエンドポイントに再デプロイする必要があります。既存のエンドポイントに新しい音声モデルを再デプロイすることはサポートされていません。デプロイ後、新しく作成したエンドポイントにトラフィックを切り替えます。最初に、テスト環境の新しいエンドポイントにトラフィックを転送し、トラフィックが正常に動作するのを確認してから、運用環境の新しいエンドポイントにトラフィックを転送することをお勧めします。切り替え中は、以前のエンドポイントを保持する必要があります。切り替え中に新しいエンドポイントで問題が発生した場合は、以前のエンドポイントに再び切り替えることができます。新しいエンドポイントでトラフィックが約 24 時間 (推奨値) 正常に実行された場合は、以前のエンドポイントを削除してかまいません。

注

音声名が変更され、音声合成マークアップ言語 (SSML) を使用する場合は、SSML で新しい音声名を使用する必要があります。

次のステップ

カスタム音声の詳細については、概要を参照してください。
Speech Studio に関する詳細については、概要を参照してください。

次の方法で共有

デプロイメント エンドポイントの追加

カスタム音声を使用する

製品上で新しい音声モデルに切り替える

エンドポイントを中断して再開する

エンドポイントを中断する

エンドポイントを再開する

次のステップ

デプロイメント エンドポイントの追加

アプリケーションの設定

カスタム音声を使用する

製品上で新しい音声モデルに切り替える

エンドポイントを中断して再開する

エンドポイントを中断する

エンドポイントを再開する

次のステップ

デプロイメント エンドポイントの追加

カスタム音声を使用する

エンドポイントを中断する

エンドポイントを再開する

エンドポイントの削除

製品上で新しい音声モデルに切り替える

次のステップ

フィードバック

その他のリソース

デプロイメントエンドポイントの追加

デプロイメントエンドポイントの追加

デプロイメントエンドポイントの追加