次の方法で共有


Azure AI Video Indexer の言語サポート

この記事では、Video Indexer の言語オプションに関する説明と、各オプションの言語サポートの一覧を示します。 Video Indexer の機能、翻訳、言語識別、カスタマイズ、および Video Indexer Web サイトの言語設定について、それぞれの言語サポートの情報が記載されています。

シナリオ別の対応言語

このセクションでは、Video Indexer の言語オプションに関する説明と、各オプションでサポートされている言語の一覧表を示します。

Important

  • Azure Video Indexer を使用してインデックスを作成する場合、API を使用してインデックスを作成するときに、一覧表示されているすべての言語で翻訳がサポートされます。
  • Arc で有効になっている Azure AI Video Indexer を使用したインデックス作成 (Web アプリと API の両方) の場合、英語への翻訳のみがサポートされます。

Column explanations

  • サポートされているソース言語 – メディア ファイル内の音声に含まれる、文字起こし、翻訳、検索のサポート対象言語。

  • 言語識別 - インデックス作成に言語識別が使用される際、Video Indexer でその言語の自動検出が可能かどうか。 詳細については、「Azure AI Video Indexer を使用して音声言語を自動的に識別する」および「言語識別」セクションを参照してください。

  • カスタマイズ (言語モデル) - Video Indexer で言語モデルをカスタマイズする際にその言語を使用できるかどうか。 詳細については、「Azure AI Video Indexer で言語モデルをカスタマイズする」を参照してください。

  • 発音 (言語モデル) - カスタム音声モデルの一部となる発音データセットを作成する際にその言語を使用できるかどうか。 詳細については、「Azure AI Video Indexer で音声モデルをカスタマイズする」を参照してください。

  • Web サイト翻訳Azure AI Video Indexer Web サイトを使用する際に、その言語の翻訳がサポートされているかどうか。 [言語] ドロップダウン メニューで、翻訳言語を選択します。

    メニュー項目としてダウンロード、英語、ビューを含むメニューを示すスクリーンショット。ツールヒントが英語項目のマウスオーバーとして表示され、[翻訳] が [英語] に設定されていることを示します。

    以下のインサイトが翻訳されます。

    • Transcript
    • Keywords
    • Topics
    • Labels
    • フレーム パターン (現在、ヘブライ語のみ)

    その他すべての分析情報は、翻訳を使用した場合にも英語で表示されます。

  • Web サイトの言語 - Azure AI Video Indexer Web サイトで、その言語を使用言語として選択できるかどうか。 [設定] アイコンを選択し、[言語設定] ドロップダウンで言語を選択します。

    ユーザー設定のすべての項目がオンになったメニューを示すスクリーンショット。

Language Code   Supported
ソース言語
Supported
ソース言語 (Arc)
Language
identification
Customization
(言語モデル)
Pronunciation
(言語モデル)
Website
Translation
Website
Language
Afrikaans af-ZA
Arabic (Israel) ar-IL
Arabic (Iraq) ar-IQ
Arabic (Jordan) ar-JO
Arabic (Kuwait) ar-KW
Arabic (Lebanon) ar-LB
Arabic (Oman) ar-OM
アラビア語 (パレスチナ自治政府) ar-PS
Arabic (Qatar) ar-QA
アラビア語 (サウジアラビア) ar-SA
アラビア語 (アラブ首長国連邦) ar-AE
Arabic Egypt ar-EG
アラビア語 (現代標準 (バーレーン)) ar-BH
アラビア語 (シリア・アラブ共和国) ar-SY
Armenian hy-AM
Bengali bn-BD
Bosnian bs-Latn
Bulgarian bg-BG
Catalan ca-ES
中国語 (繁体字) zh-HK
Chinese (Simplified) zh-Hans
Chinese (Traditional) zh-Hant
Croatian hr-HR
Czech cs-CZ
Danish da-DK
Dutch nl-NL
English Australia en-AU
英語 (英国) en-GB
英語 (米国) en-US
Estonian et-EE
Fijian en-FJ
Filipino fil-PH
Finnish fi-FI
French fr-FR
French (Canada) fr-CA
German de-DE
Greek el-GR
Gujarati gu-IN
Haitian fr-HT
Hebrew he-IL
Hindi hi-IN
Hungarian hu-HU
Icelandic is-IS
Indonesian id-ID
Irish ga-IE
Italian it-IT
Japanese ja-JP
Kannada kn-IN
Kiswahili sw-KE
Korean ko-KR
Latvian lv-LV
Lithuanian lt-LT
Malagasy mg-MG
Malay ms-MY
Malayalam ml-IN
Maltese mt-MT
Norwegian nb-NO
Persian fa-IR
Polish pl-PL
Portuguese pt-BR
Portuguese (Portugal) pt-PT
Romanian ro-RO
Russian ru-RU
Samoan en-WS
Serbian (Cyrillic) sr-Cyrl-RS
Serbian (Latin) sr-Latn-RS
Slovak sk-SK
Slovenian sl-SI
Spanish es-ES
Spanish (Mexico) es-MX
Swedish sv-SE
Tamil ta-IN
Telugu te-IN
Thai th-TH
Tongan to-TO
Turkish tr-TR
Ukrainian uk-UA
Urdu ur-PK
Vietnamese vi-VN

サポートされている言語を API で取得する

Get Supported Languages API 呼び出しを使用すると、サポートされている言語の完全な一覧を領域別に取得できます。 詳細については、「サポートされている言語を取得する」を参照してください。

API は、サポートされている言語の一覧を以下の値で返します。

{
    "name": "Language",
    "languageCode": "Code",
    "isRightToLeft": true/false,
    "isSourceLanguage": true/false,
    "isAutoDetect": true/false
}
  • サポートされているソース言語:

    isSourceLanguage が false の場合、その言語は翻訳のみでサポートされます。 isSourceLanguage が true の場合、その言語は、文字起こし、翻訳、検索のソースとしてサポートされます。

  • 言語の識別 (自動検出):

    isAutoDetect が true の場合、その言語は、言語識別 (LID) と多言語識別 (MLID) においてサポートされます。

Language Identification

メディア ファイルを Video Indexer にアップロードする際には、メディア ファイルのソース言語を指定できます。 Video Indexer Web サイトを使用してファイルのインデックスを作成する場合は、ファイルのアップロード中に言語を選択して行うことができます。 インデックス作成ジョブを API で送信する場合は language パラメーターを使用して行います。 選択した言語は、ファイルの文字起こしの生成に使用されます。

メディア ファイルのソース言語がわからない場合、または複数の言語が含まれている可能性がある場合は、Video Indexer で音声言語を検出できます。 メディア ファイルのソース言語に対して自動検出単一言語 (LID) または複数言語 (MLID) を選択した場合、検出された言語がメディア ファイルの文字起こしに使用されます。 LID と MLID の詳細については、「Azure AI Video Indexer を使用して音声言語を自動識別する」、「言語識別モデルを使用して音声言語を自動的に識別する」、および「複数言語のコンテンツを自動的に識別および文字起こしする」を参照してください

LID と MLID のどちらでも、メディア ファイルのインデックス作成時に識別できる言語の種類は 10 個までに制限されています。 言語識別 (LID) と複数言語識別 (MILD) の 9 つの 既定 の言語を次に示します。

  • German (de-DE)
  • 英語 (米国) (en-US)
  • Spanish (es-ES)
  • French (fr-FR)
  • Italian (it-IT)
  • Japanese (ja-JP)
  • Portuguese (pt-BR)
  • Russian (ru-RU)
  • 簡体中国語 (zh-Hans)

既定の言語リストを変更する方法

言語識別に使用する言語リストを既定以外の内容に変更する必要がある場合は、Web サイトまたは API を使用することで、カスタマイズがサポートされている任意の 10 言語を指定できます。

Web サイトを使用してリストを変更する

  1. [モデルのカスタマイズ] で、[言語 ID] タブを選択します。 この言語リストは、お使いの Video Indexer アカウントと、サインインしているユーザーに固有のものです。 既定の言語リストは、各ユーザーのローカル デバイスに、デバイスごと、ブラウザーごとに保存されます。 したがって、各ユーザーが独自に既定の識別言語リストを構成できます。

  2. [言語の追加] を使用して、言語を検索し、追加します。 既に 10 個の言語をすべて選択済みの場合は、新しい言語を追加する前に、選択済みの言語のいずれかを検出対象から削除する必要があります。

    選択したすべての言語を示すテーブルを示すスクリーンショット。

API を使用して言語リストを変更する

ファイルをアップロードすると、Video Indexer 言語モデルは既定で 9 つの言語を相互参照します。 合致する言語が検出されると、その言語でファイルの文字起こしが生成されます。

language パラメーターで、multi (MLID) または auto (LID) のパラメーターを指定します。 customLanguages パラメーターを使用して、最大 10 個の言語を指定します (このパラメーターは、language パラメーターが multi または auto である場合にのみ使用されます)。API の使用の詳細については、「Azure AI Video Indexer API を使用する」を参照してください。