既定のインデックス作成設定を使用することも、調整することもできます。 生成された分析情報、コスト、パフォーマンスに影響を与える言語、インデックス作成、カスタム モデル、ストリーミング設定を選択できます。
この記事では、各オプションについて説明します。 Azure AI Video Indexer Web サイトを使用する場合 API の使用と同じオプションが適用されます (API ガイドを参照)。 大量のインデックスを作成する場合は、大規模な場合のガイドに従ってください。
既定の設定
既定では、Azure AI Video Indexer は次のように構成されます。
- ソース言語: 英語
- プライバシー: プライベート
- オーディオとビデオの設定: 標準
- ストリーミング品質: シングル ビットレート
ビデオのソース言語
ビデオで話されている言語がわかっている場合は、ビデオ ソース言語の一覧から言語を選択します。 ビデオの言語が不明な場合は、[単一言語の自動検出] を選択します。 Azure AI Video Indexer は、言語識別 (LID) を使用してビデオ言語を検出し、検出された言語で文字起こしと分析情報を生成します。
ビデオに複数の言語が含まれており、どの言語が含まれているかわからない場合は、 [複数言語の自動検出を選択します。 この場合、ビデオをアップロードしてインデックスを作成するときに、多言語 (MLID) 検出が適用されます。
自動検出はビデオの言語が異なる場合に最適なオプションですが、LID または MLID を使用する場合は、次の 2 つの点を考慮する必要があります。
- Azure AI Video Indexer でサポートされているすべての言語が LID または MLID でサポートされているわけではありません。
- ビデオの適切な言語を事前に選択すると、文字起こしの品質が向上します。
言語サポートとサポートされている言語については、こちらを参照してください。
プライバシー
このオプションを使用すると、Azure AI Video Indexer アカウントのユーザーまたはリンクを知っているすべてのユーザーのみが分析情報にアクセスできるようにするかどうかを決定できます。
インデックス作成のオプション
既定のインデックス作成設定を使用すると、オーディオとビデオのインデックス作成オプションの価格が異なる場合があります。 詳細については、「Azure AI Video Indexer の価格」を参照してください。
インデックス作成の種類のオプションと、その分析情報の詳細を次に示します。 インデックス作成の種類を変更するには、[詳細設定] を選択します。
注
光学式文字認識 (OCR) は、いくつかの分析情報の種類で使用されます。
詳細設定
[詳細設定] を選択すると、次のオプションを選択できます。
オーディオのみ
- 基本: オーディオのみを使用して分析情報のインデックスを作成および抽出し (ビデオを無視)、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- Standard: オーディオのみを使用して分析情報のインデックスを作成および抽出し (ビデオを無視)、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- 自動言語検出
- 喜怒哀楽
- キーワード
- 名前付きエンティティ (ブランド、場所、ユーザー)
- 感情
- スピーカー
- トピックの抽出
- テキスト内容の管理
- 詳細: オーディオのみを使用して分析情報のインデックスを作成および抽出し (ビデオを無視)、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- 自動言語検出
- オーディオ イベントの検出
- 喜怒哀楽
- キーワード
- 名前付きエンティティ (ブランド、場所、ユーザー)
- 感情
- スピーカー
- トピックの抽出
- テキスト内容の管理
ビデオのみ
- 基本: ビデオのみを使用して分析情報のインデックスを作成および抽出し (オーディオを無視)、次の分析情報を提供します。
- ラベル
- オブジェクトの検出
- 光学文字認識 (OCR)
- シーン (キーフレームとショット)
- 黒枠検出
- Standard: ビデオのみを使用して分析情報のインデックスを作成および抽出し (オーディオを無視)、次の分析情報を提供します。
- ラベル (OCR)
- 名前付きエンティティ (OCR - ブランド、場所、ユーザー)
- 光学文字認識 (OCR)
- 人々
- シーン (キーフレームとショット)
- 黒いフレーム
- ビジュアル コンテンツ モデレーション
- トピック抽出 (OCR)
- 詳細: ビデオのみを使用して分析情報のインデックスを作成および抽出し (オーディオを無視する)、次の分析情報を提供します。
- ラベル (OCR)
- 一致した人
- 名前付きエンティティ (OCR - ブランド、場所、ユーザー)
- 光学文字認識 (OCR)
- 観察された人
- 人々
- シーン (キーフレームとショット)
- Clapper ボードの検出
- デジタル パターン検出
- 特徴量化された衣服の分析情報
- テキストレス スレート検出
- テキスト形式のロゴの検出
- 黒いフレーム
- ビジュアル コンテンツ モデレーション
- トピック抽出 (OCR)
音声とビデオ
- 基本: オーディオとビデオを使用して分析情報のインデックス作成と抽出を行い、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- オブジェクトの検出
- 光学文字認識 (OCR)
- シーン (キーフレームとショット)
- 黒いフレーム
- Standard: オーディオとビデオを使用して分析情報のインデックス作成と抽出を行い、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- 自動言語検出
- 喜怒哀楽
- キーワード
- 名前付きエンティティ (ブランド、場所、ユーザー)
- 光学文字認識 (OCR)
- シーン (キーフレームとショット)
- 黒いフレーム
- ビジュアル コンテンツ モデレーション
- 人々
- 感情
- スピーカー
- トピックの抽出
- テキスト内容の管理
- 詳細: オーディオとビデオを使用して分析情報のインデックス作成と抽出を行い、次の分析情報を提供します。
- 文字起こし
- 翻訳
- 出力キャプションと字幕の書式設定 (クローズド キャプション)
- 自動言語検出
- テキスト内容の管理
- オーディオ イベントの検出
- 喜怒哀楽
- キーワード
- 一致した人
- 名前付きエンティティ (ブランド、場所、ユーザー)
- 光学文字認識 (OCR)
- 観察された人
- 人々
- Clapper ボードの検出
- デジタル パターン検出
- 特徴量化された衣服の分析情報
- テキストレス スレート検出
- 感情
- スピーカー
- シーン (キーフレームとショット)
- テキスト形式のロゴの検出
- 黒いフレーム
- ビジュアル コンテンツ モデレーション
- トピックの抽出
ストリーミングの品質オプション
インデックス付きビデオをストリーミングするには、次の 2 つのオプションがあります。
- シングル ビットレート: ビデオの高さが 720p HD 以上の場合、Azure AI Video Indexer は解像度 1280 x 720 でエンコードします。 それ以外の場合は、640 x 468 としてエンコードされます。
- ストリーミングなし: 分析情報は生成されますが、ストリーミング操作は実行されず、Azure AI Video Indexer Web サイトでビデオは使用できません。 [ストリーミングなし] が選択されている場合、エンコードに対する課金は行われません。
モデルを除外する
VI Web サイトと API の両方を使用してインデックスを作成するときに、モデルを除外できます。 Web サイトを使用してインデックス付けするビデオをアップロードする場合は、 Advanced 設定>Indexing プリセットを選択し インデックス作成の結果から除外する AI モデルを選択します。 関心のある分析情報のみを含む、より効率的なインデックス作成と VI の結果を実現できます。
コンテンツ モデルのカスタマイズ
Azure AI Video Indexer を使うと、モデルの一部をカスタマイズして、特定のユース ケースに適合させることができます。 これらのモデルには、 ブランド、 言語、 person、 speechが含まれます。
インサイトとメディアストレージ
次のセクションでは、Azure AI Video Indexer に分析情報とメディアを格納する方法について説明します。
インサイトストレージ
すべてのインデックス作成の分析情報とメタデータは、VI によって管理されるストレージ アカウントに保持され、このストレージに対して課金されることはありません。
メディア ストレージ
VI アカウントが Azure Storage アカウントに接続されている。 あなたがこのストレージ アカウントの使用を管理し、料金を支払います。 ビデオのインデックスが作成されると、次のファイルがこのアカウントに格納されます。
- ソース ファイル。 将来ビデオのインデックスを再作成する場合に備えて保持されます。
- ストリーミング品質がシングル ビットレートに設定されている場合にエンコードされた新しいファイル。
メディアを削除する
インデックス付きメディアとそれに関連付けられているすべてのファイルと分析情報は、次の 3 つの方法で削除できます。
- Video Indexer ポータルでファイルを削除します。
- ビデオの 削除 または ビデオ ソース ファイルの削除 API 要求を使用します。
- 元のメディア ファイルをストレージに保持する必要がない場合は、API を使用するときに、
retentionPeriod
パラメーターを 1 から 7 の間に設定します。 インデックス付きビデオと、それに関連するすべてのもの、ソース ファイル、分析情報などは、インデックス作成から 1 ~ 7 日後に削除されます。