Transcriptions - Transcribe
オーディオ ファイルの同期文字起こし。
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
URI パラメーター
名前 | / | 必須 | 型 | 説明 |
---|---|---|---|---|
audio
|
formData | True |
file (binary) |
文字起こしするオーディオ ファイルの内容。 オーディオ ファイルは、オーディオ期間が 2 時間より短く、サイズが 250 MB 未満である必要があります。 |
definition
|
formData |
string |
文字起こし要求のメタデータ。 このフィールドには、 |
|
endpoint
|
path | True |
string |
サポートされている Cognitive Services エンドポイント (プロトコルとホスト名、例: https://westus.api.cognitive.microsoft.com)。 |
api-version
|
query | True |
string |
要求された API バージョン。 |
要求ヘッダー
Media Types: "multipart/form-data"
名前 | 必須 | 型 | 説明 |
---|---|---|---|
Ocp-Apim-Subscription-Key | True |
string |
コグニティブ サービス アカウント キーをここで指定します。 |
応答
名前 | 型 | 説明 |
---|---|---|
200 OK |
わかりました |
|
Other Status Codes |
エラーが発生しました。 |
セキュリティ
Ocp-Apim-Subscription-Key
コグニティブ サービス アカウント キーをここで指定します。
型:
apiKey
/:
header
例
Transcribe an audio file
要求のサンプル
POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15
応答のサンプル
{
"durationMilliseconds": 2000,
"combinedPhrases": [
{
"text": "Weather"
}
],
"phrases": [
{
"offsetMilliseconds": 40,
"durationMilliseconds": 320,
"text": "Weather",
"words": [
{
"text": "weather",
"offsetMilliseconds": 40,
"durationMilliseconds": 320
}
],
"locale": "en-US",
"confidence": 0.78983736
}
]
}
定義
名前 | 説明 |
---|---|
Channel |
チャネルごとの完全なトランスクリプト。 |
Detailed |
DetailedErrorCode |
Error |
エラー |
Error |
ErrorCode |
Inner |
InnerError |
Phrase |
文字起こしされた語句。 |
Transcribe |
文字起こし操作の結果。 |
Word |
表示フォームのタイムスタンプ付き単語。 |
ChannelCombinedPhrases
チャネルごとの完全なトランスクリプト。
名前 | 型 | 説明 |
---|---|---|
channel |
integer (int32) |
0 から始まるチャネル インデックス。 チャネル分離が有効になっている場合にのみ存在します。 |
text |
string |
文字起こしされたテキスト。 |
DetailedErrorCode
DetailedErrorCode
値 | 説明 |
---|---|
InvalidParameterValue |
パラメーター値が無効です。 |
InvalidRequestBodyFormat |
要求本文の形式が無効です。 |
EmptyRequest |
空の要求。 |
MissingInputRecords |
入力レコードがありません。 |
InvalidDocument |
ドキュメントが無効です。 |
ModelVersionIncorrect |
モデルのバージョンが正しくありません。 |
InvalidDocumentBatch |
ドキュメント バッチが無効です。 |
UnsupportedLanguageCode |
サポートされていない言語コード。 |
DataImportFailed |
データのインポートに失敗しました。 |
InUseViolation |
使用中の違反。 |
InvalidLocale |
ロケールが無効です。 |
InvalidBaseModel |
ベース モデルが無効です。 |
InvalidAdaptationMapping |
適応マッピングが無効です。 |
InvalidDataset |
データセットが無効です。 |
InvalidTest |
テストが無効です。 |
FailedDataset |
失敗したデータセット。 |
InvalidModel |
モデルが無効です。 |
InvalidTranscription |
文字起こしが無効です。 |
InvalidPayload |
ペイロードが無効です。 |
InvalidParameter |
パラメーターが無効です。 |
EndpointWithoutLogging |
ログ記録なしのエンドポイント。 |
InvalidPermissions |
アクセス許可が無効です。 |
InvalidPrerequisite |
前提条件が無効です。 |
InvalidProductId |
製品 ID が無効です。 |
InvalidSubscription |
サブスクリプションが無効です。 |
InvalidProject |
プロジェクトが無効です。 |
InvalidProjectKind |
プロジェクトの種類が無効です。 |
InvalidRecordingsUri |
無効な記録 URI。 |
OnlyOneOfUrlsOrContainerOrDataset |
URL またはコンテナーまたはデータセットのいずれか 1 つだけ。 |
ExceededNumberOfRecordingsUris |
記録 URI の数を超えました。 |
InvalidChannels |
チャネルが無効です。 |
ModelMismatch |
モデルの不一致。 |
ProjectGenderMismatch |
プロジェクトの性別の不一致。 |
ModelDeprecated |
モデルは非推奨になりました。 |
ModelExists |
モデルが存在します。 |
ModelNotDeployable |
モデルはデプロイできません。 |
EndpointNotUpdatable |
エンドポイントは更新できません。 |
SingleDefaultEndpoint |
単一の既定のエンドポイント。 |
EndpointCannotBeDefault |
エンドポイントを既定にすることはできません。 |
InvalidModelUri |
モデル URI が無効です。 |
SubscriptionNotFound |
サブスクリプションが見つかりません。 |
QuotaViolation |
クォータ違反。 |
UnsupportedDelta |
サポートされていないデルタ。 |
UnsupportedFilter |
サポートされていないフィルター。 |
UnsupportedPagination |
サポートされていない改ページ位置。 |
UnsupportedDynamicConfiguration |
サポートされていない動的構成。 |
UnsupportedOrderBy |
サポートされていない注文者。 |
NoUtf8WithBom |
bom を含む utf8 はありません。 |
ModelDeploymentNotCompleteState |
モデルのデプロイが完了していない状態です。 |
SkuLimitsExist |
SKU の制限が存在します。 |
DeployingFailedModel |
失敗したモデルのデプロイ。 |
UnsupportedTimeRange |
サポートされていない時間範囲。 |
InvalidLogDate |
ログの日付が無効です。 |
InvalidLogId |
無効なログ ID です。 |
InvalidLogStartTime |
ログの開始時刻が無効です。 |
InvalidLogEndTime |
ログの終了時刻が無効です。 |
InvalidTopForLogs |
ログの top が無効です。 |
InvalidSkipTokenForLogs |
ログのスキップ トークンが無効です。 |
DeleteNotAllowed |
削除は許可されていません。 |
Forbidden |
禁じられた。 |
DeployNotAllowed |
デプロイは許可されていません。 |
UnexpectedError |
予期しないエラー。 |
InvalidCollection |
コレクションが無効です。 |
InvalidCallbackUri |
コールバック URI が無効です。 |
InvalidSasValidityDuration |
SAS の有効期間が無効です。 |
InaccessibleCustomerStorage |
お客様のストレージにアクセスできません。 |
UnsupportedClassBasedAdaptation |
サポートされていないクラス ベースの適応。 |
InvalidWebHookEventKind |
Web フック イベントの種類が無効です。 |
InvalidTimeToLive |
有効期限が無効です。 |
InvalidSourceAzureResourceId |
ソース Azure リソース ID が無効です。 |
ModelCopyAuthorizationExpired |
ModelCopyAuthorization の有効期限が切れています。 |
EndpointLoggingNotSupported |
エンドポイントログはサポートされていません。 |
NoLanguageIdentified |
言語識別では、どの言語も認識されませんでした。 |
MultipleLanguagesIdentified |
言語識別では、複数の言語が認識されました。 主要な言語を特定できませんでした。 |
InvalidAudioFormat |
入力オーディオの形式はサポートされていません。 |
BadChannelConfiguration |
データ内のオーディオ チャネル、構成、またはアプリケーションの要件が一致しません。 |
InvalidChannelSpecification |
文字起こし要求でのチャネルの選択はサポートされていません (たとえば、0 も 1 も選択されていません)。 |
AudioLengthLimitExceeded |
オーディオ ファイルが、許容される最大期間を超えています。 |
EmptyAudioFile |
オーディオ ファイルが空です。 |
Error
エラー
名前 | 型 | 説明 |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
エラーや予想されるポリシーに関するその他のサポートの詳細。 |
innerError |
InnerError |
|
message |
string |
高レベルのエラー メッセージ。 |
target |
string |
エラーの原因。 たとえば、無効なドキュメントの場合は "documents" または "document id" になります。 |
ErrorCode
ErrorCode
値 | 説明 |
---|---|
InvalidRequest |
無効な要求エラー コードを表します。 |
InvalidArgument |
無効な引数のエラー コードを表します。 |
InternalServerError |
内部サーバー エラー コードを表します。 |
ServiceUnavailable |
サービスを使用できないエラー コードを表します。 |
NotFound |
見つからないエラー コードを表します。 |
PipelineError |
パイプライン エラー コードを表します。 |
Conflict |
競合エラー コードを表します。 |
InternalCommunicationFailed |
内部通信に失敗したエラー コードを表します。 |
Forbidden |
禁止されているエラー コードを表します。 |
NotAllowed |
許可されていないエラー コードを表します。 |
Unauthorized |
承認されていないエラー コードを表します。 |
UnsupportedMediaType |
サポートされていないメディアの種類のエラー コードを表します。 |
TooManyRequests |
要求の数が多すぎるエラー コードを表します。 |
UnprocessableEntity |
処理不可能なエンティティ エラー コードを表します。 |
InnerError
InnerError
名前 | 型 | 説明 |
---|---|---|
code |
DetailedErrorCode |
|
details |
object |
エラーや予想されるポリシーに関するその他のサポートの詳細。 |
innerError |
InnerError |
|
message |
string |
高レベルのエラー メッセージ。 |
target |
string |
エラーの原因。 たとえば、無効なドキュメントの場合は "documents" または "document id" になります。 |
Phrase
文字起こしされた語句。
名前 | 型 | 説明 |
---|---|---|
channel |
integer (int32) |
0 から始まるチャネル インデックス。 チャネル分離が有効になっている場合にのみ存在します。 |
confidence |
number (float) |
語句の信頼度値。 |
durationMilliseconds |
integer (int32) |
語句の期間 (ミリ秒単位)。 |
locale |
string |
フレーズのロケール。 |
offsetMilliseconds |
integer (int32) |
語句の開始オフセット (ミリ秒単位)。 |
speaker |
integer (int32) |
特定の順序なしでオーディオで検出された各スピーカーに割り当てられる一意の整数。 スピーカーの diarization が有効になっている場合にのみ存在します。 |
text |
string |
フレーズの文字起こしテキスト。 |
words |
Word[] |
語句を構成する単語。 単語レベルのタイムスタンプが有効な場合にのみ存在します。 |
TranscribeResult
文字起こし操作の結果。
名前 | 型 | 説明 |
---|---|---|
combinedPhrases |
各チャネルの完全なトランスクリプト。 |
|
durationMilliseconds |
integer (int32) |
オーディオの継続時間 (ミリ秒)。 |
phrases |
Phrase[] |
文字起こしの結果が語句に分割されます。 |
Word
表示フォームのタイムスタンプ付き単語。
名前 | 型 | 説明 |
---|---|---|
durationMilliseconds |
integer (int32) |
単語の期間 (ミリ秒単位)。 |
offsetMilliseconds |
integer (int32) |
単語の開始オフセット (ミリ秒単位)。 |
text |
string |
句読点を含む認識された単語。 |