次の方法で共有


Transcriptions - Transcribe

オーディオ ファイルの同期文字起こし。

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

URI パラメーター

名前 / 必須 説明
audio
formData True

file (binary)

文字起こしするオーディオ ファイルの内容。 オーディオ ファイルは、オーディオ期間が 2 時間より短く、サイズが 250 MB 未満である必要があります。

definition
formData

string

文字起こし要求のメタデータ。 このフィールドには、TranscribeDefinition型の JSON シリアル化オブジェクトが含まれています。

endpoint
path True

string

サポートされている Cognitive Services エンドポイント (プロトコルとホスト名、例: https://westus.api.cognitive.microsoft.com)。

api-version
query True

string

要求された API バージョン。

要求ヘッダー

Media Types: "multipart/form-data"

名前 必須 説明
Ocp-Apim-Subscription-Key True

string

コグニティブ サービス アカウント キーをここで指定します。

応答

名前 説明
200 OK

TranscribeResult

わかりました

Other Status Codes

Error

エラーが発生しました。

セキュリティ

Ocp-Apim-Subscription-Key

コグニティブ サービス アカウント キーをここで指定します。

型: apiKey
/: header

Transcribe an audio file

要求のサンプル

POST {endpoint}/speechtotext/transcriptions:transcribe?api-version=2024-11-15

応答のサンプル

{
  "durationMilliseconds": 2000,
  "combinedPhrases": [
    {
      "text": "Weather"
    }
  ],
  "phrases": [
    {
      "offsetMilliseconds": 40,
      "durationMilliseconds": 320,
      "text": "Weather",
      "words": [
        {
          "text": "weather",
          "offsetMilliseconds": 40,
          "durationMilliseconds": 320
        }
      ],
      "locale": "en-US",
      "confidence": 0.78983736
    }
  ]
}

定義

名前 説明
ChannelCombinedPhrases

チャネルごとの完全なトランスクリプト。

DetailedErrorCode

DetailedErrorCode

Error

エラー

ErrorCode

ErrorCode

InnerError

InnerError

Phrase

文字起こしされた語句。

TranscribeResult

文字起こし操作の結果。

Word

表示フォームのタイムスタンプ付き単語。

ChannelCombinedPhrases

チャネルごとの完全なトランスクリプト。

名前 説明
channel

integer (int32)

0 から始まるチャネル インデックス。 チャネル分離が有効になっている場合にのみ存在します。

text

string

文字起こしされたテキスト。

DetailedErrorCode

DetailedErrorCode

説明
InvalidParameterValue

パラメーター値が無効です。

InvalidRequestBodyFormat

要求本文の形式が無効です。

EmptyRequest

空の要求。

MissingInputRecords

入力レコードがありません。

InvalidDocument

ドキュメントが無効です。

ModelVersionIncorrect

モデルのバージョンが正しくありません。

InvalidDocumentBatch

ドキュメント バッチが無効です。

UnsupportedLanguageCode

サポートされていない言語コード。

DataImportFailed

データのインポートに失敗しました。

InUseViolation

使用中の違反。

InvalidLocale

ロケールが無効です。

InvalidBaseModel

ベース モデルが無効です。

InvalidAdaptationMapping

適応マッピングが無効です。

InvalidDataset

データセットが無効です。

InvalidTest

テストが無効です。

FailedDataset

失敗したデータセット。

InvalidModel

モデルが無効です。

InvalidTranscription

文字起こしが無効です。

InvalidPayload

ペイロードが無効です。

InvalidParameter

パラメーターが無効です。

EndpointWithoutLogging

ログ記録なしのエンドポイント。

InvalidPermissions

アクセス許可が無効です。

InvalidPrerequisite

前提条件が無効です。

InvalidProductId

製品 ID が無効です。

InvalidSubscription

サブスクリプションが無効です。

InvalidProject

プロジェクトが無効です。

InvalidProjectKind

プロジェクトの種類が無効です。

InvalidRecordingsUri

無効な記録 URI。

OnlyOneOfUrlsOrContainerOrDataset

URL またはコンテナーまたはデータセットのいずれか 1 つだけ。

ExceededNumberOfRecordingsUris

記録 URI の数を超えました。

InvalidChannels

チャネルが無効です。

ModelMismatch

モデルの不一致。

ProjectGenderMismatch

プロジェクトの性別の不一致。

ModelDeprecated

モデルは非推奨になりました。

ModelExists

モデルが存在します。

ModelNotDeployable

モデルはデプロイできません。

EndpointNotUpdatable

エンドポイントは更新できません。

SingleDefaultEndpoint

単一の既定のエンドポイント。

EndpointCannotBeDefault

エンドポイントを既定にすることはできません。

InvalidModelUri

モデル URI が無効です。

SubscriptionNotFound

サブスクリプションが見つかりません。

QuotaViolation

クォータ違反。

UnsupportedDelta

サポートされていないデルタ。

UnsupportedFilter

サポートされていないフィルター。

UnsupportedPagination

サポートされていない改ページ位置。

UnsupportedDynamicConfiguration

サポートされていない動的構成。

UnsupportedOrderBy

サポートされていない注文者。

NoUtf8WithBom

bom を含む utf8 はありません。

ModelDeploymentNotCompleteState

モデルのデプロイが完了していない状態です。

SkuLimitsExist

SKU の制限が存在します。

DeployingFailedModel

失敗したモデルのデプロイ。

UnsupportedTimeRange

サポートされていない時間範囲。

InvalidLogDate

ログの日付が無効です。

InvalidLogId

無効なログ ID です。

InvalidLogStartTime

ログの開始時刻が無効です。

InvalidLogEndTime

ログの終了時刻が無効です。

InvalidTopForLogs

ログの top が無効です。

InvalidSkipTokenForLogs

ログのスキップ トークンが無効です。

DeleteNotAllowed

削除は許可されていません。

Forbidden

禁じられた。

DeployNotAllowed

デプロイは許可されていません。

UnexpectedError

予期しないエラー。

InvalidCollection

コレクションが無効です。

InvalidCallbackUri

コールバック URI が無効です。

InvalidSasValidityDuration

SAS の有効期間が無効です。

InaccessibleCustomerStorage

お客様のストレージにアクセスできません。

UnsupportedClassBasedAdaptation

サポートされていないクラス ベースの適応。

InvalidWebHookEventKind

Web フック イベントの種類が無効です。

InvalidTimeToLive

有効期限が無効です。

InvalidSourceAzureResourceId

ソース Azure リソース ID が無効です。

ModelCopyAuthorizationExpired

ModelCopyAuthorization の有効期限が切れています。

EndpointLoggingNotSupported

エンドポイントログはサポートされていません。

NoLanguageIdentified

言語識別では、どの言語も認識されませんでした。

MultipleLanguagesIdentified

言語識別では、複数の言語が認識されました。 主要な言語を特定できませんでした。

InvalidAudioFormat

入力オーディオの形式はサポートされていません。

BadChannelConfiguration

データ内のオーディオ チャネル、構成、またはアプリケーションの要件が一致しません。

InvalidChannelSpecification

文字起こし要求でのチャネルの選択はサポートされていません (たとえば、0 も 1 も選択されていません)。

AudioLengthLimitExceeded

オーディオ ファイルが、許容される最大期間を超えています。

EmptyAudioFile

オーディオ ファイルが空です。

Error

エラー

名前 説明
code

ErrorCode

ErrorCode
大まかなエラー コード。

details

Error[]

エラーや予想されるポリシーに関するその他のサポートの詳細。

innerError

InnerError

InnerError
https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owで利用可能な Cognitive Services API ガイドラインに準拠した新しい内部エラー形式。 これには、必須プロパティ ErrorCode、メッセージ、および省略可能なプロパティ ターゲット、details(キー値ペア)、内部エラー (入れ子にできます) が含まれます。

message

string

高レベルのエラー メッセージ。

target

string

エラーの原因。 たとえば、無効なドキュメントの場合は "documents" または "document id" になります。

ErrorCode

ErrorCode

説明
InvalidRequest

無効な要求エラー コードを表します。

InvalidArgument

無効な引数のエラー コードを表します。

InternalServerError

内部サーバー エラー コードを表します。

ServiceUnavailable

サービスを使用できないエラー コードを表します。

NotFound

見つからないエラー コードを表します。

PipelineError

パイプライン エラー コードを表します。

Conflict

競合エラー コードを表します。

InternalCommunicationFailed

内部通信に失敗したエラー コードを表します。

Forbidden

禁止されているエラー コードを表します。

NotAllowed

許可されていないエラー コードを表します。

Unauthorized

承認されていないエラー コードを表します。

UnsupportedMediaType

サポートされていないメディアの種類のエラー コードを表します。

TooManyRequests

要求の数が多すぎるエラー コードを表します。

UnprocessableEntity

処理不可能なエンティティ エラー コードを表します。

InnerError

InnerError

名前 説明
code

DetailedErrorCode

DetailedErrorCode
詳細なエラー コード列挙型。

details

object

エラーや予想されるポリシーに関するその他のサポートの詳細。

innerError

InnerError

InnerError
https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8owで利用可能な Cognitive Services API ガイドラインに準拠した新しい内部エラー形式。 これには、必須プロパティ ErrorCode、メッセージ、および省略可能なプロパティ ターゲット、details(キー値ペア)、内部エラー (入れ子にできます) が含まれます。

message

string

高レベルのエラー メッセージ。

target

string

エラーの原因。 たとえば、無効なドキュメントの場合は "documents" または "document id" になります。

Phrase

文字起こしされた語句。

名前 説明
channel

integer (int32)

0 から始まるチャネル インデックス。 チャネル分離が有効になっている場合にのみ存在します。

confidence

number (float)

語句の信頼度値。

durationMilliseconds

integer (int32)

語句の期間 (ミリ秒単位)。

locale

string

フレーズのロケール。

offsetMilliseconds

integer (int32)

語句の開始オフセット (ミリ秒単位)。

speaker

integer (int32)

特定の順序なしでオーディオで検出された各スピーカーに割り当てられる一意の整数。 スピーカーの diarization が有効になっている場合にのみ存在します。

text

string

フレーズの文字起こしテキスト。

words

Word[]

語句を構成する単語。 単語レベルのタイムスタンプが有効な場合にのみ存在します。

TranscribeResult

文字起こし操作の結果。

名前 説明
combinedPhrases

ChannelCombinedPhrases[]

各チャネルの完全なトランスクリプト。

durationMilliseconds

integer (int32)

オーディオの継続時間 (ミリ秒)。

phrases

Phrase[]

文字起こしの結果が語句に分割されます。

Word

表示フォームのタイムスタンプ付き単語。

名前 説明
durationMilliseconds

integer (int32)

単語の期間 (ミリ秒単位)。

offsetMilliseconds

integer (int32)

単語の開始オフセット (ミリ秒単位)。

text

string

句読点を含む認識された単語。