O que é transcrição em lote?

2025-08-28

A transcrição em lote é usada para transcrever um grande volume de dados de áudio no armazenamento. Tanto a API REST de Reconhecimento de fala quanto a CLI de Fala oferecem suporte à transcrição em lote.

Você deve fornecer vários arquivos por solicitação ou apontar para um contêiner de Armazenamento de Blobs do Azure com os arquivos de áudio a serem transcritos. O serviço de transcrição em lote pode lidar com um grande número de transcrições enviadas. O serviço transcreve os arquivos simultaneamente, o que reduz o tempo de retorno.

Como ele funciona?

Nas transcrições em lote é possível enviar os dados de áudio e, em seguida, recuperar os resultados da transcrição de forma assíncrona. O serviço transcreve os dados de áudio e armazena os resultados em um contêiner de armazenamento. Em seguida, você pode recuperar os resultados a partir do contêiner de armazenamento.

Dica

Para uma com pouco ou nenhum código, você pode usar o Conector de Reconhecimento de fala em lote nos aplicativos da Power Platform, como Power Automate, Power Apps e Aplicativos Lógicos. Confira o guia Transcrição em lote do Power Automate para começar.

Para usar a API REST de transcrição em lote:

Localizar arquivos de áudio para transcrição em lote – Você pode carregar seus próprios dados ou usar arquivos de áudio existentes por meio de URI público ou URI de SAS (assinatura de acesso compartilhado).
Criar uma transcrição em lote – Envie o trabalho de transcrição com parâmetros como os arquivos de áudio, a linguagem de transcrição e o modelo de transcrição.
Obter resultados da transcrição em lote – Verifique o status da transcrição e recupere os resultados da transcrição de forma assíncrona.

Importante

Os trabalhos de transcrição em lote são agendados como um melhor esforço. Nos horários de pico, pode levar até 30 minutos ou mais para que um trabalho de transcrição inicie o processamento. Veja como verificar o status atual de um trabalho de transcrição em lote nesta seção.

Práticas recomendadas para melhorar o desempenho

Tamanho da solicitação: a transcrição em lote é assíncrona e as solicitações são processadas uma de cada vez em cada região. Enviar trabalhos a uma taxa mais alta não acelera o processamento. Por exemplo, enviar 600 ou 6.000 solicitações por minuto não tem efeito na taxa de transferência. É recomendável enviar cerca de 1.000 arquivos em uma única Transcription_Create solicitação. Dessa forma, você envia menos solicitações no geral.

Distribuição de tempo: distribua suas solicitações ao longo do tempo: envie-as por várias horas, em vez de enviá-las todas em poucos minutos. O processamento de back-end mantém um nível de desempenho estável devido à largura de banda fixa, portanto, enviar solicitações muito rapidamente não melhora o desempenho.

Monitoramento de trabalho: ao monitorar o status do trabalho, a sondagem a cada poucos segundos é desnecessária. Se você enviar vários trabalhos, somente o primeiro trabalho será processado inicialmente; os trabalhos subsequentes aguardarão até que o primeiro trabalho seja concluído. Sondar todos os trabalhos frequentemente aumenta a carga do sistema sem benefícios. Verificar o status a cada 10 minutos é suficiente e não é recomendável sondar mais de uma vez por minuto.

Devido ao processamento sequencial, você pode obter o status do trabalho verificando apenas um subconjunto dos arquivos: verifique os primeiros 100 arquivos e, se eles não estiverem concluídos, os lotes posteriores provavelmente não serão concorrentes. É recomendável aguardar pelo menos um minuto (idealmente cinco minutos) antes de verificar novamente.

Evite o tráfego de pico para chamadas à API: as ListFilesUpdatechamadas de API e Get de API se comportam de forma semelhante à Create chamada e devem ser minimizadas durante os horários de pico de tráfego.

Balanceamento de carga: para otimizar a taxa de transferência para transcrição em lotes em grande escala, considere distribuir seus trabalhos em várias regiões do Azure com suporte. Essa abordagem pode ajudar a equilibrar a carga e reduzir o tempo de processamento geral, desde que seus dados e requisitos de conformidade permitam o uso de várias regiões. Examine a disponibilidade da região e verifique se o armazenamento e os recursos estão acessíveis de cada região que você planeja usar.

Compartilhar via

O que é transcrição em lote?

Como ele funciona?

Práticas recomendadas para melhorar o desempenho

Conteúdo relacionado

Comentários

Recursos adicionais