Azure OpenAI em descontinuações e desativações do modelo Azure AI Foundry

2025-09-15

Os modelos OpenAI do Azure são continuamente atualizados com modelos mais recentes e mais capazes. Como parte deste processo, os modelos mais antigos são preteridos e descontinuados. Este artigo fornece informações sobre modelos atualmente disponíveis, preteridos e desativados.

Disponibilidade do modelo

Para a disponibilidade dos modelos, consulte as seguintes informações:

As versões do modelo Geralmente Disponível (GA) estarão disponíveis por um período mínimo de 12 meses.
Após 12 meses, os clientes existentes podem continuar a usar versões de modelos mais antigos por mais seis meses.
Novos clientes que nunca implantaram a versão mais antiga do modelo não terão mais acesso após 12 meses.
Para implantações globais, todas as versões futuras do modelo começando com gpt-4o e gpt-4 0409 estarão disponíveis com seu (N) próximo modelo subsequente (N+1) para comparação em conjunto.
Os clientes têm 60 dias para experimentar um novo modelo GA em pelo menos uma região global ou padrão antes que qualquer atualização aconteça para um modelo GA mais recente.

Terminologia

Descontinuação: quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes que têm implantações existentes até que o modelo seja desativado.
Aposentadoria: Quando um modelo é aposentado, ele não está mais disponível para uso. As implantações do Azure OpenAI de um modelo aposentado sempre retornam respostas de erro.

Notificações

O Azure OpenAI notifica os clientes sobre implantações ativas do Azure OpenAI para modelos com desativações futuras. Notificamos os clientes sobre as próximas aposentadorias para cada implantação das seguintes maneiras:

Notificamos os clientes no lançamento do modelo, designando programaticamente uma data não antes da data de aposentadoria. Para modelos de pré-visualização, são 90-120 dias a partir do lançamento. Para os modelos geralmente disponíveis (GA), o prazo é de 365 dias a partir do lançamento.
Fornecemos aos clientes pelo menos 60 dias de antecedência antes da retirada do modelo para modelos GA.
Fornecemos aos clientes pelo menos 30 dias de antecedência antes das atualizações da versão do modelo de pré-visualização.

As aposentadorias são feitas de forma contínua, região por região. Não há cronograma para quando uma região específica ou SKU é atualizada.

Notificações de próximas aposentadorias

O Azure OpenAI notifica os clientes por meio de dois métodos:

Azure Resource Health: Qualquer pessoa com permissões de leitor ou superiores pode ver alertas de integridade do Azure e configurar alertas personalizados por email e SMS. Consulte Criar alertas de Saúde do Serviço.
E-mail: as notificações por e-mail são enviadas automaticamente aos proprietários da assinatura. No entanto, qualquer indivíduo com permissões de leitor pode configurar seus próprios alertas seguindo as orientações anteriores.

Configuração do filtro Azure Service Health

O serviço é azure OpenAI service. (O invólucro reflete a experiência atual de UX.)

Os tipos de eventos incluem:

Health advisories = Upgrade, Deprecation, & Retirement Notifications.
Service issue = Outages. (Recomendamos esse tipo de evento somente se você quiser ser notificado sobre interrupções.)

Se você quiser receber alertas baseados em texto SMS em vez de apenas e-mails, selecione Criar grupo de ação. Em seguida, em Tipo de notificação, selecione E-mail/Mensagem SMS/Push/Voz e configure seu número de telefone.

Considerações para a nuvem pública do Azure

Esteja atento às seguintes informações:

Nem todas as combinações de versões de modelos estarão disponíveis em todas as regiões.
As versões N e N+1 do modelo podem não estar sempre disponíveis na mesma região.
Uma versão N do modelo GA pode ser atualizada para uma versão N+X futura do modelo em algumas regiões com base em limitações de capacidade e sem que a nova versão N+X do modelo esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes de qualquer atualização ser agendada.
As versões de modelo de visualização e as versões GA do mesmo modelo nem sempre estarão disponíveis para teste juntas na mesma região. Haverá versões de pré-visualização e GA disponíveis para teste em diferentes regiões.
Reservamo-nos o direito de limitar o uso de uma região específica por futuros clientes para equilibrar a qualidade do serviço para os clientes existentes.
Como sempre na Microsoft, a segurança é de extrema importância. Se um modelo ou versão do modelo tiver problemas de conformidade ou segurança, reservamo-nos o direito de invocar a necessidade de fazer aposentadorias emergenciais. Consulte os termos de serviço para obter mais informações.

Considerações especiais para nuvens do Azure Government

As implantações padrão globais não estão disponíveis em nuvens governamentais.
Nem todos os modelos ou versões de modelos disponíveis em nuvens comerciais e públicas estarão disponíveis em nuvens governamentais.
Nas nuvens do Azure Government, pretendemos oferecer suporte a apenas uma versão de um determinado modelo de cada vez. Por exemplo, apenas uma versão de gpt-35-turbo 0125 e gpt-4o (2024-05-13).
No entanto, há uma sobreposição de 30 dias entre as novas versões do modelo, quando mais de duas estarão disponíveis. Por exemplo, se gpt-35-turbo 0125 ou gpt-4o (2024-05-13) for atualizado para uma versão futura. Outro exemplo são as mudanças na família de modelos além das atualizações de versão, como ao mudar de gpt-4 1106-preview para .gpt-4o (2024-05-13)

Preparação para desativações de modelos e atualizações de versão

Para se preparar para desativações de modelos e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e avaliem seu comportamento. Também recomendamos que os clientes atualizem seus aplicativos para usar os novos modelos e versões antes da data de aposentadoria.

Para obter mais informações sobre o processo de avaliação do modelo, consulte a postagem do blog Introdução à avaliação do modelo .

Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.

Para obter mais informações sobre como gerenciar atualizações de modelo e migrações para implantações provisionadas, consulte Gerenciando modelos em tipos de implantação provisionados.

Modelos atuais

Observação

Nem todos os modelos passam por um período de depreciação antes da aposentadoria. Algumas versões ou modelos têm apenas uma data de descontinuação.

Os modelos ajustados estão sujeitos a um cronograma de descontinuação e retirada diferente em comparação ao modelo base equivalente.

Esses modelos estão atualmente disponíveis para uso no Azure OpenAI.

Geração de texto

Modelo	Versão	Ciclo de vida Situação	Data da aposentadoria	Modelo de substituição
`computer-use-preview`	11-03-2025	Previsualizar	Não antes de 10 de outubro de 2025
`gpt-35-turbo`	1106	Geralmente disponível	11 de novembro de 2025	`gpt-4.1-mini`
`gpt-35-turbo`	0125	Geralmente disponível	11 de novembro de 2025	`gpt-4.1-mini`
`gpt-3.5-turbo-instruct`	0914	Geralmente disponível	11 de novembro de 2025
`gpt-4`	turbo-2024-04-09	Geralmente disponível	11 de novembro de 2025	`gpt-4.1`
`gpt-5-chat`	2025-08-07	Previsualizar	Não antes de 15 de novembro de 2025
`o1-mini`	2024-09-12	Geralmente disponível	17 de novembro de 2025	`o4-mini` ou `gpt-5-mini`
`model-router`	19-05-2025	Previsualizar	Não antes de 30 de novembro de 2025
`model-router`	2025-08-07	Previsualizar	Não antes de 30 de novembro de 2025
`o3-mini`	31-01-2025	Geralmente disponível	Não antes de 1 de fevereiro de 2026	`o4-mini`
`gpt-4o`	13 de maio de 2024	Geralmente disponível	Não antes de 27 de fevereiro de 2026	`gpt-4.1`
`gpt-4o-mini`	18-07-2024	Geralmente disponível	Não antes de 27 de fevereiro de 2026	`gpt-4.1-mini`
`gpt-4o`	2024-08-06	Geralmente disponível	Não antes de 27 de fevereiro de 2026	`gpt-4.1`
`gpt-4o`	2024-11-20	Geralmente disponível	Não antes de 1 de março de 2026	`gpt-4.1`
`gpt-4.1`	2025-04-14	Geralmente disponível	Não antes de 11 de abril de 2026
`gpt-4.1-mini`	2025-04-14	Geralmente disponível	Não antes de 11 de abril de 2026
`gpt-4.1-nano`	2025-04-14	Geralmente disponível	Não antes de 11 de abril de 2026
`o4-mini`	2025-04-16	Geralmente disponível	Não antes de 11 de abril de 2026
`o3`	2025-04-16	Geralmente disponível	Não antes de 11 de abril de 2026
`o3-pro`	2025-06-10	Geralmente disponível	Não antes de 18 de junho de 2026
`codex-mini`	2025-05-16	Geralmente disponível	Não antes de 19 de junho de 2026
`o3-deep-research`	2025-06-26	Geralmente disponível	Não antes de 26 de junho de 2026
`o1`	17-12-2024	Geralmente disponível	Não antes de 15 de julho de 2026
`gpt-5`	2025-08-07	Geralmente disponível	Não antes de 7 de agosto de 2026
`gpt-5-mini`	2025-08-07	Geralmente disponível	Não antes de 7 de agosto de 2026
`gpt-5-nano`	2025-08-07	Geralmente disponível	Não antes de 7 de agosto de 2026

Áudio

Modelo	Versão	Ciclo de vida Situação	Data da aposentadoria
`gpt-4o-realtime-preview`	2025-06-03	Previsualizar	Não antes de 1 de setembro de 2025
`gpt-4o-mini-realtime-preview`	17-12-2024	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-realtime-preview`	17-12-2024	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-audio-preview`	17-12-2024	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-audio-preview`	17-12-2024	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-transcribe`	2025-03-20	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-mini-tts`	2025-03-20	Previsualizar	Não antes de 17 de setembro de 2025
`gpt-4o-mini-transcribe`	2025-03-20	Previsualizar	Não antes de 17 de setembro de 2025
`tts`	001	Geralmente disponível	Não antes de 1 de fevereiro de 2026
`tts-hd`	001	Geralmente disponível	Não antes de 1 de fevereiro de 2026
`whisper`	001	Geralmente disponível	Não antes de 1 de fevereiro de 2026

Imagem e vídeo

Modelo	Versão	Ciclo de vida Situação	Data da aposentadoria
`sora`	2025-05-02	Previsualizar	Não antes de 15 de outubro de 2025
`dalle-3`	3	Geralmente disponível	Não antes de 31 de outubro de 2025
`gpt-image-1`	2025-04-15	Previsualizar	Não antes de 31 de outubro de 2025

Incorporação

Modelo	Versão	Ciclo de vida Situação	Data da aposentadoria	Modelo de substituição
`text-embedding-ada-002`	2	Geralmente disponível	Não antes de 30 de abril de 2026	`text-embedding-3-small` ou `text-embedding-3-large`
`text-embedding-ada-002`	1	Geralmente disponível	Não antes de 30 de abril de 2026	`text-embedding-3-small` ou `text-embedding-3-large`
`text-embedding-3-small`	1	Geralmente disponível	Não antes de 30 de abril de 2026
`text-embedding-3-large`	1	Geralmente disponível	Não antes de 30 de abril de 2026

Notificamos todos os clientes com estas implementações de pré-visualização pelo menos 30 dias antes do início das atualizações. Publicamos um cronograma de atualização que detalha a ordem das regiões e versões de modelo que seguimos durante as atualizações e vinculamos a esse cronograma a partir daqui.

Sugestão

Uma atualização do modelo acontecerá se a nova versão do modelo ainda não estiver disponível nessa região?

Sim, mesmo nos casos em que a versão mais recente do modelo ainda não está disponível em uma região, atualizamos automaticamente as implantações durante a janela de atualização agendada. Para obter mais informações, consulte Versões de modelo do Azure OpenAI.

Modelos ajustados

Os modelos ajustados se aposentam em duas fases: treinamento e implantação.

Todos os modelos ajustados seguem o seu modelo de base equivalente para a descontinuação do treinamento. Depois que um modelo é aposentado, ele não está mais disponível para ajuste fino.

Para modelos ajustados geralmente disponibilizados desde gpt-4o-2024-08-06, a descontinuação da implementação ocorre 1 ano após a descontinuação do treinamento. Na retirada da implantação, a inferência e a própria implantação retornam respostas de erro.

Modelo	Versão	Data de cessação do treinamento	Data de desativação da implantação
`gpt-35-turbo`	1106	Na aposentadoria do modelo base	Na aposentadoria de treinamento
`gpt-35-turbo`	0125	Na aposentadoria do modelo base	Na aposentadoria de treinamento
`gpt-4o`	2024-08-06	Na aposentadoria do modelo base	Um ano após a reforma
`gpt-4o-mini`	18-07-2024	Na aposentadoria do modelo base	Um ano após a reforma
`gpt-4.1`	2025-04-14	Na aposentadoria do modelo base	Um ano após a reforma
`gpt-4.1-mini`	2025-04-14	Na aposentadoria do modelo base	Um ano após a reforma
`gpt-4.1-nano`	2025-04-14	Na aposentadoria do modelo base	Um ano após a reforma
`o4-mini`	2025-04-16	Na aposentadoria do modelo base	Um ano após a reforma

Versões de modelo padrão

Modelo	Versão padrão atual	Nova versão padrão	Data de atualização padrão
`gpt-35-turbo`	0125		As implantações de versões `0301`, `0613`e `1106` definidas para atualizar automaticamente para padrão serão automaticamente atualizadas para a versão: `0125`, a partir de 21 de janeiro de 2025.
`gpt-4o`	2024-08-06	-	-

Histórico de Aposentadoria e Descontinuação

Para acompanhar atualizações individuais deste artigo, consulte o histórico do Git.

Para obter uma lista de modelos desativados, consulte a página de modelos desativados.

Comentários

Esta página foi útil?