Partilhar via


Azure OpenAI em descontinuações e desativações do modelo Azure AI Foundry

Os modelos OpenAI do Azure são continuamente atualizados com modelos mais recentes e mais capazes. Como parte deste processo, os modelos mais antigos são preteridos e descontinuados. Este artigo fornece informações sobre modelos atualmente disponíveis, preteridos e desativados.

Disponibilidade do modelo

Para a disponibilidade dos modelos, consulte as seguintes informações:

  • As versões do modelo Geralmente Disponível (GA) estarão disponíveis por um período mínimo de 12 meses.
  • Após 12 meses, os clientes existentes podem continuar a usar versões de modelos mais antigos por mais seis meses.
  • Novos clientes que nunca implantaram a versão mais antiga do modelo não terão mais acesso após 12 meses.
  • Para implantações globais, todas as versões futuras do modelo começando com gpt-4o e gpt-4 0409 estarão disponíveis com seu (N) próximo modelo subsequente (N+1) para comparação em conjunto.
  • Os clientes têm 60 dias para experimentar um novo modelo GA em pelo menos uma região global ou padrão antes que qualquer atualização aconteça para um modelo GA mais recente.

Terminologia

  • Descontinuação: quando um modelo é preterido, ele não está mais disponível para novos clientes. Ele continua disponível para uso por clientes que têm implantações existentes até que o modelo seja desativado.
  • Aposentadoria: Quando um modelo é aposentado, ele não está mais disponível para uso. As implantações do Azure OpenAI de um modelo aposentado sempre retornam respostas de erro.

Notificações

O Azure OpenAI notifica os clientes sobre implantações ativas do Azure OpenAI para modelos com desativações futuras. Notificamos os clientes sobre as próximas aposentadorias para cada implantação das seguintes maneiras:

  • Notificamos os clientes no lançamento do modelo, designando programaticamente uma data não antes da data de aposentadoria. Para modelos de pré-visualização, são 90-120 dias a partir do lançamento. Para os modelos geralmente disponíveis (GA), o prazo é de 365 dias a partir do lançamento.
  • Fornecemos aos clientes pelo menos 60 dias de antecedência antes da retirada do modelo para modelos GA.
  • Fornecemos aos clientes pelo menos 30 dias de antecedência antes das atualizações da versão do modelo de pré-visualização.

As aposentadorias são feitas de forma contínua, região por região. Não há cronograma para quando uma região específica ou SKU é atualizada.

Notificações de próximas aposentadorias

O Azure OpenAI notifica os clientes por meio de dois métodos:

  • Azure Resource Health: Qualquer pessoa com permissões de leitor ou superiores pode ver alertas de integridade do Azure e configurar alertas personalizados por email e SMS. Consulte Criar alertas de Saúde do Serviço.
  • E-mail: as notificações por e-mail são enviadas automaticamente aos proprietários da assinatura. No entanto, qualquer indivíduo com permissões de leitor pode configurar seus próprios alertas seguindo as orientações anteriores.

Configuração do filtro Azure Service Health

O serviço é azure OpenAI service. (O invólucro reflete a experiência atual de UX.)

Os tipos de eventos incluem:

  • Health advisories = Upgrade, Deprecation, & Retirement Notifications.
  • Service issue = Outages. (Recomendamos esse tipo de evento somente se você quiser ser notificado sobre interrupções.)

Se você quiser receber alertas baseados em texto SMS em vez de apenas e-mails, selecione Criar grupo de ação. Em seguida, em Tipo de notificação, selecione E-mail/Mensagem SMS/Push/Voz e configure seu número de telefone.

Considerações para a nuvem pública do Azure

Esteja atento às seguintes informações:

  • Nem todas as combinações de versões de modelos estarão disponíveis em todas as regiões.
  • As versões N e N+1 do modelo podem não estar sempre disponíveis na mesma região.
  • Uma versão N do modelo GA pode ser atualizada para uma versão N+X futura do modelo em algumas regiões com base em limitações de capacidade e sem que a nova versão N+X do modelo esteja disponível separadamente para teste na mesma região. A nova versão do modelo estará disponível para teste em outras regiões antes de qualquer atualização ser agendada.
  • As versões de modelo de visualização e as versões GA do mesmo modelo nem sempre estarão disponíveis para teste juntas na mesma região. Haverá versões de pré-visualização e GA disponíveis para teste em diferentes regiões.
  • Reservamo-nos o direito de limitar o uso de uma região específica por futuros clientes para equilibrar a qualidade do serviço para os clientes existentes.
  • Como sempre na Microsoft, a segurança é de extrema importância. Se um modelo ou versão do modelo tiver problemas de conformidade ou segurança, reservamo-nos o direito de invocar a necessidade de fazer aposentadorias emergenciais. Consulte os termos de serviço para obter mais informações.

Considerações especiais para nuvens do Azure Government

  • As implantações padrão globais não estão disponíveis em nuvens governamentais.
  • Nem todos os modelos ou versões de modelos disponíveis em nuvens comerciais e públicas estarão disponíveis em nuvens governamentais.
  • Nas nuvens do Azure Government, pretendemos oferecer suporte a apenas uma versão de um determinado modelo de cada vez. Por exemplo, apenas uma versão de gpt-35-turbo 0125 e gpt-4o (2024-05-13).
  • No entanto, há uma sobreposição de 30 dias entre as novas versões do modelo, quando mais de duas estarão disponíveis. Por exemplo, se gpt-35-turbo 0125 ou gpt-4o (2024-05-13) for atualizado para uma versão futura. Outro exemplo são as mudanças na família de modelos além das atualizações de versão, como ao mudar de gpt-4 1106-preview para .gpt-4o (2024-05-13)

Preparação para desativações de modelos e atualizações de versão

Para se preparar para desativações de modelos e atualizações de versão, recomendamos que os clientes testem seus aplicativos com os novos modelos e versões e avaliem seu comportamento. Também recomendamos que os clientes atualizem seus aplicativos para usar os novos modelos e versões antes da data de aposentadoria.

Para obter mais informações sobre o processo de avaliação do modelo, consulte a postagem do blog Introdução à avaliação do modelo .

Para obter informações sobre o processo de atualização do modelo, consulte Como atualizar para um novo modelo ou versão.

Para obter mais informações sobre como gerenciar atualizações de modelo e migrações para implantações provisionadas, consulte Gerenciando modelos em tipos de implantação provisionados.

Modelos atuais

Observação

Nem todos os modelos passam por um período de depreciação antes da aposentadoria. Algumas versões ou modelos têm apenas uma data de descontinuação.

Os modelos ajustados estão sujeitos a um cronograma de descontinuação e retirada diferente em comparação ao modelo base equivalente.

Esses modelos estão atualmente disponíveis para uso no Azure OpenAI.

Geração de texto

Modelo Versão Ciclo de vida
Situação
Data da aposentadoria Modelo de substituição
computer-use-preview 11-03-2025 Previsualizar Não antes de 10 de outubro de 2025
gpt-35-turbo 1106 Geralmente disponível 11 de novembro de 2025 gpt-4.1-mini
gpt-35-turbo 0125 Geralmente disponível 11 de novembro de 2025 gpt-4.1-mini
gpt-3.5-turbo-instruct 0914 Geralmente disponível 11 de novembro de 2025
gpt-4 turbo-2024-04-09 Geralmente disponível 11 de novembro de 2025 gpt-4.1
gpt-5-chat 2025-08-07 Previsualizar Não antes de 15 de novembro de 2025
o1-mini 2024-09-12 Geralmente disponível 17 de novembro de 2025 o4-mini ou gpt-5-mini
model-router 19-05-2025 Previsualizar Não antes de 30 de novembro de 2025
model-router 2025-08-07 Previsualizar Não antes de 30 de novembro de 2025
o3-mini 31-01-2025 Geralmente disponível Não antes de 1 de fevereiro de 2026 o4-mini
gpt-4o 13 de maio de 2024 Geralmente disponível Não antes de 27 de fevereiro de 2026 gpt-4.1
gpt-4o-mini 18-07-2024 Geralmente disponível Não antes de 27 de fevereiro de 2026 gpt-4.1-mini
gpt-4o 2024-08-06 Geralmente disponível Não antes de 27 de fevereiro de 2026 gpt-4.1
gpt-4o 2024-11-20 Geralmente disponível Não antes de 1 de março de 2026 gpt-4.1
gpt-4.1 2025-04-14 Geralmente disponível Não antes de 11 de abril de 2026
gpt-4.1-mini 2025-04-14 Geralmente disponível Não antes de 11 de abril de 2026
gpt-4.1-nano 2025-04-14 Geralmente disponível Não antes de 11 de abril de 2026
o4-mini 2025-04-16 Geralmente disponível Não antes de 11 de abril de 2026
o3 2025-04-16 Geralmente disponível Não antes de 11 de abril de 2026
o3-pro 2025-06-10 Geralmente disponível Não antes de 18 de junho de 2026
codex-mini 2025-05-16 Geralmente disponível Não antes de 19 de junho de 2026
o3-deep-research 2025-06-26 Geralmente disponível Não antes de 26 de junho de 2026
o1 17-12-2024 Geralmente disponível Não antes de 15 de julho de 2026
gpt-5 2025-08-07 Geralmente disponível Não antes de 7 de agosto de 2026
gpt-5-mini 2025-08-07 Geralmente disponível Não antes de 7 de agosto de 2026
gpt-5-nano 2025-08-07 Geralmente disponível Não antes de 7 de agosto de 2026

Notificamos todos os clientes com estas implementações de pré-visualização pelo menos 30 dias antes do início das atualizações. Publicamos um cronograma de atualização que detalha a ordem das regiões e versões de modelo que seguimos durante as atualizações e vinculamos a esse cronograma a partir daqui.

Sugestão

Uma atualização do modelo acontecerá se a nova versão do modelo ainda não estiver disponível nessa região?

Sim, mesmo nos casos em que a versão mais recente do modelo ainda não está disponível em uma região, atualizamos automaticamente as implantações durante a janela de atualização agendada. Para obter mais informações, consulte Versões de modelo do Azure OpenAI.

Modelos ajustados

Os modelos ajustados se aposentam em duas fases: treinamento e implantação.

Todos os modelos ajustados seguem o seu modelo de base equivalente para a descontinuação do treinamento. Depois que um modelo é aposentado, ele não está mais disponível para ajuste fino.

Para modelos ajustados geralmente disponibilizados desde gpt-4o-2024-08-06, a descontinuação da implementação ocorre 1 ano após a descontinuação do treinamento. Na retirada da implantação, a inferência e a própria implantação retornam respostas de erro.

Modelo Versão Data de cessação do treinamento Data de desativação da implantação
gpt-35-turbo 1106 Na aposentadoria do modelo base Na aposentadoria de treinamento
gpt-35-turbo 0125 Na aposentadoria do modelo base Na aposentadoria de treinamento
gpt-4o 2024-08-06 Na aposentadoria do modelo base Um ano após a reforma
gpt-4o-mini 18-07-2024 Na aposentadoria do modelo base Um ano após a reforma
gpt-4.1 2025-04-14 Na aposentadoria do modelo base Um ano após a reforma
gpt-4.1-mini 2025-04-14 Na aposentadoria do modelo base Um ano após a reforma
gpt-4.1-nano 2025-04-14 Na aposentadoria do modelo base Um ano após a reforma
o4-mini 2025-04-16 Na aposentadoria do modelo base Um ano após a reforma

Versões de modelo padrão

Modelo Versão padrão atual Nova versão padrão Data de atualização padrão
gpt-35-turbo 0125 As implantações de versões 0301, 0613e 1106 definidas para atualizar automaticamente para padrão serão automaticamente atualizadas para a versão: 0125, a partir de 21 de janeiro de 2025.
gpt-4o 2024-08-06 - -

Histórico de Aposentadoria e Descontinuação

Para acompanhar atualizações individuais deste artigo, consulte o histórico do Git.

Para obter uma lista de modelos desativados, consulte a página de modelos desativados.