Ciclo de vida da API do OpenAI do Azure em Modelos da Fábrica de IA do Azure

Este artigo é para ajudá-lo a entender o ciclo de vida de suporte para APIs do Azure OpenAI.

Observação

Novos objetos de resposta de API podem ser adicionados à resposta da API a qualquer momento. Recomendamos que você analise apenas os objetos de resposta necessários.

Evolução da API

Anteriormente, o OpenAI do Azure recebia atualizações mensais de novas versões de API. Aproveitar os novos recursos exigia atualizar constantemente o código e as variáveis de ambiente a cada nova versão da API. O Azure OpenAI também exigiu a etapa extra do uso de clientes específicos do Azure que criaram sobrecarga ao migrar código entre o OpenAI e o Azure OpenAI.

A partir de agosto de 2025, você poderá aceitar nossas APIs do OpenAI do Azure da próxima geração v1 que adicionam suporte para:

Acesso contínuo aos recursos mais recentes, sem necessidade de especificar novos api-version a cada mês.
Ciclo de lançamento de API mais rápido com novos recursos sendo iniciados com mais frequência.
Suporte ao cliente OpenAI com alterações mínimas de código para trocar entre OpenAI e OpenAI do Azure ao usar a autenticação baseada em chave.
Suporte ao cliente do OpenAI para obter autenticação baseada em token e atualização automática de token sem a necessidade de depender de um cliente Azure OpenAI separado.
Faça chamadas de conclusão de chat com modelos de outros provedores, como DeepSeek e Grok, que dão suporte à sintaxe de conclusões de chat v1.

O acesso a novas chamadas à API que ainda estão em versão prévia será controlado passando cabeçalhos de visualização específicos do recurso, permitindo aceitar os recursos desejados, sem precisar trocar as versões da API. Opcionalmente, alguns recursos indicarão o status de versão prévia por meio de seu caminho de API e não exigirão um cabeçalho adicional.

Exemplos:

/openai/v1/evals está em versão prévia e requer a passagem de um cabeçalho de "aoai-evals":"preview".
/openai/v1/fine_tuning/alpha/graders/ está em versão prévia e não requer nenhum cabeçalho personalizado devido à presença de alpha no caminho da API.

Para a inicialização da API de GA (disponibilidade geral) v1 inicial, só há suporte para um subconjunto dos recursos de API de inferência e criação. Todos os recursos de GA têm suporte para uso em produção. Em breve, adicionaremos suporte para mais recursos.

Alterações de código

API v1

Exemplos do Python v1

Chave de API:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),
    base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)

response = client.responses.create(   
  model="gpt-4.1-nano", # Replace with your model deployment name 
  input="This is a test.",
)

print(response.model_dump_json(indent=2))

OpenAI() o cliente é usado em vez de AzureOpenAI().
base_url passa o ponto de extremidade do OpenAI do Azure e /openai/v1 é acrescentado ao endereço do ponto de extremidade.
api-version não é mais um parâmetro necessário com a API de GA v1.

Chave de API com variáveis de ambiente definidas para OPENAI_BASE_URL e OPENAI_API_KEY:

client = OpenAI()

Microsoft Entra ID:

Importante

O tratamento da atualização automática de token foi tratado anteriormente por meio do uso do cliente AzureOpenAI(). A API v1 remove essa dependência adicionando suporte automático de atualização de token ao cliente OpenAI().

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key = token_provider  
)

response = client.responses.create(
    model="gpt-4.1-nano",
    input= "This is a test" 
)

print(response.model_dump_json(indent=2))

base_url passa o ponto de extremidade do OpenAI do Azure e /openai/v1 é acrescentado ao endereço do ponto de extremidade.
api_key o parâmetro é definido como token_provider, habilitando a recuperação automática e a atualização de um token de autenticação em vez de usar uma chave de API estática.

API v1

Exemplos do C# v1

Chave de API:

OpenAIClient client = new(
    new ApiKeyCredential("{your-api-key}"),
    new OpenAIClientOptions()
    {
        Endpoint = new("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    })

Microsoft Entra ID:

#pragma warning disable OPENAI001

BearerTokenPolicy tokenPolicy = new(
    new DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default");
OpenAIClient client = new(
    authenticationPolicy: tokenPolicy,
    options: new OpenAIClientOptions()
    {
        Endpoint = new("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    })

API v1

Exemplos do JavaScript v1

Chave de API:

const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: "{your-api-key}" 
});

Chave de API com variáveis de ambiente definidas para OPENAI_BASE_URL e OPENAI_API_KEY:

const client = new OpenAI();

Microsoft Entra ID:

const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://cognitiveservices.azure.com/.default');
const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: tokenProvider
});

API v1

Exemplos do Go v1

Chave de API:

client := openai.NewClient(
    option.WithBaseURL("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    option.WithAPIKey("{your-api-key}")
)

Chave de API com variáveis de ambiente definidas para OPENAI_BASE_URL e OPENAI_API_KEY:

client := openai.NewClient()

Microsoft Entra ID:

tokenCredential, err := azidentity.NewDefaultAzureCredential(nil)

client := openai.NewClient(
    option.WithBaseURL("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    azure.WithTokenCredential(tokenCredential)
)

Exemplos do Java v1

API v1

Chave de API:


OpenAIClient client = OpenAIOkHttpClient.builder()
                .baseUrl("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/")
                .apiKey(apiKey)
                .build();

Chave de API com variáveis de ambiente definidas para OPENAI_BASE_URL e OPENAI_API_KEY:

OpenAIClient client = OpenAIOkHttpClient.builder()
                .fromEnv()
                .build();

Microsoft Entra ID:

Credential tokenCredential = BearerTokenCredential.create(
        AuthenticationUtil.getBearerTokenSupplier(
                new DefaultAzureCredentialBuilder().build(),
                "https://cognitiveservices.azure.com/.default"));
OpenAIClient client = OpenAIOkHttpClient.builder()
        .baseUrl("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/")
        .credential(tokenCredential)
        .build();

API v1

Chave de API:

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -d '{
     "model": "gpt-4.1-nano",
     "input": "This is a test"
    }'

Microsoft Entra ID:

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_OPENAI_AUTH_TOKEN" \
  -d '{
     "model": "gpt-4o",
     "input": "This is a test"
    }'

Suporte ao modelo

Para modelos do Azure OpenAI, recomendamos usar a API de Respostas, no entanto, a API v1 também permite que você faça chamadas de conclusão de chat com modelos de outros provedores, como DeepSeek e Grok, que dão suporte à sintaxe de conclusões de chat do OpenAI v1.

base_url aceitará ambos https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/ e https://YOUR-RESOURCE-NAME.services.ai.azure.com/openai/v1/ formatos.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key=token_provider,
)
completion = client.chat.completions.create(
  model="grok-3-mini", # Replace with your model deployment name.
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Tell me about the attention is all you need paper"}
  ]
)

#print(completion.choices[0].message)
print(completion.model_dump_json(indent=2))

using Azure.Identity;
using OpenAI;
using OpenAI.Chat;
using System.ClientModel.Primitives;

#pragma warning disable OPENAI001

BearerTokenPolicy tokenPolicy = new(
    new DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default");

ChatClient client = new(
    model: "grok-3-mini", // Replace with your model deployment name.
    authenticationPolicy: tokenPolicy,
    options: new OpenAIClientOptions() { 
    
        Endpoint = new Uri("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1")
   }
);

ChatCompletion completion = client.CompleteChat("Tell me about the attention is all you need paper");

Console.WriteLine($"[ASSISTANT]: {completion.Content[0].Text}");

import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
import { OpenAI } from "openai";

const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://cognitiveservices.azure.com/.default');
const client = new OpenAI({
    baseURL: "https://france-central-test-001.openai.azure.com/openai/v1/",
    apiKey: tokenProvider
});

const messages = [
    { role: 'system', content: 'You are a helpful assistant.' },
    { role: 'user', content: 'Tell me about the attention is all you need paper' }
];

// Make the API request with top-level await
const result = await client.chat.completions.create({ 
    messages, 
    model: 'grok-3-mini', // model deployment name
    max_tokens: 100 
});

// Print the full response
console.log('Full response:', result);

// Print just the message content from the response
console.log('Response content:', result.choices[0].message.content);

package main

import (
	"context"
	"fmt"

	"github.com/Azure/azure-sdk-for-go/sdk/azidentity"
	"github.com/openai/openai-go/v2"
	"github.com/openai/openai-go/v2/azure"
	"github.com/openai/openai-go/v2/option"
)

func main() {
	// Create an Azure credential
	tokenCredential, err := azidentity.NewDefaultAzureCredential(nil)
	if err != nil {
		panic(fmt.Sprintf("Failed to create credential: %v", err))
	}

	// Create a client with Azure OpenAI endpoint and token credential
	client := openai.NewClient(
		option.WithBaseURL("https://YOUR-RESOURCE_NAME.openai.azure.com/openai/v1/"),
		azure.WithTokenCredential(tokenCredential),
	)

	// Make a completion request
	chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{
		Messages: []openai.ChatCompletionMessageParamUnion{
			openai.UserMessage("Explain what the bitter lesson is?"),
		},
		Model: "grok-3-mini", // Use your deployed model name on Azure
	})
	if err != nil {
		panic(err.Error())
	}

	fmt.Println(chatCompletion.Choices[0].Message.Content)
}

package com.example;

import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.openai.models.ChatModel;
import com.openai.models.chat.completions.ChatCompletion;
import com.openai.models.chat.completions.ChatCompletionCreateParams;

public class OpenAITest {
    public static void main(String[] args) {
        // Get API key from environment variable for security
        String apiKey = System.getenv("OPENAI_API_KEY");
        String resourceName = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1";
        String modelDeploymentName = "grok-3-mini"; //replace with you model deployment name

        try {
            OpenAIClient client = OpenAIOkHttpClient.builder()
                    .baseUrl(resourceName)
                    .apiKey(apiKey)
                    .build();

           ChatCompletionCreateParams params = ChatCompletionCreateParams.builder()
              .addUserMessage("Explain what the bitter lesson is?")
              .model(modelDeploymentName)
              .build();
           ChatCompletion chatCompletion = client.chat().completions().create(params);
        }
    }
}

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_OPENAI_AUTH_TOKEN" \
  -d '{
      "model": "grok-3-mini",
      "messages": [
      {
        "role": "developer",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Explain what the bitter lesson is?"
      }
    ]
  }'

Suporte de API v1

Especificação do OpenAPI 3.0 v1

Situação

Recursos em disponibilidade geral têm suporte para uso em produção.

Caminho da API	Situação
`/openai/v1/chat/completions`	Disponibilidade Geral
`/openai/v1/embeddings`	Disponibilidade Geral
`/openai/v1/evals`	Preview
`/openai/v1/files`	Disponibilidade Geral
`/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy`	Preview
`/openai/v1/fine_tuning/alpha/graders/`	Preview
`/openai/v1/fine_tuning/`	Disponibilidade Geral
`/openai/v1/models`	Disponibilidade Geral
`/openai/v1/responses`	Disponibilidade Geral
`/openai/v1/vector_stores`	Disponibilidade Geral

Cabeçalhos de versão prévia

Caminho da API	Header
`/openai/v1/evals`	`"aoai-evals":"preview"`
`/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy`	`"aoai-copy-ft-checkpoints" : "preview"`

Alterações entre a versão prévia da v1 e a versão 2025-04-01-preview

API de visualização v1
Suporte à geração de vídeo
NOVOS Recursos da API de Respostas:
- Integração de ferramentas de servidores MCP (protocolo de contexto remoto)
- Suporte para tarefas em segundo plano assíncronas
- Itens de raciocínio criptografados
- Geração de imagem

Alterações entre 2025-04-01-preview e 2025-03-01-preview

Alterações entre 2025-03-01-preview e 2025-02-01-preview

Alterações entre 2025-02-01-preview e 2025-01-01-preview

Suporte à API de conclusões armazenadas (destilação).

Alterações entre 2025-01-01-preview e 2024-12-01-preview

Parâmetro prediction adicionado para suporte a saídas previstas.
gpt-4o-audio-preview suporte a modelo.

Alterações entre 2024-12-01-preview e 2024-10-01-preview

Parâmetros store e metadata adicionados para suporte a conclusões armazenadas.
reasoning_effort adicionado aos modelos de raciocínio mais recentes.
user_security_context adicionado à Integração do Microsoft Defender para Nuvem.

Alterações entre 2024-09-01-preview e 2024-08-01-preview

max_completion_tokens adicionado para dar suporte aos modelos o1-preview e o1-mini. max_tokens não funciona com os modelos da série o1.
parallel_tool_calls adicionado
Adicionados completion_tokens_details e reasoning_tokens.
Adicionados stream_options e include_usage.

Alterações entre as especificações das APIs 2024-07-01-preview e 2024-08-01-preview

Suporte a saídas estruturadas.
Adicionada a API para upload de arquivos grandes.
Em suas alterações de dados:
- Integração do Mongo DB.
- Parâmetro role_information removido.
- rerank_score adicionado ao objeto de citação.
- Fonte de dados do AML removida.
- Melhorias na integração de vetorização da Pesquisa de IA.

Alterações entre as especificações das APIs 2024-5-01-preview e 2024-07-01-preview

Suporte à API em lote adicionado
Parâmetros de estratégia de fragmentação do armazenamento vetorial
max_num_results que a ferramenta de pesquisa de arquivos deve gerar.

Alterações entre as especificações das APIs 2024-04-01-preview e 2024-05-01-preview

Suporte aos assistentes v2 – Ferramenta de pesquisa de arquivos e armazenamento de vetores
Pontos de verificação de ajuste fino, sementes, eventos
Nas suas atualizações de dados
O DALL-E 2 já dá suporte à implantação do modelo e pode ser usado com a API de versão prévia mais recente.
Atualizações de filtragem de conteúdo

Alterações entre as especificações das APIs 2024-03-01-preview e 2024-04-01-preview

Alteração Interruptiva: Parâmetros de aprimoramentos removidos. Isso afeta o modelo gpt-4Versão:vision-preview.
Adicionado o parâmetro timestamp_granularities.
Objeto audioWord adicionado.
TTS adicional response_formats: wav & pcm.

Versão mais recente da API GA

A versão da API 2024-10-21 do Serviço OpenAI do Azure é atualmente a versão mais recente da API em disponibilidade geral. Esta versão da API é o substituto para a versão anterior 2024-06-01 de lançamento GA.

Problemas conhecidos

A 2025-04-01-preview especificação do Azure OpenAI usa OpenAPI 3.1, é um problema conhecido que atualmente não tem suporte total do Gerenciamento de API do Azure

Próximas etapas

Comentários

Esta página foi útil?

Last updated on 2025-10-31

Compartilhar via

Ciclo de vida da API do OpenAI do Azure em Modelos da Fábrica de IA do Azure

Evolução da API

Alterações de código

API v1

Suporte ao modelo

Suporte de API v1

Situação

Cabeçalhos de versão prévia

Alterações entre a versão prévia da v1 e a versão 2025-04-01-preview

Alterações entre 2025-04-01-preview e 2025-03-01-preview

Alterações entre 2025-03-01-preview e 2025-02-01-preview

Alterações entre 2025-02-01-preview e 2025-01-01-preview

Alterações entre 2025-01-01-preview e 2024-12-01-preview

Alterações entre 2024-12-01-preview e 2024-10-01-preview

Alterações entre 2024-09-01-preview e 2024-08-01-preview

Alterações entre as especificações das APIs 2024-07-01-preview e 2024-08-01-preview

Alterações entre as especificações das APIs 2024-5-01-preview e 2024-07-01-preview

Alterações entre as especificações das APIs 2024-04-01-preview e 2024-05-01-preview

Alterações entre as especificações das APIs 2024-03-01-preview e 2024-04-01-preview

Versão mais recente da API GA

Problemas conhecidos

Próximas etapas

Comentários

Recursos adicionais