이 문서는 Azure OpenAI API에 대한 지원 수명 주기를 이해하는 데 도움이 됩니다.
비고
언제든지 새 API 응답 개체를 API 응답에 추가할 수 있습니다. 필요한 응답 개체만 구문 분석하는 것이 좋습니다.
API 진화
이전에 Azure OpenAI는 새 API 버전의 월별 업데이트를 받았습니다. 새로운 기능을 활용하려면 새로운 API 릴리스마다 코드 및 환경 변수를 지속적으로 업데이트해야 했습니다. 또한 Azure OpenAI는 OpenAI와 Azure OpenAI 간에 코드를 마이그레이션할 때 오버헤드를 발생시킨 Azure 특정 클라이언트를 사용하는 추가 단계가 필요했습니다.
2025년 8월부터 다음을 지원하는 차세대 v1 Azure OpenAI API를 옵트인할 수 있습니다.
- 매월 새
api-version
기능을 지정할 필요 없이 최신 기능에 지속적으로 액세스합니다. - 새 기능이 더 자주 출시되어 API 릴리스 주기가 더 빨라집니다.
- 키 기반 인증을 사용할 때 OpenAI와 Azure OpenAI 간에 교환하기 위한 최소한의 코드 변경으로 OpenAI 클라이언트를 지원합니다.
- 토큰 기반 인증 및 자동 토큰 새로 고침에 대한 OpenAI 클라이언트 지원은 별도의 Azure OpenAI 클라이언트에 종속되지 않아도 됩니다.
- v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델을 사용하여 채팅 완료를 호출합니다.
아직 미리 보기 상태인 새 API 호출에 대한 액세스는 API 버전을 교환하지 않고도 원하는 기능을 옵트인할 수 있도록 기능별 미리 보기 헤더를 전달하여 제어됩니다. 또는 일부 기능은 API 경로를 통해 미리 보기 상태를 나타내며 추가 헤더가 필요하지 않습니다.
예제:
-
/openai/v1/evals
는 미리 보기 상태이며"aoai-evals":"preview"
헤더를 전달해야 합니다. -
/openai/v1/fine_tuning/alpha/graders/
는 미리 보기 상태이며 API 경로에alpha
가 있기 때문에 사용자 지정 헤더가 필요하지 않습니다.
초기 v1 GA(일반 공급) API 출시에서는 유추 및 작성 API 기능의 하위 집합만 지원합니다. 모든 GA 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다. 곧 더 많은 기능에 대한 지원을 빠르게 추가할 예정입니다.
코드 변경
v1 API
API 키:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)
response = client.responses.create(
model="gpt-4.1-nano", # Replace with your model deployment name
input="This is a test.",
)
print(response.model_dump_json(indent=2))
-
OpenAI()
클라이언트가 대신 사용됩니다AzureOpenAI()
. -
base_url
는 Azure OpenAI 엔드포인트를 전달하고/openai/v1
엔드포인트 주소에 추가됩니다. -
api-version
은 더 이상 v1 GA API를 사용하는 필수 매개 변수가 아닙니다.
환경 변수가 설정된 API 키: OPENAI_BASE_URL
OPENAI_API_KEY
client = OpenAI()
Microsoft Entra ID:
중요합니다
자동 토큰 새로 고침 처리는 이전에 AzureOpenAI()
클라이언트를 사용하여 처리되었습니다. v1 API는 OpenAI()
클라이언트에 자동 토큰 새로 고침 지원을 추가하여 이 종속성을 제거합니다.
from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key = token_provider
)
response = client.responses.create(
model="gpt-4.1-nano",
input= "This is a test"
)
print(response.model_dump_json(indent=2))
-
base_url
는 Azure OpenAI 엔드포인트를 전달하고/openai/v1
엔드포인트 주소에 추가됩니다. -
api_key
매개 변수가token_provider
로 설정되어, 정적 API 키를 사용하는 대신 인증 토큰의 자동 검색 및 새로 고침이 활성화됩니다.
모델 지원
Azure OpenAI 모델의 경우 응답 API를 사용하는 것이 좋습니다. 그러나 v1 API를 사용하면 OpenAI v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델과 채팅 완료 호출을 수행할 수도 있습니다.
base_url
는 https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/
형식과 https://YOUR-RESOURCE-NAME.services.ai.azure.com/openai/v1/
형식을 모두 허용합니다.
from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key=token_provider,
)
completion = client.chat.completions.create(
model="grok-3-mini", # Replace with your model deployment name.
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Tell me about the attention is all you need paper"}
]
)
#print(completion.choices[0].message)
print(completion.model_dump_json(indent=2))
v1 API 지원
상태
일반적으로 사용 가능한 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다.
API 경로 | 상태 |
---|---|
/openai/v1/chat/completions |
일반 공급 |
/openai/v1/embeddings |
일반 공급 |
/openai/v1/evals |
Preview |
/openai/v1/files |
일반 공급 |
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy |
Preview |
/openai/v1/fine_tuning/alpha/graders/ |
Preview |
/openai/v1/fine_tuning/ |
일반 공급 |
/openai/v1/models |
일반 공급 |
/openai/v1/responses |
일반 공급 |
/openai/v1/vector_stores |
일반 공급 |
미리 보기 헤더
API 경로 | Header |
---|---|
/openai/v1/evals |
"aoai-evals":"preview" |
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy |
"aoai-copy-ft-checkpoints" : "preview" |
v1 미리 보기 릴리스와 2025-04-01-preview 간의 변경 내용
- v1 미리 보기 API
- 비디오 생성 지원
-
새로운 응답 API 기능:
- MCP(원격 모델 컨텍스트 프로토콜) 서버 도구 통합
- 비동기 백그라운드 작업 지원
- 암호화된 추론 항목
- 이미지 생성
2025-04-01-preview와 2025-03-01-preview 간의 변경 내용
2025-03-01-preview와 2025-02-01-preview 간의 변경 내용
2025-02-01-preview와 2025-01-01-preview 사이의 변경 내용
- 저장된 완성(증류) API 지원.
2025-01-01-preview와 2024-12-01-preview 간의 변경 내용
-
예측 출력
prediction
지원을 위해 매개 변수를 추가했습니다. -
gpt-4o-audio-preview
모델 지원.
2024-12-01-미리 보기와 2024-10-01-미리 보기 간의 변경 내용
-
store
을 위해metadata
, 및 을(를) 추가했습니다. -
최신
reasoning_effort
을 위해 을(를) 추가했습니다. -
user_security_context
을 위해 을(를) 추가했습니다.
2024-09-01-미리 보기와 2024-08-01-미리 보기 간의 변경 내용
-
max_completion_tokens
및o1-preview
모델을 지원하기 위해o1-mini
을(를) 추가했습니다.max_tokens
는 o1 시리즈 모델에서 작동하지 않습니다. -
parallel_tool_calls
이(가) 추가되었습니다. -
completion_tokens_details
및reasoning_tokens
을(를) 추가했습니다. -
stream_options
및include_usage
을(를) 추가했습니다.
2024-07-01-preview와 2024-08-01-preview API 사양 간의 변경 내용
- 구조적 출력 지원
- 대용량 파일 업로드 API가 추가되었습니다.
- 데이터 변경 내용:
- Mongo DB 통합
-
role_information
매개 변수가 제거되었습니다. -
rerank_score
가 인용 개체에 추가되었습니다. - AML 데이터 원본이 제거되었습니다.
- AI 검색 벡터화 통합 개선.
2024-05-01-preview와 2024-07-01-preview API 사양 간의 변경 내용
- Batch API 지원 추가
- 벡터 저장소 청크 전략 매개 변수
-
max_num_results
이(가) 파일 검색 도구에서 출력되어야 합니다.
2024-04-01-preview와 2024-05-01-preview API 사양 간의 변경 내용
- 도우미 v2 지원 - 파일 검색 도구 및 벡터 스토리지
- 검사점, 시드, 이벤트 미세 조정
- 데이터 업데이트 시
- DALL-E 2는 이제 모델 배포를 지원하며 최신 미리 보기 API와 함께 사용할 수 있습니다.
- 콘텐츠 필터링 업데이트
2024-03-01-preview와 2024-04-01-preview API 사양 간의 변경 내용
-
호환성이 손상되는 변경: 향상된 기능 매개 변수가 제거되었습니다. 이는
gpt-4
버전:vision-preview
모델에 영향을 줍니다. - timestamp_granularities 매개 변수가 추가되었습니다.
-
audioWord
개체가 추가되었습니다. - 추가 TTS
response_formats: wav & pcm
.
최신 GA API 릴리스
Azure OpenAI API 버전 2024-10-21은 현재 최신 GA API 릴리스입니다. 이 API 버전은 이전 2024-06-01
GA API 릴리스를 대체합니다.
알려진 문제
- Azure OpenAI 사양은
2025-04-01-preview
OpenAPI 3.1을 사용하며, 현재 Azure API Management에서 완전히 지원되지 않는 알려진 문제입니다.