다음을 통해 공유


Azure에서 직접 판매하는 Foundry Models

이 문서에서는 Azure에서 직접 판매하는 Azure AI Foundry Models 중 기능, 배포 유형, 가용성 지역을 나열하며, 더 이상 사용되지 않는 모델과 레거시 모델은 제외합니다. Azure에서 직접 판매하는 모델에는 모든 Azure OpenAI 모델과 상위 공급자의 특정 선택한 모델이 포함됩니다.

Azure AI 파운드리에서 사용하는 프로젝트 종류에 따라 선택할 수 있는 다양한 모델이 표시됩니다. 특히, Azure AI 파운드리 리소스 기반으로 빌드된 파운드리 프로젝트를 사용하는 경우 Foundry 리소스에 대한 표준 배포에 사용할 수 있는 모델이 표시됩니다. 또는 Azure AI 파운드리 허브에서 호스트되는 허브 기반 프로젝트를 사용하는 경우 관리 컴퓨팅 및 서버리스 API에 배포할 수 있는 모델이 표시됩니다. 많은 모델이 여러 배포 옵션을 지원하기 때문에 이러한 모델 선택은 종종 겹칩니다.

Azure에서 직접 판매하는 Foundry Models의 특성에 대해 자세히 알아보려면 Azure AI Foundry Models 살펴보기를 참조하세요.

비고

Azure에서 직접 판매하는 Foundry 모델에는 다음 상위 모델 공급자의 선택 모델도 포함됩니다.

  • 블랙 포레스트 랩: FLUX.1-Kontext-pro, FLUX-1.1-pro
  • DeepSeek: DeepSeek-V3.1, DeepSeek-V3-0324, DeepSeek-R1-0528DeepSeek-R1
  • 메타: Llama-4-Maverick-17B-128E-Instruct-FP8, Llama-3.3-70B-Instruct
  • Microsoft: MAI-DS-R1
  • 미스트랄: mistral-document-ai-2505
  • xAI: grok-code-fast-1,grok-3, grok-3-mini, grok-4-fast-reasoning, grok-4-fast-non-reasoninggrok-4

이러한 모델에 대해 알아보려면 이 문서의 맨 위에 있는 다른 모델 컬렉션 으로 전환합니다.

Azure AI Foundry 모델의 Azure OpenAI

Azure OpenAI는 다양한 기능과 가격 포인트를 가진 다양한 모델 집합으로 구동됩니다. 모델 가용성은 지역 및 클라우드에 따라 다릅니다. Azure Government 모델 가용성은 Azure Government의 Azure OpenAI를 참조하세요.

Models Description
GPT-5 시리즈 신제품 gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat
gpt-oss 새로운 무제한급 추론 모델
codex-mini o4-mini의 미세 조정된 버전입니다.
GPT-4.1 시리즈 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
model-router 지정된 프롬프트에 응답하기 위해 기본 채팅 모델 집합에서 지능적으로 선택하는 모델입니다.
computer-use-preview 응답 API 컴퓨터 사용 도구와 함께 사용하도록 학습된 실험적 모델입니다.
o 시리즈 모델 고급 문제 해결 능력과 향상된 집중력 및 역량을 갖춘 추론 모델.
GPT-4o, GPT-4o mini, 및 GPT-4 Turbo 텍스트와 이미지를 모두 입력으로 허용할 수 있는 다중 모드 버전을 갖춘 Azure OpenAI 모델입니다.
GPT-4 GPT-3.5를 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
GPT-3.5 GPT-3을 개선하고 자연어와 코드를 이해하고 생성할 수 있는 모델 집합입니다.
Embeddings 텍스트 유사성을 촉진하기 위해 텍스트를 숫자 벡터 형식으로 변환할 수 있는 모델 집합입니다.
이미지 생성 자연어에서 원본 이미지를 생성할 수 있는 일련의 모델입니다.
Video generation 텍스트 명령으로부터 원본 동영상 장면을 생성할 수 있는 모델입니다.
오디오 음성 텍스트 변환, 번역 및 텍스트 음성 변환을 위한 일련의 모델입니다. GPT-4o 오디오 모델은 짧은 대기 시간 음성 입력 및 음성 출력 기반의 대화형 상호작용 또는 오디오 생성 중 하나를 지원합니다.

GPT-5

지역 가용성

Model 지역
gpt-5 (2025-08-07) 모델 테이블을 참조하세요.
gpt-5-mini (2025-08-07) 모델 테이블을 참조하세요.
gpt-5-nano (2025-08-07) 모델 테이블을 참조하세요.
gpt-5-chat (2025-08-07) 모델 테이블을 참조하세요.
gpt-5-chat (2025-10-03) 미국 동부2(글로벌 표준) 및 스웨덴 중부(글로벌 표준)
gpt-5-codex (2025-09-11) 미국 동부2(글로벌 표준) 및 스웨덴 중부(글로벌 표준)

액세스 권한은 Microsoft의 자격 기준에 따라 부여됩니다. 이전에 o3에 대한 액세스 권한을 적용하고 받은 고객은 모델 릴리스 시 승인된 구독에 자동으로 액세스 권한이 부여되므로 다시 적용할 필요가 없습니다.

모델 아이디 Description 컨텍스트 창 최대 출력 토큰 학습 데이터(최대)
gpt-5 (2025-08-07) - 추론
- 채팅 완료 API.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수, 도구 및 병렬 도구 호출.
- 기능에 대한 전체 요약입니다.
400,000

입력: 272,000
출력: 128,000
128,000 2024년 9월 30일
gpt-5-mini (2025-08-07) - 추론
- 채팅 완료 API.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수, 도구 및 병렬 도구 호출.
- 기능에 대한 전체 요약입니다.
400,000

입력: 272,000
출력: 128,000
128,000 2024년 5월 31일
gpt-5-nano (2025-08-07) - 추론
- 채팅 완료 API.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수, 도구 및 병렬 도구 호출.
- 기능에 대한 전체 요약입니다.
400,000

입력: 272,000
출력: 128,000
128,000 2024년 5월 31일
gpt-5-chat (2025-08-07)
Preview
- 채팅 완료 API.
- 응답 API.
- 입력: 텍스트/이미지
- 출력: 텍스트만
128,000 16,384 2024년 9월 30일
gpt-5-chat (2025-10-03)
미리 보기1
- 채팅 완료 API.
- 응답 API.
- 입력: 텍스트/이미지
- 출력: 텍스트만
128,000 16,384 2024년 9월 30일
gpt-5-codex (2025-09-11) - 응답 API 만 해당합니다.
- 입력: 텍스트/이미지
- 출력: 텍스트만
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수, 도구 및 병렬 도구 호출.
- 기능의 전체 요약
- Codex CLI 및 Codex VS Code 확장에 최적화됨
400,000

입력: 272,000
출력: 128,000
128,000 -

비고

1gpt-5-chat 버전은 2025-10-03 정서적 지능과 정신 건강 기능에 초점을 맞춘 중요한 향상을 소개합니다. 이 업그레이드는 특수 데이터 세트와 구체화된 응답 전략을 통합하여 모델의 다음 기능을 향상시킵니다.

  • 감정 컨텍스트를 보다 정확하게 이해하고 해석 하여 미묘하고 공감하는 상호 작용을 가능하게 합니다.
  • 정신 건강과 관련된 대화에서 지지적이고 책임있는 응답을 제공하여 모범 사례에 대한 민감도와 준수를 보장합니다.

이러한 개선 사항은 GPT-5 채팅을 보다 컨텍스트 인식, 인간 중심 및 정서적 톤 및 웰빙 고려 사항이 중요한 시나리오에서 안정적으로 만드는 것을 목표로 합니다.

gpt-oss

지역 가용성

Model 지역
gpt-oss-120b 모든 Azure OpenAI 지역

역량

모델 아이디 Description 컨텍스트 창 최대 출력 토큰 학습 데이터(최대)
gpt-oss-120b(미리 보기) - 텍스트 입력/텍스트 출력만
- 채팅 완료 API
-스트리밍
- 함수 호출
- 구조적 출력
- 추론
- 배포1관리형 컴퓨팅을 통해 사용 가능
131,072 131,072 2024년 5월 31일
gpt-oss-20b(미리 보기) - 텍스트 입력/텍스트 출력만
- 채팅 완료 API
-스트리밍
- 함수 호출
- 구조적 출력
- 추론
- 관리형 컴퓨팅Foundry Local을 통해 사용 가능
131,072 131,072 2024년 5월 31일

1 다른 Azure OpenAI 모델과 달리 gpt-oss-120b은(는) 모델을 배포하려면 Azure AI Foundry 프로젝트가 필요합니다.

코드를 사용하여 배포

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

GPT-4.1 시리즈

지역 가용성

Model 지역
gpt-4.1 (2025-04-14) 모델 테이블을 참조하세요.
gpt-4.1-nano (2025-04-14) 모델 테이블을 참조하세요.
gpt-4.1-mini (2025-04-14) 모델 테이블을 참조하세요.

역량

중요합니다

알려진 문제는 모든 GPT 4.1 시리즈 모델에 영향을 줍니다. 300,000개 토큰을 초과하는 대규모 도구 또는 함수 호출 정의는 모델의 1백만 토큰 컨텍스트 제한에 도달하지 않았더라도 실패하게 됩니다.

오류는 API 호출 및 기본 페이로드 특성에 따라 달라질 수 있습니다.

채팅 완료 API에 대한 오류 메시지는 다음과 같습니다.

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

응답 API에 대한 오류 메시지는 다음과 같습니다.

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
모델 아이디 Description 컨텍스트 창 최대 출력 토큰 학습 데이터(최대)
gpt-4.1 (2025-04-14) - 텍스트 및 이미지 입력
- 텍스트 출력
- 채팅 완료 API
- 응답 API
-스트리밍
- 함수 호출
- 구조화된 출력(채팅 완료)
- 1,047,576
- 128,000개(할당된 관리 배포)
- 300,000(일괄 배포)
32,768 2024년 5월 31일
gpt-4.1-nano (2025-04-14) - 텍스트 및 이미지 입력
- 텍스트 출력
- 채팅 완료 API
- 응답 API
-스트리밍
- 함수 호출
- 구조화된 출력(채팅 완료)
- 1,047,576
- 128,000개(할당된 관리 배포)
- 300,000(일괄 배포)
32,768 2024년 5월 31일
gpt-4.1-mini (2025-04-14) - 텍스트 및 이미지 입력
- 텍스트 출력
- 채팅 완료 API
- 응답 API
-스트리밍
- 함수 호출
- 구조화된 출력(채팅 완료)
- 1,047,576
- 128,000개(할당된 관리 배포)
- 300,000(일괄 배포)
32,768 2024년 5월 31일

model-router

지정된 프롬프트에 응답하기 위해 기본 채팅 모델 집합에서 지능적으로 선택하는 모델입니다.

지역 가용성

Model 지역
model-router (2025-08-07) 미국 동부 2(글로벌 표준 및 데이터 영역 표준), 스웨덴 중부(글로벌 표준 및 데이터 영역 표준)
model-router (2025-05-19) 미국 동부 2(글로벌 표준 및 데이터 영역 표준), 스웨덴 중부(글로벌 표준 및 데이터 영역 표준)

데이터 영역 표준 모델 라우터 배포에 대한 청구는 2025년 11월 1일부터 시작됩니다.

역량

모델 아이디 Description 컨텍스트 창 최대 출력 토큰 학습 데이터(최대)
model-router (2025-08-07) 지정된 프롬프트에 응답하기 위해 기본 모델 집합에서 지능적으로 선택하는 모델입니다. 200,000 32,768 (GPT-4.1 series)
100,000 (o4-mini)
128,000 (gpt-5 reasoning models)
16,384 (gpt-5-chat)
-
model-router (2025-05-19) 지정된 프롬프트에 응답하기 위해 기본 채팅 모델 집합에서 지능적으로 선택하는 모델입니다. 200,000 32,768 (GPT-4.1 series)
100,000 (o4-mini)
2024년 5월 31일

더 큰 컨텍스트 창은 일부 기본 모델과 호환됩니다. 즉, 더 큰 컨텍스트를 사용하는 API 호출은 프롬프트가 올바른 모델로 라우팅되는 경우에만 성공합니다. 그러지 않으면 호출이 실패합니다.

computer-use-preview

응답 API 컴퓨터 사용 도구와 함께 사용하도록 학습된 실험적 모델입니다.

타사 라이브러리와 함께 사용하면 모델이 현재 환경의 스크린샷에서 컨텍스트를 가져오는 동안 마우스 및 키보드 입력을 제어할 수 있습니다.

주의

프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적이고 일반적으로 사용 가능한 최신 버전으로 업그레이드할 예정입니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

computer-use-preview에 액세스하려면 등이 필요합니다. 액세스 권한은 Microsoft의 자격 기준에 따라 부여됩니다. 다른 제한된 액세스 모델에 대한 액세스 권한이 있는 고객도 이 모델에 대한 액세스 권한을 요청해야 합니다.

액세스 권한를 요청하려면 computer-use-preview제한된 액세스 모델 애플리케이션으로 이동합니다. 액세스 권한이 부여되면 해당 모델에 대한 배포를 만들어야 합니다.

지역 가용성

Model 지역
computer-use-preview 모델 테이블을 참조하세요.

역량

모델 아이디 Description 컨텍스트 창 최대 출력 토큰 학습 데이터(최대)
computer-use-preview (2025-03-11) 응답 API 컴퓨터 사용 도구와 함께 사용하기 위한 특수 모델

-도구
-스트리밍
- 텍스트(입력/출력)
- 이미지(입력)
8,192 1,024 2023년 10월

o 시리즈 모델

Azure OpenAI o 시리즈 모델은 향상된 집중력과 기능으로 추론 및 문제 해결 작업을 처리하도록 설계되었습니다. 이러한 모델은 사용자의 요청을 처리하고 이해하는 데 더 많은 시간을 할애하여 이전 반복에 비해 과학, 코딩 및 수학과 같은 영역에서 매우 강력합니다.

모델 아이디 Description 최대 요청(토큰) 학습 데이터(최대)
codex-mini (2025-05-16) 세밀하게 조정된 버전의 o4-mini.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수 및 도구.
기능에 대한 전체 요약입니다.
입력: 200,000
출력: 100,000
2024년 5월 31일
o3-pro (2025-06-10) - 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수 및 도구.
기능에 대한 전체 요약입니다.
입력: 200,000
출력: 100,000
2024년 5월 31일
o4-mini (2025-04-16) - 향상된 추론 기능을 제공하는 새로운 추론 모델입니다.
- 채팅 완료 API.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수 및 도구.
기능에 대한 전체 요약입니다.
입력: 200,000
출력: 100,000
2024년 5월 31일
o3 (2025-04-16) - 향상된 추론 기능을 제공하는 새로운 추론 모델입니다.
- 채팅 완료 API.
- 응답 API.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수, 도구 및 병렬 도구 호출.
기능에 대한 전체 요약입니다.
입력: 200,000
출력: 100,000
2024년 5월 31일
o3-mini (2025-01-31) - 향상된 추론 능력.
- 구조적 출력.
- 텍스트 전용 처리.
- 함수 및 도구.
입력: 200,000
출력: 100,000
2023년 10월
o1 (2024-12-17) - 향상된 추론 능력.
- 구조적 출력.
- 텍스트 및 이미지 처리.
- 함수 및 도구.
입력: 200,000
출력: 100,000
2023년 10월
o1-preview (2024-09-12) 이전 미리 보기 버전입니다. 입력: 128,000
출력: 32,768
2023년 10월
o1-mini (2024-09-12) o1 시리즈의 더 빠르고 비용 효율적인 옵션으로 속도와 낮은 리소스 소비가 필요한 코딩 작업에 적합합니다.
- 전역 표준 배포는 기본적으로 사용할 수 있습니다.
- 표준(지역) 배포는 현재 o1-preview 제한된 액세스 릴리스의 일부로 액세스 권한을 받은 일부 고객에게만 제공됩니다.
입력: 128,000
출력: 65,536
2023년 10월

고급 o 시리즈 모델에 대한 자세한 내용은 추론 모델 시작을 참조하세요.

지역 가용성

Model 지역
codex-mini 미국 동부 2 및 스웨덴 중부(글로벌 표준).
o3-pro 미국 동부 2 및 스웨덴 중부(글로벌 표준).
o4-mini 모델 테이블을 참조하세요.
o3 모델 테이블을 참조하세요.
o3-mini 모델 테이블을 참조하세요.
o1 모델 테이블을 참조하세요.
o1-preview 모델 테이블을 참조하세요. 이 모델은 원래 제한된 액세스의 일부로 액세스 권한이 부여된 고객에게만 제공됩니다.
o1-mini 모델 테이블을 참조하세요.

GPT-4o 및 GPT-4 Turbo

GPT-4o는 텍스트와 이미지를 단일 모델에 통합하여 여러 데이터 유형을 동시에 처리할 수 있도록 합니다. 이러한 다중 모드 방식은 인간-컴퓨터 상호 작용의 정확도와 응답성을 향상시킵니다. GPT-4o는 영어 텍스트 및 코딩 작업에서는 GPT-4 Turbo와 일치하면서 영어 이외의 언어 작업 및 비전 작업에서 뛰어난 성능을 제공하여 AI 기능에 대한 새로운 벤치마크를 설정합니다.

GPT-4o 및 GPT-4o mini 모델에 어떻게 액세스할 수 있나요?

GPT-4o 및 GPT-4o mini는 표준 및 글로벌 표준 모델 배포에 사용할 수 있습니다.

모델을 사용할 수 있는 지원되는 표준 또는 글로벌 표준 지역에서 기존 리소스를 만들거나 사용해야 합니다.

리소스가 만들어지면 GPT-4o 모델을 배포할 수 있습니다. 프로그래매틱 배포를 수행하는 경우 모델 이름은 다음과 같습니다.

  • gpt-4o 버전2024-11-20
  • gpt-4o 버전2024-08-06
  • gpt-4o 버전2024-05-13
  • gpt-4o-mini 버전2024-07-18

GPT-4 터보

GPT-4 Turbo는 OpenAI의 이전 모델보다 더 높은 정확도로 어려운 문제를 해결할 수 있는 큰 멀티모달 모델(텍스트 또는 이미지 입력 허용 및 텍스트 생성)입니다. GPT-3.5 Turbo 및 이전 GPT-4 모델과 마찬가지로 GPT-4 Turbo는 채팅에 최적화되어 있으며 기존의 완료 작업에도 잘 작동합니다.

GPT-4

GPT-4는 GPT-4 Turbo의 선행 버전입니다. GPT-4 및 GPT-4 Turbo 모델 모두 기본 모델 이름은 gpt-4입니다. 모델 버전을 검사하여 GPT-4와 Turbo 모델을 구분할 수 있습니다.

GPT-4 및 GPT-4 Turbo 모델

이러한 모델은 채팅 완료 API에서만 사용할 수 있습니다.

Azure OpenAI가 모델 버전 업그레이드를 처리하는 방법에 대해 알아보려면 모델 버전을 참조하세요. GPT-4 배포의 모델 버전 설정을 보고 구성하는 방법을 알아보려면 모델 작업을 참조하세요.

모델 아이디 Description 최대 요청(토큰) 학습 데이터(최대)
gpt-4o (2024-11-20)
GPT-4o(Omni)
- 구조적 출력.
- 텍스트 및 이미지 처리.
- JSON 모드.
- 병렬 함수 호출.
- 향상된 정확도 및 응답성.
- GPT-4 Turbo with Vision과 비교했을 때 영어 텍스트 및 코딩 작업이 동등합니다.
- 비영어 및 비전 작업에서 뛰어난 성능.
- 향상된 창의적인 쓰기 능력.
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o(2024-08-06)
GPT-4o(Omni)
- 구조적 출력.
- 텍스트 및 이미지 처리.
- JSON 모드.
- 병렬 함수 호출.
- 향상된 정확도 및 응답성.
- GPT-4 Turbo with Vision과 비교했을 때 영어 텍스트 및 코딩 작업이 동등합니다.
- 비영어 및 비전 작업에서 뛰어난 성능.
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o-mini(2024-07-18)
GPT-4o mini
- GPT-3.5 Turbo 시리즈 모델을 대체하는 데 이상적인 빠르고 저렴하며 성능이 좋은 모델입니다.
- 텍스트 및 이미지 처리.
- JSON 모드.
- 병렬 함수 호출.
입력: 128,000
출력: 16,384
2023년 10월
gpt-4o(2024-05-13)
GPT-4o(Omni)
- 텍스트 및 이미지 처리.
- JSON 모드.
- 병렬 함수 호출.
- 향상된 정확도 및 응답성.
- GPT-4 Turbo with Vision과 비교했을 때 영어 텍스트 및 코딩 작업이 동등합니다.
- 비영어 및 비전 작업에서 뛰어난 성능.
입력: 128,000
출력: 4,096
2023년 10월
gpt-4(turbo-2024-04-09)
비전이 포함된 GPT-4 Turbo
일반적으로 사용할 수 있는 새로운 모델입니다.
- 이전의 모든 GPT-4 미리 보기 모델(vision-preview, 1106-Preview, 0125-Preview)을 바꿉니다.
- 기능 가용성은 현재 입력 방법 및 배포 유형에 따라 다릅니다.
입력: 128,000
출력: 4,096
2023년 12월

주의

프로덕션에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적이고 일반적으로 사용 가능한 최신 버전으로 업그레이드할 예정입니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

GPT-3.5

GPT-3.5 모델은 자연어 또는 코드를 이해하고 생성할 수 있습니다. GPT-3.5 제품군에서 가장 성능이 뛰어나고 비용 효율적인 모델은 채팅에 최적화되고 기존 완료 작업에도 잘 작동하는 GPT-3.5 Turbo입니다. GPT-3.5 Turbo는 채팅 완료 API에서 사용할 수 있습니다. GPT-3.5 Turbo Instruct는 채팅 완료 API 대신 완료 API를 사용하는 경우와 text-davinci-003과(와) 유사한 기능을 제공합니다. GPT-3.5 Turbo 및 GPT-3.5 Turbo Instruct를 레거시 GPT-3.5 및 GPT-3 모델 대신 사용하는 것을 권장합니다.

모델 아이디 Description 최대 요청(토큰) 학습 데이터(최대)
gpt-35-turbo (0125) 신규 - JSON 모드.
- 병렬 함수 호출.
- 재현 가능한 출력(미리 보기).
- 요청된 형식으로 응답할 때 정확도가 더 높아집니다.
- 영어 이외의 언어 함수 호출에 대한 텍스트 인코딩 문제를 발생시킨 버그에 대한 수정 사항을 포함합니다.
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo(1106) 일반적으로 사용 가능한 이전 모델입니다.
- JSON 모드.
- 병렬 함수 호출.
- 재현 가능한 출력(미리 보기).
입력: 16,385
출력: 4,096
2021년 9월
gpt-35-turbo-instruct(0914) 완료 엔드포인트만 해당합니다.
- 레거시 완성 모델을 대체합니다.
4,097 2021년 9월

GPT-3.5 Turbo 및 채팅 완료 API와 상호 작용하는 방법에 대한 자세한 내용은 자세한 방법 문서를 참조하세요.

포함

text-embedding-3-large(은)는 최신이며 가장 뛰어난 능력을 지닌 임베딩 모델입니다. 포함 모델 간에는 업그레이드할 수 없습니다. text-embedding-ada-002 사용에서 text-embedding-3-large 사용으로 이동하려면 새 포함을 생성해야 합니다.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

OpenAI는 테스트 결과 대형 및 소형 3세대 포함 모델이 모두 MIRACL 벤치마크를 통해 평균 다국어 검색 성능이 더 우수하다는 것을 보여준다고 보고했습니다. 그들은 여전히 MTEB 벤치 마크와 영어 작업에 대한 성능을 유지하고 있습니다.

평가 벤치마크 text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL 평균 31.4 44.0 54.9
MTEB 평균 61.0 62.3 64.6

3세대 포함 모델은 새 dimensions 매개 변수를 통해 포함 크기를 줄일 수 있습니다. 일반적으로 더 큰 포함은 컴퓨팅, 메모리 및 스토리지 관점에서 비용이 더 많이 듭니다. 차원 수를 조정할 수 있는 경우 전반적인 비용과 성능을 더 효과적으로 제어할 수 있습니다. dimensions 매개 변수는 OpenAI 1.x Python 라이브러리의 모든 버전에서 지원되지 않습니다. 이 매개 변수를 이용하려면 최신 버전 pip install openai --upgrade(으)로 업그레이드하는 것이 좋습니다.

OpenAI의 MTEB 벤치마크 테스트에서는 3세대 모델의 차원이 text-embeddings-ada-002의 1,536차원보다 작게 감소하더라도 성능이 약간 향상되는 것으로 나타났습니다.

이미지 생성 모델

이미지 생성 모델은 사용자가 제공하는 텍스트 프롬프트에서 이미지를 생성합니다. GPT-image-1 시리즈 모델은 제한된 액세스 미리 보기로 제공됩니다. DALL-E 3은 일반적으로 REST API와 함께 사용할 수 있습니다. 클라이언트 SDK를 사용하는 DALL-E 2 및 DALL-E 3은 미리 보기로 제공됩니다.

gpt-image-1gpt-image-1-mini에 액세스하려면 등록해야 합니다. 액세스 권한은 Microsoft의 자격 기준에 따라 부여됩니다. 다른 제한된 액세스 모델에 대한 액세스 권한이 있는 고객도 이 모델에 대한 액세스 권한을 요청해야 합니다.

액세스 권한를 요청하려면 gpt-image-1제한된 액세스 모델 애플리케이션으로 이동합니다. 액세스 권한이 부여되면 해당 모델에 대한 배포를 만들어야 합니다.

지역 가용성

Model 지역
dall-e-3 East US
Australia East
스웨덴 중부
gpt-image-1 미국 서부 3(글로벌 표준)
미국 동부 2(글로벌 표준)
UAE 북부(글로벌 표준)
폴란드 중부(글로벌 표준)
gpt-image-1-mini EastUS(글로벌 표준)
NorthCentralUS(글로벌 표준)

비디오 생성 모델

Sora는 텍스트 지침에서 현실적이고 상상력이 풍부한 비디오 장면을 만들 수 있는 OpenAI의 AI 모델입니다. Sora는 미리 보기 상태입니다.

지역 가용성

Model 지역
sora 미국 동부 2(글로벌 표준)
스웨덴 중부(글로벌 표준)

오디오 모델

Azure OpenAI의 오디오 모델은 realtime, completions, 및 audio API를 통해 사용할 수 있습니다.

GPT-4o 오디오 모델

GPT-4o 오디오 모델은 GPT-4o 모델 제품군의 일부이며 낮은 대기 시간, 음성 입력, 음성 출력 대화형 상호 작용 또는 오디오 생성을 지원합니다.

주의

프로덕션 환경에서는 미리 보기 모델을 사용하지 않는 것이 좋습니다. 미리 보기 모델의 모든 배포를 향후 미리 보기 버전 또는 안정적이고 일반적으로 사용 가능한 최신 버전으로 업그레이드할 예정입니다. 미리 보기로 지정된 모델은 표준 Azure OpenAI 모델 수명 주기를 따르지 않습니다.

최대 요청 토큰 및 학습 데이터에 대한 세부 정보는 다음 표에서 확인할 수 있습니다.

모델 아이디 Description 최대 요청(토큰) 학습 데이터(최대)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o 오디오
오디오 및 텍스트 생성을 위한 오디오 모델입니다. 입력: 128,000
출력: 16,384
2023년 9월
gpt-4o-audio-preview (2024-12-17)
GPT-4o 오디오
오디오 및 텍스트 생성을 위한 오디오 모델입니다. 입력: 128,000
출력: 16,384
2023년 9월
gpt-4o-realtime-preview (2025-06-03)
GPT-4o 오디오
실시간 오디오 처리를 위한 오디오 모델입니다. 입력: 128,000
출력: 4,096
2023년 10월
gpt-4o-realtime-preview (2024-12-17)
GPT-4o 오디오
실시간 오디오 처리를 위한 오디오 모델입니다. 입력: 128,000
출력: 4,096
2023년 10월
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o 오디오
실시간 오디오 처리를 위한 오디오 모델입니다. 입력: 128,000
출력: 4,096
2023년 10월
gpt-realtime(2025-08-28)(GA)
gpt-realtime-mini (2025-10-06)
gpt-audio(2025-08-28)
gpt-audio-mini(2025-10-06)
실시간 오디오 처리를 위한 오디오 모델입니다. 입력: 28,672
출력: 4,096
2023년 10월

모든 지역에서 GPT-4o 오디오 모델의 가용성을 비교하려면 모델 테이블을 참조하세요.

오디오 API

API를 /audio 통한 오디오 모델은 음성 텍스트 변환, 번역 및 텍스트 음성 변환에 사용할 수 있습니다.

음성 텍스트 변환 모델

모델 아이디 Description 최대 요청(오디오 파일 크기)
whisper 범용 음성 인식 모델입니다. 25MB
gpt-4o-transcribe GPT-4o 제공 음성 텍스트 변환 모델입니다. 25MB
gpt-4o-mini-transcribe GPT-4o mini 제공 음성 텍스트 변환 모델입니다. 25MB

음성 번역 모델

모델 아이디 Description 최대 요청(오디오 파일 크기)
whisper 범용 음성 인식 모델입니다. 25MB

텍스트 음성 변환 모델(미리 보기)

모델 아이디 Description
tts 속도에 최적화된 텍스트 음성 변환 모델입니다.
tts-hd 품질에 최적화된 텍스트 음성 변환 모델입니다.
gpt-4o-mini-tts GPT-4o mini 제공 텍스트 음성 변환 모델입니다.

음성을 특정 스타일이나 톤으로 말하도록 안내할 수 있습니다.

자세한 내용은 이 문서의 뒷부분에 있는 오디오 모델 지역 가용성을 참조하세요.

모델 요약 테이블 및 지역 가용성

배포 유형별 모델

Azure OpenAI는 고객에게 비즈니스 및 사용 패턴에 맞는 호스팅 구조를 선택할 수 있는 기회를 제공합니다. 이 서비스는 다음 두 가지 주요 배포 유형을 제공합니다.

  • 표준: 글로벌 배포 옵션이 있어 트래픽을 전역적으로 라우팅하여 더 높은 처리량을 제공합니다.
  • 프로비전됨: 또한 글로벌 배포 옵션이 있어 고객이 Azure 글로벌 인프라에서 프로비전된 처리량 단위를 구매하고 배포할 수 있습니다.

모든 배포는 정확히 동일한 유추 작업을 수행할 수 있지만 청구, 규모 및 성능은 상당히 다릅니다. Azure OpenAI 배포 유형에 대한 자세한 내용은 배포 유형 가이드를 참조하세요.

글로벌 표준 모델 가용성

지역 gpt-5, 2025-08-07 gpt-5-mini, 2025-08-07 gpt-5-nano, 2025-08-07 gpt-5-chat, 2025-08-07 o3-pro, 2025-06-10 codex-mini, 2025-05-16 소라, 2025-05-02 model-router, 2025-08-07 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-image-1-mini, 2025-10-06 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 컴퓨터 사용 미리보기, 2025년 3월 11일 o3-mini, 2025-01-31 o1, 2024-12-17 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 text-embedding-3-small, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-realtime-preview, 2025-06-03 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20 gpt-5-codex, 2025-09-15 gpt-audio, 2025-08-28 gpt-realtime, 2025-08-28 o3-deep-research, 2025-06-26
오스트레일리아이스트 - - - - - - - - - - - - - - - - - - - - - - - -
브라질 남부 - - - - - - - - - - - - - - - - - - - - - - - - - -
캐나다 동부 - - - - - - - - - - - - - - - - - - - - - - - - -
이스트유스 - - - - - - - - - - - - - - - - - - - - -
eastus2 -
francecentral - - - - - - - - - - - - - - - - - - - - - - - - - -
독일 서중부 - - - - - - - - - - - - - - - - - - - - - - - - - -
이탈리아 북부 - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - - - - - - - - -
노스센트럴러스 - - - - - - - - - - - - - - - - - - - - - - - -
노르웨이 동부 - - - - - - - - - - - - - - - - - - - - - - - - -
polandcentral - - - - - - - - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - - - - - - - -
사우스센트럴러스 - - - - - - - - - - - - - - - - - - - - - - - - -
남인도 - - - - - - - - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - - - - - - - - - - -
스웨덴 중부 - - - - - -
스위스 북부 - - - - - - - - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - - - - - - - - - -
웨스트어스 - - - - - - - - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - - - - - -

비고

o3-deep-research 는 현재 Azure AI Foundry 에이전트 서비스에서만 사용할 수 있습니다. 자세한 내용은 심층 연구 도구 지침을 참조하세요.

이 표에는 지역별 가용성 정보 미세 조정이 포함되어 있지 않습니다. 이 정보는 미세 조정 섹션을 참조하세요.

엔드포인트별 표준 배포(지역) 모델

채팅 완료

지역 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
오스트레일리아이스트 - - - - - -
캐나다 동부 - - - - - -
이스트유스 -
eastus2 -
francecentral - - - - - -
japaneast - - - - - - -
노스센트럴러스 -
노르웨이 동부 - - - - - - - -
사우스센트럴러스 -
남인도 - - - - - -
스웨덴 중부
스위스 북부 - - - - - - -
uksouth - - - - - -
westeurope - - - - - - - -
웨스트어스
westus3 -

비고

o1-mini은(는) 현재 모든 고객이 글로벌 표준 배포에 사용할 수 있습니다.

o1-mini 제한된 액세스 릴리스의 일환으로 선택된 고객에게 o1-preview의 표준(지역) 배포 액세스 권한이 부여되었습니다. 현재 o1-mini 표준(지역) 배포에 대한 액세스는 확장되지 않습니다.

GPT-4 및 GPT-4 Turbo 모델 가용성

GPT-3.5 모델

Azure OpenAI가 모델 버전 업그레이드를 처리하는 방법에 대한 자세한 내용은 모델 버전을 참조하세요. GPT-3.5 Turbo 배포의 모델 버전 설정을 보고 구성하는 방법을 알아보려면 모델 작업을 참조하세요.

모델 미세 조정

비고

gpt-35-turbo: 이 모델의 미세 조정은 지역의 하위 집합으로 제한되며 기본 모델을 사용할 수 있는 모든 지역에서 사용할 수 없습니다.

Azure AI Foundry 프로젝트에서 Azure OpenAI 모델을 사용하는 경우와 프로젝트 외부를 사용하는 경우 미세 조정에 지원되는 지역이 달라질 수 있습니다.

모델 아이디 표준 학습 지역 글로벌 교육 최대 요청(토큰) 학습 데이터(최대) Modality
gpt-35-turbo
(1106)
미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
- 입력: 16,385
출력: 4,096
2021년 9월 텍스트에서 텍스트로
gpt-35-turbo
(0125)
미국 동부2
미국 중북부
스웨덴 중부
스위스 서부
- 16,385 2021년 9월 텍스트에서 텍스트로
gpt-4o-mini
(2024-07-18)
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 65,536
2023년 10월 텍스트에서 텍스트로
gpt-4o
(2024-08-06)
미국 동부2
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 65,536
2023년 10월 텍스트와 비전을 텍스트로
gpt-4.1
(2025-04-14)
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 65,536
2024년 5월 텍스트와 비전을 텍스트로
gpt-4.1-mini
(2025-04-14)
미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 65,536
2024년 5월 텍스트에서 텍스트로
gpt-4.1-nano (2025-04-14) 미국 중북부
스웨덴 중부
입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 32,768
2024년 5월 텍스트에서 텍스트로
o4-mini
(2025-04-16)
미국 동부2
스웨덴 중부
- 입력: 128,000
출력: 16,384
학습 예제 컨텍스트 길이: 65,536
2024년 5월 텍스트에서 텍스트로

비고

글로벌 교육은 토큰당 더 저렴한 교육을 제공하지만 데이터 상주를 제공하지는 않습니다. 현재 다음 지역의 Azure OpenAI 리소스에서 사용할 수 있습니다.

  • Australia East
  • Brazil South
  • Canada Central
  • Canada East
  • East US
  • 미국 동부2
  • 프랑스 중부
  • 독일 중서부
  • Italy North
  • 일본 동부 (비전 지원 없음)
  • Korea Central
  • 미국 중북부
  • Norway East
  • 폴란드 중부 (4.1나노 지원 없음)
  • 동남아시아
  • 남아프리카 북부
  • 미국 중남부
  • South India
  • Spain Central
  • 스웨덴 중부
  • 스위스 서부
  • Switzerland North
  • UK South
  • West Europe
  • West US
  • 미국 서부3

도우미(미리 보기)

Assistants의 경우 지원되는 모델과 지원되는 지역의 조합이 필요합니다. 특정 도구와 기능에는 최신 모델이 필요합니다. 다음 모델은 Assistants API, SDK 및 Azure AI Foundry에서 사용할 수 있습니다. 다음 표는 표준 배포용입니다. 프로비전된 처리량 단위 가용성에 대한 내용은 프로비전된 처리량을 참조하세요. 나열된 모델과 지역은 Assistants v1과 v2 모두에서 사용할 수 있습니다. 다음 지역에서 지원되는 경우 글로벌 표준 모델을 사용할 수 있습니다.

지역 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-미리보기 gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
오스트레일리아이스트 - - - - -
이스트유스 - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
노르웨이 동부 - - - - - - - - - - -
남인도 - - - - - - - - -
스웨덴 중부 - -
uksouth - - - - - -
웨스트어스 - - - - -
westus3 - - - - - -

모델 은퇴

모델 사용 중지에 대한 최신 정보는 모델 사용 중지 가이드를 참조하세요.

비고

Azure에서 직접 판매하는 Foundry 모델에는 모든 Azure OpenAI 모델도 포함됩니다. 이러한 모델에 대해 알아보려면 이 문서의 맨 위에 있는 Azure OpenAI 모델 컬렉션으로 전환합니다.

Azure를 통해 직접 제공되는 Black Forest Labs의 AI 모델

이미지 생성 모델의 BFL(Black Forest Labs) 컬렉션에는 컨텍스트 내 생성 및 편집을 위한 FLUX.1 Kontext [pro] 및 텍스트-이미지 생성을 위한 FLUX1.1 [pro]가 포함됩니다.

BFL 서비스 공급자 API 및 이미지/세대 및 이미지/편집 엔드포인트를 통해 이러한 모델을 실행할 수 있습니다.

Model 형식 및 API 엔드포인트 역량 배포 유형(지역 가용성) 프로젝트 형식
FLUX.1-Kontext-pro 이미지 생성
- 이미지 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
and
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- BFL 서비스 공급자 API: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- 입력: 텍스트 및 이미지(토큰 5000개 및 이미지 1개)
- 출력: 하나의 이미지
- 도구 호출: 아니요
- 응답 형식: 이미지(PNG 및 JPG)
- 주요 기능: 문자 일관성, 고급 편집
- 추가 매개 변수:(공급자별 API에서만 해당)seed, aspect ratio, input_image, prompt_unsampling, safety_toleranceoutput_format, , webhook_url,webhook_secret
- 전역 표준(모든 지역) Foundry, 허브 기반
FLUX-1.1-pro 이미지 생성
- 이미지 API: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- BFL 서비스 공급자 API: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- 입력: 텍스트(토큰 5,000개 및 이미지 1개)
- 출력: 하나의 이미지
- 도구 호출: 아니요
- 응답 형식: 이미지(PNG 및 JPG)
- 주요 기능: 빠른 유추 속도, 강력한 프롬프트 준수, 경쟁력 있는 가격 책정, 확장 가능한 생성
- 추가 매개 변수:(공급자별 API에서만 해당)width, height, prompt_unsampling, seed, safety_toleranceoutput_format, , webhook_url,webhook_secret
- 전역 표준(모든 지역) Foundry, 허브 기반

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Azure에서 직접 판매하는 DeepSeek 모델

DeepSeek 모델 제품군에는 DeepSeek-R1이 포함되는데, 이 모델은 언어, 과학적 추론, 코딩 작업 등 단계별 학습 프로세스를 사용하여 추론 작업에 탁월합니다.

Model 유형 역량 배포 유형(지역 가용성) 프로젝트 형식
DeepSeek-V3.1 chat-completion
(추론 콘텐츠 포함)
- 입력: 텍스트(토큰 131,072개)
- 출력: (토큰 131,072개)
- 언어:enzh
- 도구 호출:
- 응답 형식: 텍스트, JSON
- 전역 표준(모든 지역) Foundry, 허브 기반
DeepSeek-R1-0528 chat-completion
(추론 콘텐츠 포함)
- 입력: 텍스트(163,840개 토큰)
- 출력: (토큰 163,840개)
- 언어:enzh
- 도구 호출: 아니요
- 응답 형식: 텍스트입니다.
- 전역 표준(모든 지역)
- 전역 프로비전(모든 지역)
Foundry, 허브 기반
DeepSeek-V3-0324 chat-completion - 입력: 텍스트(토큰 131,072개)
- 출력: (토큰 131,072개)
- 언어:enzh
- 도구 호출:
- 응답 형식: 텍스트, JSON
- 전역 표준(모든 지역)
- 전역 프로비전(모든 지역)
Foundry, 허브 기반
DeepSeek-R1 chat-completion
(추론 콘텐츠 포함)
- 입력: 텍스트(163,840개 토큰)
- 출력: (토큰 163,840개)
- 언어:enzh
- 도구 호출: 아니요
- 응답 형식: 텍스트입니다.
- 전역 표준(모든 지역)
- 전역 프로비전(모든 지역)
Foundry, 허브 기반

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요.

Azure에서 직접 판매하는 메타 모델

Meta Llama 모델 및 도구는 미리 학습되고 미세 조정된 생성 AI 텍스트 및 이미지 추론 모델의 컬렉션입니다. 메타 모델의 규모는 다음과 같습니다.

  • 1B 및 3B Base 및 Instruct 모델과 같은 SLM(소규모 언어 모델)은 디바이스 및 에지 유추를 위한 것입니다.
  • 7B, 8B 및 70B 기본 및 지시 모델과 같은 중형 LLM(대규모 언어 모델)
  • Meta Llama 3.1-405B와 같은 고성능 모델은 가상 데이터 생성 및 증류 사용 사례에 적합합니다.
Model 유형 역량 배포 유형(지역 가용성) 프로젝트 형식
Llama-4-Maverick-17B-128E-Instruct-FP8 chat-completion - 입력: 텍스트 및 이미지(1M 토큰)
- 출력: 텍스트(1M 토큰)
- 언어:ar, , en,fr, dehi, id, it, ptestl, 및 thvi
- 도구 호출: 아니요
- 응답 형식: 텍스트
- 전역 표준(모든 지역) Foundry, 허브 기반
Llama-3.3-70B-Instruct chat-completion - 입력: 텍스트(128,000개의 토큰)
- 출력: 텍스트(8,192개 토큰)
- 언어:en, ,defr, it, pthi, esth
- 도구 호출: 아니요
- 응답 형식: 텍스트
- 전역 표준(모든 지역) Foundry, 허브 기반

Azure AI Foundry 포털에서 이 모델 컬렉션을 참조 하세요. 파트너와 커뮤니티에서 제공하는 여러 메타 모델도 찾아볼 수 있습니다.

Azure에서 직접 판매하는 Microsoft 모델

Microsoft 모델에는 MAI 모델, Phi 모델, 의료 AI 모델 등과 같은 다양한 모델 그룹이 포함됩니다. 사용 가능한 모든 Microsoft 모델을 보려면 Azure AI Foundry 포털에서 Microsoft 모델 컬렉션을 확인합니다.

Model 유형 역량 배포 유형(지역 가용성) 프로젝트 형식
MAI-DS-R1 chat-completion
(추론 콘텐츠 포함)
- 입력: 텍스트(163,840개 토큰)
- 출력: (토큰 163,840개)
- 언어:enzh
- 도구 호출: 아니요
- 응답 형식: 텍스트입니다.
- 전역 표준(모든 지역) Foundry, 허브 기반

Azure AI Foundry 포털에서 Microsoft 모델 컬렉션을 참조하세요. 파트너와 커뮤니티를 통해 제공되는 여러 Microsoft 모델도 찾아볼 수 있습니다.

Azure에서 직접 판매하는 Mistral 모델

Model 유형 역량 배포 유형(지역 가용성) 프로젝트 형식
mistral-document-ai-2505 이미지-텍스트 변환 - 입력: 이미지 또는 PDF 페이지(30페이지, 최대 30MB PDF 파일)
- 출력: 텍스트
- 언어: en
- 도구 호출: 아니요
- 응답 형식: Text, JSON, Markdown
- 전역 표준(모든 지역)
- 데이터 영역 표준(미국 및 EU)
파운드리

Azure AI 파운드리 포털의 Mistral 모델 컬렉션을 참조하세요. 파트너와 커뮤니티를 통해 여러 가지 Mistral 모델을 찾아볼 수도 있습니다.

Azure에서 직접 판매하는 xAI 모델

Azure AI Foundry Models의 xAI Grok 모델에는 다양한 엔터프라이즈 도메인에서 뛰어난 성과를 내도록 설계된 다양한 모델 집합이 포함되어 있으며, 여기에는 다음과 같은 다양한 기능과 가격대가 포함됩니다.

  • Colossus 데이터 센터에서 미리 학습한 비이성적 모델인 Grok 3은 뛰어난 명령 기반 기능과 함께 데이터 추출, 코딩 및 텍스트 요약과 같은 비즈니스 사용 사례에 맞게 조정됩니다. 131,072 토큰 컨텍스트 창을 지원하므로 일관성과 깊이를 유지하면서 광범위한 입력을 처리할 수 있으며 도메인 및 언어 간에 연결을 그리는 데 능숙합니다.

  • Grok 3 Mini는 테스트 시간 컴퓨팅을 통해 에이전트, 코딩, 수학 및 심층 과학 문제를 해결하도록 학습된 가벼운 추론 모델입니다. 또한 코드베이스 및 엔터프라이즈 문서를 이해하기 위한 131,072개의 토큰 컨텍스트 창을 지원하며, 도구를 사용하여 새로운 환경에서 복잡한 논리적 문제를 해결하는 데 탁월하며, 조정 가능한 사고 예산으로 사용자 검사를 위한 원시 추론 추적을 제공합니다.

  • Grok Code Fast 1은 에이전트 코딩 애플리케이션에서 사용하도록 설계된 빠르고 효율적인 추론 모델입니다. 코딩에 초점을 맞춘 데이터 집합에 사전 학습된 이후, 다양한 코딩 작업 및 도구 사용에 대한 시연과 xAI의 안전 정책에 따라 올바른 거부 행동 시연이 추가 학습되었습니다. grok-code-fast-1 모델에 액세스하려면 등록이 필요합니다.

  • Grok 4 Fast는 대기 시간 및 비용이 훨씬 낮은 거의 Grok 4 추론 기능을 제공하고 초고속 애플리케이션에 대한 추론을 완전히 우회할 수 있는 효율성 최적화 언어 모델입니다. 이 도구는 기본 제공 거부 동작, 고정된 안전 적용 시스템 프롬프트 및 오용을 방지하기 위한 입력 필터를 사용하여 안전하고 효과적인 도구 사용을 위해 학습됩니다.

  • Grok 4는 고급 추론 및 도구 사용 기능을 갖춘 xAI의 최신 추론 모델로, 까다로운 학술 및 업계 벤치마크에서 새로운 최첨단 성능을 달성할 수 있습니다. grok-4 모델에 액세스하려면 등록이 필요합니다.

Model 유형 역량 배포 유형(지역 가용성) 프로젝트 형식
grok-4 chat-completion - 입력: 텍스트, 이미지(토큰 256,000개)
- 출력: 텍스트(8,192개 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역) Foundry, 허브 기반
Grok-빠른 추론을 위한 버전4 chat-completion - 입력: 텍스트, 이미지(토큰 2,000,000개)
- 출력: text(2,000,000 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역)
- 데이터 영역 표준(미국)
Foundry, 허브 기반
grok-4-fast-non-reasoning chat-completion - 입력: 텍스트, 이미지(토큰 2,000,000개)
- 출력: text(2,000,000 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역)
- 데이터 영역 표준(미국)
Foundry, 허브 기반
grok-code-fast-1 chat-completion - 입력: 텍스트(256,000 토큰)
- 출력: 텍스트(8,192개 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역) Foundry, 허브 기반
grok-3 chat-completion - 입력: 텍스트(토큰 131,072개)
- 출력: text(131,072 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역)
- 데이터 영역 표준(미국)
Foundry, 허브 기반
grok-3-mini chat-completion - 입력: 텍스트(토큰 131,072개)
- 출력: text(131,072 토큰)
- 언어들:en
- 도구 호출:
- 응답 형식: 텍스트
- 전역 표준(모든 지역)
- 데이터 영역 표준(미국)
Foundry, 허브 기반

Azure AI Foundry 포털에서 xAI 모델 컬렉션을 참조하세요.

배포 유형별 모델 지역 가용성

Foundry 모델에서는 비즈니스 및 사용 패턴에 맞는 호스팅 구조를 선택할 수 있습니다. 이 서비스는 다음 두 가지 주요 배포 유형을 제공합니다.

  • 표준: 글로벌 배포 옵션이 있어 트래픽을 전역적으로 라우팅하여 더 높은 처리량을 제공합니다.
  • 프로비저닝됨: Azure 글로벌 인프라에서 프로비전된 처리량 단위를 구매하고 배포할 수 있는 전역 배포 옵션도 있습니다.

모든 배포는 동일한 유추 작업을 수행하지만 청구, 규모 및 성능은 다릅니다. 배포 유형에 대한 자세한 내용은 Azure AI Foundry 모델의 배포 유형을 참조하세요.

글로벌 표준 모델 가용성

지역 DeepSeek-R1-0528 DeepSeek-R1 DeepSeek-V3-0324 DeepSeek-V3.1 FLUX.1-Kontext-pro FLUX-1.1-pro grok-4 Grok-빠른 추론을 위한 버전4 grok-4-fast-non-reasoning grok-code-fast-1 grok-3 grok-3-mini Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-DS-R1 mistral-document-ai-2505
오스트레일리아이스트
브라질 남부
캐나다 동부
이스트유스
eastus2
francecentral
독일 서중부
이탈리아 북부
japaneast
koreacentral
노스센트럴러스
노르웨이 동부
polandcentral
southafricanorth
사우스센트럴러스
남인도
spaincentral
스웨덴 중부
스위스 북부
switzerlandwest
uaenorth
uksouth
westeurope
웨스트어스
westus3

열기 및 사용자 지정 모델

모델 카탈로그는 다양한 공급자의 다양한 모델을 제공합니다. 이러한 모델의 경우 모델이 API로 제공되는 Azure AI 파운드리 리소스의 표준 배포 옵션을 사용할 수 없습니다. 대신, 이러한 모델을 배포하려면 인프라에 모델을 호스팅하고, AI 허브를 만들고, 모델을 호스팅하기 위한 기본 컴퓨팅 할당량을 제공해야 할 수도 있습니다.

또한 이러한 모델은 오픈 액세스 또는 IP 보호될 수 있습니다. 두 경우 모두 Azure AI Foundry의 관리형 컴퓨팅 제품에 배포해야 합니다. 시작하려면 방법: 관리형 컴퓨팅에 배포를 참조하세요.