이 문서에서는 Azure OpenAI에 대한 유추 REST API 엔드포인트에 대한 세부 정보를 제공합니다.
API 사양
Azure OpenAI 모델 및 리소스 관리 및 상호 작용은 다음 세 가지 기본 API 화면으로 나뉩니다.
- 제어 평면
- 데이터 평면 - 작성
- 데이터 평면 - 유추
각 API 표면/사양은 다른 Azure OpenAI 기능 집합을 캡슐화합니다. 각 API에는 고유한 미리 보기 집합과 안정적인/일반 공급(GA) API 릴리스가 있습니다. 현재 미리 보기 릴리스는 월별 주기를 따르는 경향이 있습니다.
중요합니다
이제 새 미리 보기 유추 API가 있습니다. API 수명 주기 가이드에서 자세히 알아보세요.
응용 프로그램 인터페이스 (API) | 최신 미리 보기 릴리스 | 최신 GA 릴리스 | 사양 | 설명 |
---|---|---|---|---|
컨트롤 플레인 | 2024-06-01-preview |
2024-10-01 |
사양 파일 | Azure OpenAI는 다른 모든 서비스와 공통 컨트롤 플레인을 공유합니다. 컨트롤 플레인 API는 Azure OpenAI 리소스 만들기, 모델 배포 및 기타 상위 수준 리소스 관리 작업 등에 사용됩니다. 또한 컨트롤 플레인은 Azure Resource Manager, Bicep, Terraform 및 Azure CLI와 같은 기능으로 수행할 수 있는 작업을 제어합니다. |
데이터 평면 - 작성 | 2025-04-01-preview |
2024-10-21 |
사양 파일 | 데이터 평면 작성 API는 미세 조정, 파일 업로드, 수집 작업, 일괄 처리, 특정 모델 수준 쿼리를 제어합니다. |
데이터 평면 - 유추 | 2025-04-01-preview |
2024-10-21 |
사양 파일 | 데이터 평면 추론 API는 컴플리션, 채팅 컴플리션, 임베딩, 오디오, 사용자의 데이터, Dall-e, 어시스턴트 등의 기능에 대한 추론 기능/엔드포인트를 제공합니다. |
인증
Azure OpenAI는 두 가지 인증 방법을 제공합니다. API 키 또는 Microsoft Entra ID를 사용할 수 있습니다.
API 키 인증: 이 인증 형식의 경우 모든 API 요청은
api-key
HTTP 헤더에 API 키를 포함해야 합니다. 빠른 시작은 이러한 형식의 인증으로 전화를 거는 방법에 대한 지침을 제공합니다.Microsoft Entra ID 인증: Microsoft Entra 토큰을 사용하여 API 호출을 인증할 수 있습니다. 인증 토큰은 요청에
Authorization
헤더로 포함됩니다. 제공된 토큰은Bearer
가 앞에 와야 합니다(예:Bearer YOUR_AUTH_TOKEN
). Microsoft Entra ID로 인증하는 방법 가이드를 읽을 수 있습니다.
REST API 버전 관리
서비스 API는 api-version
쿼리 매개 변수를 사용하여 버전이 지정됩니다. 모든 버전은 YYYY-MM-DD 날짜 구조를 따릅니다. 다음은 그 예입니다.
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
데이터 평면 유추
이 문서의 남은 부분에서는 Azure OpenAI 데이터 평면 유추 사양의 미리 보기 릴리스를 다룹니다.
최신 GA API 릴리스에 대한 설명서를 찾는 경우 최신 GA 데이터 평면 유추 API를 참조하세요.
완성 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
best_of | integer | 서버 쪽에서 best_of 완료를 생성하고 "최상"(토큰당 로그 확률이 가장 높은 것)을 반환합니다. 결과를 스트리밍할 수 없습니다.n 와 함께 사용 시, best_of 는 후보 완료 횟수를 제어하며, 반환할 n 의 수는 best_of 보다 커야 합니다.참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokens 및 stop 에 대한 설정이 적절한지 확인합니다. |
아니오 | 1 |
echo | boolean | 완성을 제공하는 것 외에 프롬프트를 다시 표시합니다. | 아니오 | 거짓 |
frequency_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. | 아니오 | 0 |
logit_bias | 객체 | 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(GPT 토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. 예를 들어, {"50256": -100} 을 전달하면 <|endoftext|> 토큰이 생성되지 않습니다. |
아니오 | 없음 |
logprobs | integer | 가장 가능성이 높은 logprobs 출력 토큰과 선택한 토큰에 대한 로그 확률을 포함합니다. 예를 들어, logprobs 가 5이면 API는 가장 가능성 있는 5개의 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 logprob 를 반환하므로 응답에 최대 logprobs+1 개의 요소가 있을 수 있습니다.logprobs 의 최댓값은 5입니다. |
아니오 | 없음 |
최대 토큰 수 | integer | 완료 시 최대 토큰 수를 생성할 수 있습니다. 프롬프트의 토큰 수에 max_tokens 를 더한 값은 모델의 컨텍스트 길이를 초과할 수 없습니다. |
아니오 | 16 |
n | integer | 각 프롬프트에 대해 생성할 완성 수입니다. 참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokens 및 stop 에 대한 설정이 적절한지 확인합니다. |
아니오 | 1 |
presence_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. | 아니오 | 0 |
프롬프트 | 문자열 또는 배열 | 문자열, 문자열 배열, 토큰 배열 또는 토큰 배열의 배열로 인코딩된 완성을 생성하라는 프롬프트입니다. <|endoftext|>는 학습 중에 모델이 보는 문서 구분 기호이므로 프롬프트가 지정되지 않은 경우 모델은 새 문서의 시작 부분에서 생성되는 것처럼 생성됩니다. |
예 | |
씨앗 | integer | 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다. |
아니오 | |
멈춰! | 문자열 또는 배열 | API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다. | 아니오 | |
스트림 | boolean | 부분 진행률을 다시 스트리밍할지 여부를 나타냅니다. 설정된 경우 토큰은 데이터 전용 서버 전송 이벤트로 전송되며 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제 |
아니오 | 거짓 |
suffix | 문자열 | 삽입된 텍스트 완성 뒤에 오는 접미사입니다. 이 매개 변수는 gpt-3.5-turbo-instruct 에만 지원됩니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | createCompletionResponse |
상태 코드: 기본값
설명: 서비스를 사용할 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | errorResponse |
예시
예시
제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
응답: 상태 코드: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
포함 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
기계 학습 모델 및 알고리즘에서 쉽게 사용할 수 있는 지정된 입력의 벡터 표현을 가져옵니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | 배포된 모델의 배포 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
dimensions | integer | 결과 출력 포함에 있어야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. |
아니오 | |
인코딩 형식 | 문자열 | 반환할 포함의 형식입니다. float 또는 base64 일 수 있습니다. 기본값은 float 입니다. |
아니오 | |
입력 | 문자열 또는 배열 | 문자열 또는 토큰 배열로 인코딩된 포함할 텍스트를 입력합니다. 단일 요청에 여러 입력을 포함하려면 문자열 배열 또는 토큰 배열 배열을 전달합니다. 입력은 모델의 최대 입력 토큰(8192 토큰의 경우 text-embedding-ada-002 )을 초과해서는 안 되며, 빈 문자열일 수 없으며 배열은 2048차원 이하여야 합니다. |
예 | |
input_type (입력 유형) | 문자열 | 사용할 포함 검색의 입력 형식 | 아니오 | |
사용자 | 문자열 | 최종 사용자를 나타내는 고유 식별자로, 남용을 모니터링하고 감지하는 데 도움이 됩니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 객체 |
예시
예시
지정된 프롬프트에 대한 포함을 반환합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
{
"input": [
"this is a test"
]
}
응답: 상태 코드: 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0020113448
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
채팅 완성 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
채팅 메시지에 대한 완성을 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
audio | 객체 | 오디오 출력에 대한 매개 변수입니다. 을 modalities: ["audio"] 사용하여 오디오 출력을 요청할 때 필요합니다. |
아니오 | |
└─ 형식 | enum | 출력 오디오 형식을 지정합니다. wav , mp3 , flac , opus , 또는 pcm16 중 하나여야 합니다. 가능한 값: wav , mp3 , flac , opus pcm16 |
아니오 | |
└─ 음성 | enum | 음성 유형을 지정합니다. 지원되는 음성은 alloy ,echo , fable , onyx nova 및 shimmer .가능한 값: alloy , echo , fable onyx , nova shimmer |
아니오 | |
데이터_소스 | array | 이를 사용하는 Azure OpenAI 채팅 확장에 대한 구성 항목입니다. 이 추가 사양은 Azure OpenAI와만 호환됩니다. |
아니오 | |
frequency_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. |
아니오 | 0 |
함수 호출 | 문자열 또는 chatCompletionFunctionCallOption | tool_choice 에는 더 이상 사용되지 않습니다.모델에서 호출되는 함수(해당하는 경우)를 제어합니다. none 은 모델이 함수를 호출하지 않고 대신 메시지를 생성함을 의미합니다.auto 는 모델이 메시지 생성 또는 함수 호출 중에서 선택할 수 있음을 의미합니다.{"name": "my_function"} 을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.함수가 없을 경우 none 이 기본값입니다. 함수가 있는 경우 auto 가 기본값입니다. |
아니오 | |
기능 | array | tools 에는 더 이상 사용되지 않습니다.모델이 JSON 입력을 생성할 수 있는 함수 목록입니다. |
아니오 | |
logit_bias | 객체 | 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. |
아니오 | 없음 |
logprobs | boolean | 출력 토큰의 로그 확률을 반환할지 여부를 나타냅니다. true인 경우 content 의 message 에 반환된 각 출력 토큰의 로그 확률을 반환합니다. |
아니오 | 거짓 |
최대_완료_토큰 | integer | 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. | 아니오 | |
최대 토큰 수 | integer | 채팅 완성 시 생성할 수 있는 최대 토큰 수입니다. 입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 따라 제한됩니다. |
아니오 | |
메시지 | array | 지금까지의 대화를 구성하는 메시지 목록입니다. Python 코드 예제 | 예 | |
메타데이터 | 객체 | 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. | 아니오 | |
형식 | ChatCompletionModalities | 이 요청에 대해 모델이 생성할 출력 형식입니다. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다. ["text"] gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.["text", "audio"] |
아니오 | |
n | integer | 각 입력 메시지에 대해 생성할 채팅 완성 선택 항목 수입니다. 모든 선택 항목에 걸쳐 생성된 토큰 수에 따라 요금이 부과됩니다. 비용을 최소화하려면 n 을 1 로 유지합니다. |
아니오 | 1 |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
prediction | PredictionContent | 예측 출력에 대한 구성으로, 모델 응답의 많은 부분이 미리 알려진 경우 응답 시간을 크게 향상시킬 수 있습니다. 대부분의 콘텐츠가 약간만 변경된 파일을 다시 생성할 때 가장 일반적입니다. | 아니오 | |
presence_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. |
아니오 | 0 |
추론 노력 | enum | o1 모델만 추론 모델에서 추론 작업을 제한합니다. 현재 지원되는 값은 low , medium 및 high 입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.가능한 값: low , medium high |
아니오 | |
응답_형식 | ResponseFormatText, ResponseFormatJsonObject 또는 ResponseFormatJsonSchema | 모델이 출력해야 하는 형식을 지정하는 개체입니다. GPT-4o, GPT-4o mini, GPT-4 Turbo 및 보다 최신인 모든 gpt-3.5-turbo-1106 Turbo 모델과 호환됩니다.{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조적 출력을 사용하도록 설정합니다.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
씨앗 | integer | 이 기능은 베타 버전으로 제공됩니다. 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다. |
아니오 | |
멈춰! | 문자열 또는 배열 | API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. |
아니오 | |
store | boolean | 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. | 아니오 | |
스트림 | boolean | 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제 |
아니오 | 거짓 |
스트림 옵션 | 채팅완료스트림옵션 | 스트리밍 응답에 대한 옵션입니다. stream: true 를 설정할 때만 설정합니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
도구_선택 | chatCompletionToolChoiceOption | 모델이 호출하는 도구(있는 경우)를 제어합니다. none 은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다. auto 는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required 는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}} 을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none 은 도구가 없는 경우 기본값입니다. auto 는 도구가 있는 경우 기본값입니다. |
아니오 | |
도구들 | array | 모델이 호출할 수 있는 도구 목록입니다. 현재 함수만 도구로 지원됩니다. 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하려면 이를 사용합니다. 최대 128개의 함수가 지원됩니다. |
아니오 | |
top_logprobs | integer | 각 토큰 위치에서 반환될 가능성이 가장 높은 토큰 수를 지정하는 0에서 20 사이의 정수로, 각 토큰에는 관련 로그 가능성이 있습니다. 이 매개 변수를 사용하는 경우 logprobs 를 true 로 설정해야 합니다. |
아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. |
아니오 | |
사용자 보안 컨텍스트 | userSecurityContext | 사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 객체 |
상태 코드: 기본값
설명: 서비스를 사용할 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | errorResponse |
예시
예시
제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
Azure Search 데이터 및 시스템 할당 관리 ID를 기준으로 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
Azure Search 이미지 벡터 데이터를 기준으로 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"query_type": "vector",
"fields_mapping": {
"image_vector_fields": [
"image_vector"
]
},
"authentication": {
"type": "api_key",
"key": "{api key}"
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion."
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
Azure Search 벡터 데이터, 이전 도우미 메시지 및 사용자 할당 관리 ID를 기준으로 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
제공된 Azure Cosmos DB에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
제공된 Mongo DB에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "mongo_db",
"parameters": {
"authentication": {
"type": "username_and_password",
"username": "<username>",
"password": "<password>"
},
"endpoint": "<endpoint_name>",
"app_name": "<application name>",
"database_name": "sampledb",
"collection_name": "samplecollection",
"index_name": "sampleindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
제공된 Elasticsearch에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "elasticsearch",
"parameters": {
"endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
"index_name": "{index name}",
"authentication": {
"type": "key_and_key_id",
"key": "{key}",
"key_id": "{key id}"
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
예시
제공된 Pinecone 리소스에 대한 완성을 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "pinecone",
"parameters": {
"authentication": {
"type": "api_key",
"key": "{api key}"
},
"environment": "{environment name}",
"index_name": "{index name}",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"title_field": "title",
"url_field": "url",
"filepath_field": "filepath",
"content_fields": [
"content"
],
"content_fields_separator": "\n"
}
}
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
전사 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
오디오를 입력 언어로 전사합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
콘텐츠 형식: multipart/form-data
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 | 문자열 | 전사할 오디오 파일 개체입니다. | 예 | |
언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1 형식으로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. | 아니오 | |
프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다. | 아니오 | |
응답_형식 | audioResponseFormat | 출력의 형식을 정의합니다. | 아니오 | |
온도 | 숫자 | 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. | 아니오 | 0 |
timestamp_granularities[] | array | 이 전사를 위해 채울 타임스탬프 세분성입니다. 타임스탬프 세분성을 사용하려면 response_format 을 verbose_json 으로 설정해야 합니다. word 또는 segment 옵션 중 하나 또는 둘 다 지원됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다. |
아니오 | ['segment'] |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 객체 | |
텍스트/일반 | 문자열 | 출력 형식으로 텍스트를 전사했습니다(response_format이 text , vtt 또는 srt 중 하나인 경우). |
예시
예시
제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
예시
제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
번역 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
입력 오디오를 영어 텍스트로 전사하고 번역합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
콘텐츠 형식: multipart/form-data
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 | 문자열 | 번역할 오디오 파일입니다. | 예 | |
프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다. | 아니오 | |
응답_형식 | audioResponseFormat | 출력의 형식을 정의합니다. | 아니오 | |
온도 | 숫자 | 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. | 아니오 | 0 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 객체 | |
텍스트/일반 | 문자열 | 출력 형식으로 텍스트를 전사했습니다(response_format이 text, vtt 또는 srt 중 하나인 경우). |
예시
예시
제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
예시
제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
응답: 상태 코드: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
음성 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
입력 텍스트에서 오디오를 생성합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
콘텐츠 형식: multipart/form-data
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력 | 문자열 | 오디오를 합성할 텍스트입니다. 최대 길이는 4096자입니다. | 예 | |
응답_형식 | enum | 오디오를 합성할 형식입니다. 가능한 값: mp3 , opus , aac flac , wav pcm |
아니오 | |
속도 | 숫자 | 합성된 오디오의 속도입니다. 0.25 ~4.0 의 값을 선택합니다. 1.0 기본값입니다. |
아니오 | 1.0 |
목소리 | enum | 음성 합성에 사용할 음성입니다. 가능한 값: alloy , echo , fable onyx , nova shimmer |
예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
어플리케이션/옥텟 스트림 (application/octet-stream) | 문자열 |
예시
예시
제공된 텍스트에서 오디오를 합성합니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
응답: 상태 코드: 200
{
"body": "101010101"
}
이미지 생성 - 만들기
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
주어진 DALLE 또는 gpt-image-1 모델 배포에서 텍스트 캡션으로부터 일괄 이미지를 생성합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
background | imageBackground | 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다. | 아니오 | auto |
n | integer | 생성할 이미지 수입니다. dall-e-3의 경우 n=1만 지원됩니다. | 아니오 | 1 |
출력 압축 | integer | 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 jpeg 출력 형식의 gpt-image-1에 대해서만 지원됩니다. | 아니오 | 100 |
출력 형식 | imagesOutputFormat | 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다. | 아니오 | png |
프롬프트 | 문자열 | 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 gpt-image-1의 경우 32000자, dall-e-3의 경우 4,000자입니다. | 예 | |
질 | imageQuality | 생성될 이미지의 품질입니다. | 아니오 | auto |
응답_형식 | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | 아니오 | url |
크기 | imageSize | 생성된 이미지의 크기입니다. | 아니오 | auto |
style | imageStyle | 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다. | 아니오 | vivid |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | generateImagesResponse |
상태 코드: 기본값
설명: 오류가 발생했습니다.
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | dalleErrorResponse |
예시
예시
프롬프트가 지정된 이미지를 만듭니다.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
응답: 상태 코드: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
이미지 생성 - 편집
POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview
지정된 gpt-image-1 모델 배포의 텍스트 캡션에서 이미지를 편집합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
deployment-id | 길 | 예 | 문자열 | |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
콘텐츠 형식: multipart/form-data
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 | 문자열 또는 배열 | 편집할 이미지입니다. 지원되는 이미지 파일 또는 이미지 배열이어야 합니다. 각 이미지는 png 또는 jpg 파일이 25MB 미만이어야 합니다. | 예 | |
마스크 | 문자열 | 완전히 투명한 영역(예: 알파가 0인 경우)이 있는 추가 이미지는 이미지를 편집해야 하는 위치를 나타냅니다. 여러 이미지가 제공되면 마스크가 첫 번째 이미지에 적용됩니다. 유효한 PNG 파일(4MB 미만)이어야 하며 이미지와 크기가 같아야 합니다. | 아니오 | |
n | integer | 생성할 이미지 수입니다. | 아니오 | 1 |
프롬프트 | 문자열 | 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 32000자입니다. | 예 | |
질 | imageQuality | 생성될 이미지의 품질입니다. | 아니오 | auto |
응답_형식 | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | 아니오 | url |
크기 | imageSize | 생성된 이미지의 크기입니다. | 아니오 | auto |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | generateImagesResponse |
상태 코드: 기본값
설명: 오류가 발생했습니다.
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | dalleErrorResponse |
나열 - 도우미
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
도우미 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | listAssistantsResponse |
예시
예시
도우미 목록을 반환합니다.
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "asst_abc123",
"object": "assistant",
"created_at": 1707257477,
"name": "Stock Analyst",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc456",
"object": "assistant",
"created_at": 1698982718,
"name": "My Assistant",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant designed to make me better at coding!",
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc789",
"object": "assistant",
"created_at": 1698982643,
"name": null,
"description": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
],
"first_id": "asst_abc123",
"last_id": "asst_abc789",
"has_more": false
}
}
만들기 - 도우미
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
모델과 지침이 포함된 도우미를 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 도우미에 대한 설명입니다. 최대 길이는 512자입니다. |
아니오 | |
지침 | 문자열 | 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 예 | ||
이름 | 문자열 | 도우미의 이름입니다. 최대 길이는 256자입니다. |
아니오 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
└─ 벡터_스토어 | array | file_ids를 사용하여 벡터 저장소를 만들고 이 도우미에 연결하기 위한 도우미입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter , retrieval 또는 function 형식일 수 있습니다. |
아니오 | [] |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | assistantObject |
예시
예시
모델과 지침이 포함된 도우미를 만듭니다.
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
{
"name": "Math Tutor",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"model": "gpt-4-1106-preview"
}
응답: 상태 코드: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant",
"created_at": 1707295707,
"name": "Math Tutor",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
가져오기 - 도우미
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
도우미를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
어시스턴트_아이디 | 길 | 예 | 문자열 | 검색할 도우미의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | assistantObject |
예시
예시
도우미를 검색합니다.
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "asst_abc123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
"tools": [
{
"type": "file_search"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
수정 - 도우미
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
도우미를 수정합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
어시스턴트_아이디 | 길 | 예 | 문자열 | 수정할 도우미의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 도우미에 대한 설명입니다. 최대 길이는 512자입니다. |
아니오 | |
지침 | 문자열 | 도우미가 사용하는 시스템 지침입니다. 최대 길이는 32768자입니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 아니오 | ||
이름 | 문자열 | 도우미의 이름입니다. 최대 길이는 256자입니다. |
아니오 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록을 재정의합니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소를 재정의합니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter , retrieval 또는 function 형식일 수 있습니다. |
아니오 | [] |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | assistantObject |
예시
예시
도우미를 수정합니다.
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
{
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"model": "gpt-4-turbo"
}
응답: 상태 코드: 200
{
"body": {
"id": "asst_123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": []
}
},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
삭제 - 도우미
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
도우미를 삭제합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
어시스턴트_아이디 | 길 | 예 | 문자열 | 삭제할 도우미의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | deleteAssistantResponse |
예시
예시
도우미를 삭제합니다.
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant.deleted",
"deleted": true
}
}
만들기 - 스레드
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
스레드를 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메시지 | array | 스레드를 시작하는 메시지 목록입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
도구_자원 | 객체 | 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 | |
└─ 벡터_스토어 | array | file_ids를 사용하여 벡터 저장소를 만들고 이 스레드에 연결하기 위한 도우미입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | threadObject |
예시
예시
스레드를 만듭니다.
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {}
}
}
가져오기 - 스레드
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
스레드를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 검색할 스레드의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | threadObject |
예시
예시
스레드를 검색합니다.
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {},
"tool_resources": {
"code_interpreter": {
"file_ids": []
}
}
}
}
수정 - 스레드
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
스레드를 수정합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 수정할 스레드의 ID입니다. metadata 만 수정할 수 있습니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
도구_자원 | 객체 | 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | threadObject |
예시
예시
스레드를 수정합니다.
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
응답: 상태 코드: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {
"modified": "true",
"user": "abc123"
},
"tool_resources": {}
}
}
삭제 - 스레드
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
스레드를 삭제합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 삭제할 스레드의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | deleteThreadResponse |
예시
예시
스레드를 삭제합니다.
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread.deleted",
"deleted": true
}
}
나열 - 메시지
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
지정된 스레드에 대한 메시지 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 메시지가 속한 스레드의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
run_id | 문의 | 아니오 | 문자열 | 메시지를 생성한 실행 ID로 필터링합니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | listMessagesResponse |
예시
예시
메시지 나열
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
},
{
"id": "msg_abc456",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "Hello, what is AI?",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
],
"first_id": "msg_abc123",
"last_id": "msg_abc456",
"has_more": false
}
}
만들기 - 메시지
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
메시지를 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 메시지를 만들 스레드의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
attachments | array | 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다. | 아니오 | |
내용 | 문자열 | 메시지의 내용입니다. | 예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
역할 | 문자열 | 메시지를 만드는 엔터티의 역할입니다. 허용되는 값은 다음과 같습니다. - user : 메시지가 실제 사용자에 의해 전송되었으며 대부분의 경우 사용자 생성 메시지를 나타내는 데 사용되어야 함을 나타냅니다.- assistant : 메시지가 도우미에 의해 생성되었음을 나타냅니다. 도우미의 메시지를 대화에 삽입하려면 이 값을 사용합니다. |
예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | messageObject |
예시
예시
메시지를 만듭니다.
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
{
"role": "user",
"content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}
응답: 상태 코드: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"assistant_id": null,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
}
가져오기 - 메시지
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
메시지를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 이 메시지가 속한 스레드의 ID입니다. |
메시지_아이디 | 길 | 예 | 문자열 | 검색할 메시지의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | messageObject |
예시
예시
메시지를 검색합니다.
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"file_ids": [],
"assistant_id": null,
"run_id": null,
"metadata": {}
}
}
수정 - 메시지
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
메시지를 수정합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 이 메시지가 속한 스레드의 ID입니다. |
메시지_아이디 | 길 | 예 | 문자열 | 수정할 메시지의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | messageObject |
예시
예시
메시지를 수정합니다.
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
응답: 상태 코드: 200
{
"body": {
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699017614,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"file_ids": [],
"metadata": {
"modified": "true",
"user": "abc123"
}
}
}
만들기 - 스레드 및 실행
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
하나의 요청으로 스레드를 만들고 실행합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
어시스턴트_아이디 | 문자열 | 이 실행을 수행하는 데 사용할 도우미의 ID입니다. | 예 | |
지침 | 문자열 | 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
최대_완료_토큰 | integer | 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
최대_프롬프트_토큰 | integer | 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 이 실행을 실행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. | 아니오 | |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
스트림 옵션 | 채팅완료스트림옵션 | 스트리밍 응답에 대한 옵션입니다. stream: true 를 설정할 때만 설정합니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
스레드(thread) | createThreadRequest | 아니오 | ||
도구_선택 | 보조자 API 도구 선택 옵션 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다.auto 는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}} 과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다. |
아니오 | |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
truncation_strategy | truncationObject | 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
하나의 요청으로 스레드를 만들고 실행합니다.
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123",
"thread": {
"messages": [
{
"role": "user",
"content": "Explain deep learning to a 5 year old."
}
]
}
}
응답: 상태 코드: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076792,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": null,
"expires_at": 1699077392,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"required_action": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant.",
"tools": [],
"tool_resources": {},
"metadata": {},
"temperature": 1.0,
"top_p": 1.0,
"max_completion_tokens": null,
"max_prompt_tokens": null,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"incomplete_details": null,
"usage": null,
"response_format": "auto",
"tool_choice": "auto"
}
}
나열 - 실행
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
스레드에 속하는 실행 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행이 속한 스레드의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | listRunsResponse |
예시
예시
스레드에 속하는 실행 목록을 반환합니다.
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
},
{
"id": "run_abc456",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
],
"first_id": "run_abc123",
"last_id": "run_abc456",
"has_more": false
}
}
만들기 - 실행
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
실행을 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행할 스레드의 ID입니다. |
include[] | 문의 | 아니오 | array | 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
추가 지침 | 문자열 | 실행 지침 끝에 추가 지침을 추가합니다. 이는 다른 지침을 재정의하지 않고 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
추가 메시지 | array | 실행을 만들기 전에 스레드에 추가 메시지를 추가합니다. | 아니오 | |
어시스턴트_아이디 | 문자열 | 이 실행을 수행하는 데 사용할 도우미의 ID입니다. | 예 | |
지침 | 문자열 | 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
최대_완료_토큰 | integer | 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
최대_프롬프트_토큰 | integer | 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 이 실행을 수행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. | 아니오 | |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_선택 | 보조자 API 도구 선택 옵션 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다.auto 는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}} 과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다. |
아니오 | |
도구들 | array | 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
truncation_strategy | truncationObject | 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
실행을 만듭니다.
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123"
}
응답: 상태 코드: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
가져오기 - 실행
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
실행을 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행된 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 검색할 실행의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
실행을 가져옵니다.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
"object": "thread.run",
"created_at": 1707303196,
"assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
"thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
"status": "completed",
"started_at": 1707303197,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1707303201,
"last_error": null,
"model": "gpt-4-1106-preview",
"instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
"tools": [],
"file_ids": [],
"metadata": {}
}
}
수정 - 실행
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
실행을 수정합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행된 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 수정할 실행의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
실행을 수정합니다.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
{
"metadata": {
"user_id": "user_abc123"
}
}
응답: 상태 코드: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {
"user_id": "user_abc123"
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
제출 - 실행할 도구 출력
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
실행에 status: "requires_action"
이 있고 required_action.type
이 submit_tool_outputs
인 경우 모두 완료되면 이 엔드포인트를 사용하여 도구 호출의 출력을 제출할 수 있습니다. 모든 출력은 단일 요청으로 제출되어야 합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 이 실행이 속한 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 도구 출력 제출이 필요한 실행의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
도구 결과 | array | 출력이 제출되는 도구 목록입니다. | 예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
실행에 status: "requires_action"
이 있고 required_action.type
이 submit_tool_outputs
인 경우 모두 완료되면 이 엔드포인트를 사용하여 도구 호출의 출력을 제출할 수 있습니다. 모든 출력은 단일 요청으로 제출되어야 합니다.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
{
"tool_outputs": [
{
"tool_call_id": "call_001",
"output": "70 degrees and sunny."
}
]
}
응답: 상태 코드: 200
{
"body": {
"id": "run_123",
"object": "thread.run",
"created_at": 1699075592,
"assistant_id": "asst_123",
"thread_id": "thread_123",
"status": "queued",
"started_at": 1699075592,
"expires_at": 1699076192,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given ___location",
"parameters": {
"type": "object",
"properties": {
"___location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": [
"celsius",
"fahrenheit"
]
}
},
"required": [
"___location"
]
}
}
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
취소 - 실행
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
in_progress
인 실행을 취소합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 이 실행이 속한 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 취소할 실행의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runObject |
예시
예시
in_progress
인 실행을 취소합니다.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076126,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "cancelling",
"started_at": 1699076126,
"expires_at": 1699076726,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You summarize books.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": [
"vs_123"
]
}
},
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"response_format": "auto"
}
}
나열 - 실행 단계
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
실행에 속하는 실행 단계 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행 및 실행 단계가 속한 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 실행 단계가 속한 실행의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
API 버전 | 문의 | 예 | 문자열 | |
include[] | 문의 | 아니오 | array | 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | listRunStepsResponse |
예시
예시
실행에 속하는 실행 단계 목록을 반환합니다.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
],
"first_id": "step_abc123",
"last_id": "step_abc456",
"has_more": false
}
}
가져오기 - 실행 단계
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
실행 단계를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
스레드 ID | 길 | 예 | 문자열 | 실행 및 실행 단계가 속한 스레드의 ID입니다. |
run_id | 길 | 예 | 문자열 | 실행 단계가 속한 실행의 ID입니다. |
단계_아이디 | 길 | 예 | 문자열 | 검색할 실행 단계의 ID입니다. |
include[] | 문의 | 아니오 | array | 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다. |
API 버전 | 문의 | 예 | 문자열 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | runStepObject |
예시
예시
실행 단계를 검색합니다.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
}
나열 - 벡터 저장소
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
벡터 저장소 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | listVectorStoresResponse |
예시
예시
벡터 저장소 목록을 반환합니다.
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
},
{
"id": "vs_abc456",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ v2",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
],
"first_id": "vs_abc123",
"last_id": "vs_abc456",
"has_more": false
}
}
만들기 - 벡터 저장소
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
벡터 저장소를 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. |
아니오 | |
expires_after | 벡터 저장 만료 후 | 벡터 저장소에 대한 만료 정책입니다. | 아니오 | |
파일_아이디 | array | 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
이름 | 문자열 | 벡터 저장소의 이름입니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreObject |
예시
예시
벡터 저장소를 만듭니다.
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
가져오기 - 벡터 저장소
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
벡터 저장소를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 검색할 벡터 저장소의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreObject |
예시
예시
벡터 저장소를 검색합니다.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776
}
}
수정 - 벡터 저장소
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
벡터 저장소를 수정합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 수정할 벡터 저장소의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
expires_after | 벡터 저장 만료 후 | 벡터 저장소에 대한 만료 정책입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
이름 | 문자열 | 벡터 저장소의 이름입니다. | 아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreObject |
예시
예시
벡터 저장소를 수정합니다.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
{
"name": "Support FAQ"
}
응답: 상태 코드: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
삭제 - 벡터 저장소
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
벡터 저장소를 삭제합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 삭제할 벡터 저장소의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | deleteVectorStoreResponse |
예시
예시
벡터 저장소를 삭제합니다.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store.deleted",
"deleted": true
}
}
나열 - 벡터 저장소 파일
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
벡터 저장소 파일 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일이 속한 벡터 저장소의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
필터 | 문의 | 아니오 | 문자열 가능한 값: in_progress , completed , failed cancelled |
파일 상태를 필터링합니다. in_progress , completed , failed , cancelled 중에 하나. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 벡터 저장소 파일 목록 응답 |
예시
예시
벡터 저장소 파일 목록을 반환합니다.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
만들기 - 벡터 저장소 파일
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
벡터 저장소에 파일을 연결하여 벡터 저장소 파일을 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일을 만들 벡터 저장소의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | 청킹 전략 요청 매개변수 | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. |
아니오 | |
file_id | 문자열 | 벡터 저장소에서 사용해야 하는 파일 ID입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileObject |
예시
예시
벡터 저장소에 파일을 연결하여 벡터 저장소 파일을 만듭니다.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
{
"file_id": "file-abc123"
}
응답: 상태 코드: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"usage_bytes": 1234,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
가져오기 - 벡터 저장소 파일
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
벡터 저장소 파일을 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일이 속한 벡터 저장소의 ID입니다. |
file_id | 길 | 예 | 문자열 | 검색할 파일의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileObject |
예시
예시
벡터 저장소 파일을 검색합니다.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
삭제 - 벡터 저장소 파일
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
벡터 저장소 파일을 삭제합니다. 이렇게 하면 벡터 저장소에서 파일이 제거되지만 파일 자체가 삭제되지는 않습니다. 파일을 삭제하려면 파일 삭제 엔드포인트를 사용합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일이 속한 벡터 저장소의 ID입니다. |
file_id | 길 | 예 | 문자열 | 삭제할 파일의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | deleteVectorStoreFileResponse |
예시
예시
벡터 저장소 파일을 삭제합니다. 이렇게 하면 벡터 저장소에서 파일이 제거되지만 파일 자체가 삭제되지는 않습니다. 파일을 삭제하려면 파일 삭제 엔드포인트를 사용합니다.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "file_abc123",
"object": "vector_store.file.deleted",
"deleted": true
}
}
Updatevectorstorefileattributes
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
벡터 저장소 파일의 특성을 업데이트합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일이 속한 벡터 저장소의 ID입니다. |
file_id | 길 | 예 | 문자열 | 특성을 업데이트할 파일의 ID입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
특성 | VectorStoreFileAttributes | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다. |
예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileObject |
벡터 저장소 파일 콘텐츠 검색
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview
벡터 저장소 파일의 구문 분석된 내용을 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 벡터 저장소의 ID입니다. |
file_id | 길 | 예 | 문자열 | 벡터 저장소 내의 파일 ID입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | VectorStoreFileContentResponse |
검색 벡터 저장소
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview
쿼리 및 파일 특성 필터를 기반으로 벡터 저장소에서 관련 청크를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 검색할 벡터 저장소의 ID입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filters | ComparisonFilter 또는 CompoundFilter | 파일 특성에 따라 적용할 필터입니다. | 아니오 | |
결과_최대수량 (max_num_results) | integer | 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다. | 아니오 | 10 |
문의 | 문자열 또는 배열 | 검색에 대한 쿼리 문자열 | 예 | |
랭킹 옵션 | 객체 | 검색에 대한 순위 옵션입니다. | 아니오 | |
└─ ranker | enum | 가능한 값: auto default-2024-11-15 |
아니오 | |
└점수 임계값 | 숫자 | 아니오 | 0 | |
쿼리 재작성 | boolean | 벡터 검색을 위해 자연어 쿼리를 다시 작성할지 여부입니다. | 아니오 | 거짓 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | VectorStoreSearchResultsPage |
만들기 - 벡터 저장소 파일 일괄 처리
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
벡터 저장소 파일 일괄 처리를 만듭니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일 일괄 처리를 만들 벡터 저장소의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | 청킹 전략 요청 매개변수 (chunkingStrategyRequestParam) | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. |
아니오 | |
파일_아이디 | array | 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
예 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileBatchObject |
예시
예시
벡터 저장소 파일 일괄 처리를 만듭니다.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
{
"file_ids": [
"file-abc123",
"file-abc456"
]
}
응답: 상태 코드: 200
{
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
가져오기 - 벡터 저장소 파일 일괄 처리
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
벡터 저장소 파일 일괄 처리를 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일 일괄 처리가 속한 벡터 저장소의 ID입니다. |
batch_id | 길 | 예 | 문자열 | 검색 중인 파일 일괄 처리의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileBatchObject |
예시
예시
벡터 저장소 파일 일괄 처리를 검색합니다.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
}
취소 - 벡터 저장소 파일 일괄 처리
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
벡터 저장소 파일 일괄 처리를 취소합니다. 이렇게 하면 가능한 빨리 이 일괄 처리의 파일 처리를 취소하려고 시도합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일 일괄 처리가 속한 벡터 저장소의 ID입니다. |
batch_id | 길 | 예 | 문자열 | 취소할 파일 일괄 처리의 ID입니다. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | vectorStoreFileBatchObject |
예시
예시
벡터 저장소 파일 일괄 처리를 취소합니다. 이렇게 하면 가능한 빨리 이 일괄 처리의 파일 처리를 취소하려고 시도합니다.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "cancelling",
"file_counts": {
"in_progress": 12,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 15
}
}
}
나열 - 벡터 저장소 파일 일괄 처리 파일
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
벡터 저장소 파일 목록을 일괄 처리로 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
벡터 저장소 ID | 길 | 예 | 문자열 | 파일이 속한 벡터 저장소의 ID입니다. |
batch_id | 길 | 예 | 문자열 | 파일이 속한 파일 일괄 처리의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우 |
after | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. after 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다. |
before | 문의 | 아니오 | 문자열 | 페이지 매김에 사용되는 커서입니다. before 는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다. |
필터 | 문의 | 아니오 | 문자열 가능한 값: in_progress , completed , failed cancelled |
파일 상태를 필터링합니다. in_progress , completed , failed , cancelled 중에 하나. |
API 버전 | 문의 | 예 | 문자열 | api 버전 |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 벡터 저장소 파일 목록 응답 |
예시
예시
벡터 저장소 파일 목록을 반환합니다.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
응답: 상태 코드: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
만들기 - 실시간 세션
POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview
실시간 API를 사용하여 클라이언트 쪽 애플리케이션에서 사용할 임시 API 토큰을 만듭니다. 클라이언트 이벤트와 동일한 세션 매개 변수를 사용하여 session.update
구성할 수 있습니다.
세션 개체 client_secret
와 실시간 API에 대한 브라우저 클라이언트를 인증하는 데 사용할 수 있는 사용 가능한 임시 API 토큰이 포함된 키로 응답합니다.
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력 오디오 형식 | enum | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.pcm16 의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
input_audio_noise_reduction | 객체 | 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다. 오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다. |
아니오 | |
└─ 형식 | enum | 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.가능한 값: near_field far_field |
아니오 | |
input_audio_transcription | 객체 | 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null 로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 전사 엔드포인트를 통해 비동기적으로 실행되며 모델이 들은 정확한 내용이라기보다 입력 오디오 콘텐츠의 지침으로 취급해야 합니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다. |
아니오 | |
└) 언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1(예: en 형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. |
아니오 | |
└─ model | 문자열 | 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe , gpt-4o-mini-transcribe 및 whisper-1 입니다. |
아니오 | |
└) 프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.whisper-1 은 프롬프트가 키워드 목록입니다.모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대"). |
아니오 | |
지침 | 문자열 | 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친숙한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다. 서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다. |
아니오 | |
최대 응답 출력 토큰 | 정수 또는 문자열 | 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf 입니다. |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
model | 문자열 | 이 세션에 사용되는 배포의 이름입니다. |
아니오 | |
출력_오디오_포맷 | enum | 출력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.출력 pcm16 오디오는 24kHz 속도로 샘플링됩니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
온도 | 숫자 | 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 오디오 모델의 경우 최상의 성능을 위해 0.8의 온도를 사용하는 것이 좋습니다. |
아니오 | 0.8 |
도구_선택 | 문자열 | 모델이 도구를 선택하는 방법입니다. 옵션은 auto , none , required 또는 함수를 지정하십시오. |
아니오 | auto |
도구들 | array | 모델에서 사용할 수 있는 도구(함수)입니다. | 아니오 | |
회전 감지 | 객체 | 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. 의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다. |
아니오 | |
└ 생성_응답 | boolean | VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. |
아니오 | 진실 |
└) 열망 | enum | semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.가능한 값: low , medium , high auto |
아니오 | |
└interrupt_response | 부울 | VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto )으로 진행 중인 응답을 자동으로 중단할지 여부입니다. |
아니오 | 진실 |
└prefix_padding_ms | integer | server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | enum | 턴 감지 유형입니다. 가능한 값: server_vad semantic_vad |
아니오 | |
목소리 | VoiceIdsShared | 아니오 |
응답
상태 코드: 200
설명: 세션이 성공적으로 생성되었습니다.
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | RealtimeSessionCreateResponse |
만들기 - Transcriptionrealtimesession
POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview
특히 실시간 전사를 위한 실시간 API를 사용하여 클라이언트 쪽 애플리케이션에서 사용할 임시 API 토큰을 만듭니다.
클라이언트 이벤트와 동일한 세션 매개 변수를 사용하여 transcription_session.update
구성할 수 있습니다.
세션 개체 client_secret
와 실시간 API에 대한 브라우저 클라이언트를 인증하는 데 사용할 수 있는 사용 가능한 임시 API 토큰이 포함된 키로 응답합니다.
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
include | 배열 | 전사에 포함할 항목 집합입니다. 현재 사용 가능한 항목은 다음과 같습니다. - item.input_audio_transcription.logprobs |
아니오 | |
입력 오디오 형식 | enum | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.pcm16 의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
input_audio_noise_reduction | 객체 | 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다. 오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다. |
아니오 | |
└─ 형식 | enum | 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.가능한 값: near_field far_field |
아니오 | |
input_audio_transcription | 객체 | 입력 오디오 전사에 대한 구성입니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다. |
아니오 | |
└) 언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1(예: en 형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. |
아니오 | |
└─ model | 열거형 | 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe , gpt-4o-mini-transcribe 및 whisper-1 입니다.가능한 값: gpt-4o-transcribe , gpt-4o-mini-transcribe whisper-1 |
아니오 | |
└) 프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.whisper-1 은 프롬프트가 키워드 목록입니다.모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대"). |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
회전 감지 | 객체 | 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. 의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다. |
아니오 | |
└ 생성_응답 | boolean | VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. 전사 세션에는 사용할 수 없습니다. |
아니오 | 진실 |
└) 열망 | enum | semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.가능한 값: low , medium , high auto |
아니오 | |
└interrupt_response | 부울 | VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto )으로 진행 중인 응답을 자동으로 중단할지 여부입니다. 전사 세션에는 사용할 수 없습니다. |
아니오 | 진실 |
└prefix_padding_ms | integer | server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | enum | 턴 감지 유형입니다. 가능한 값: server_vad semantic_vad |
아니오 |
응답
상태 코드: 200
설명: 세션이 성공적으로 생성되었습니다.
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | RealtimeTranscriptionSessionCreateResponse |
응답
POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview
모델 응답을 만듭니다.
요청 본문
Content-Type: application/json
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
include | array | 아니오 | ||
입력 | 문자열 또는 배열 | 모델 입력 | 예 | |
지침 | 문자열 | 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다. 함께 previous_response_id 사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다. |
아니오 | |
최대 출력 토큰 | integer | 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다. |
아니오 | |
병렬 도구 호출 | boolean | 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다. |
아니오 | 진실 |
이전_응답_아이디 | 문자열 | 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. 대화 상태에 대해 자세히 알아봅니다. |
아니오 | |
추리 | 이성적 사고 | o 시리즈 모델만 추론 모델에 대한 구성 옵션입니다. |
아니오 | |
store | boolean | API를 통해 나중에 검색할 수 있도록 생성된 모델 응답을 저장할지 여부입니다. |
아니오 | 진실 |
스트림 | boolean | true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다. 자세한 내용은 아래 스트리밍 섹션을 참조하세요. |
아니오 | 거짓 |
문자 메시지 | 객체 | 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요: - 텍스트 입력 및 출력 - 구조적 출력 |
아니오 | |
└─ 형식 | TextResponseFormatConfiguration | 모델이 출력해야 하는 형식을 지정하는 개체입니다. 구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다.기본 형식은 { "type": "text" } 추가 옵션이 없습니다.gpt-4o 및 최신 모델에는 권장되지 않습니다. { "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다. |
아니오 | |
도구_선택 | ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction | 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다. |
아니오 | |
도구들 | array | 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다. - 기본 제공 도구: OpenAI에서 제공하며 기능을 확장하는 도구로, 모델의 기능 |
아니오 | |
truncation | 열거형 | 모델 응답에 사용할 잘림 전략입니다. - auto : 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다. - disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.가능한 값: auto disabled |
아니오 |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 응답 | |
텍스트/이벤트-스트림 | 응답스트림이벤트 |
상태 코드: 기본값
설명: 서비스를 사용할 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | errorResponse |
응답 API - 입력 항목
GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
지정된 ID를 사용하여 모델 응답을 검색합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
응답_아이디 | 길 | 예 | 문자열 | 검색할 응답의 ID입니다. |
include | 문의 | 아니오 | array | 응답에 포함할 추가 필드입니다. include 자세한 내용은 위의 응답 생성 매개 변수를 참조하세요. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 응답 |
상태 코드: 기본값
설명: 서비스를 사용할 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | errorResponse |
응답 삭제
DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
지정된 ID를 사용하여 모델 응답을 삭제합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
응답_아이디 | 길 | 예 | 문자열 | 삭제할 응답의 ID입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
상태 코드: 404
설명: 찾을 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | 오류 |
상태 코드: 기본값
설명: 서비스를 사용할 수 없음
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | errorResponse |
응답 API - 응답 항목 목록
GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview
지정된 응답에 대한 입력 항목 목록을 반환합니다.
URI 매개 변수
이름 | 그런 다음 | 필수 | 유형 | 설명 |
---|---|---|---|---|
끝점 | 길 | 예 | 문자열 url | 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com ). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com |
응답_아이디 | 길 | 예 | 문자열 | 입력 항목을 검색할 응답의 ID입니다. |
한계 | 문의 | 아니오 | integer | 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다. |
주문 | 문의 | 아니오 | 문자열 가능한 값: asc desc |
입력 항목을 반환하는 순서입니다. 기본값은 asc 입니다.- asc : 입력 항목을 오름차순으로 반환합니다.- desc : 입력 항목을 내림차순으로 반환합니다. |
after | 문의 | 아니오 | 문자열 | 페이징에서 특정 항목 이후의 항목들을 나열하기 위해 사용되는 항목 ID입니다. |
before | 문의 | 아니오 | 문자열 | 페이지네이션에 사용되는 앞에 나열할 항목들의 아이템 ID입니다. |
요청 헤더
토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.
이름 | 필수 | 유형 | 설명 |
---|---|---|---|
승인 | 진실 | 문자열 | 예제Authorization: Bearer {Azure_OpenAI_Auth_Token} :Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com 형식: oauth2 권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize 범위: https://cognitiveservices.azure.com/.default |
API 키 | 진실 | 문자열 | 여기에서 Azure OpenAI API 키를 제공합니다. |
응답
상태 코드: 200
설명: 정상
콘텐츠-타입 | 유형 | 설명 |
---|---|---|
application/json | responseItemList |
구성 요소
errorResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
오류 | 오류 | 아니오 |
오류베이스
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | 문자열 | 아니오 | ||
메시지 | 문자열 | 아니오 |
오류
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내부_오류 | innerError | 추가 세부 정보가 포함된 내부 오류입니다. | 아니오 | |
param | 문자열 | 아니오 | ||
유형 | 문자열 | 아니오 |
내부 오류
추가 세부 정보가 포함된 내부 오류입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | innerErrorCode | 내부 오류 개체에 대한 오류 코드입니다. | 아니오 | |
콘텐츠 필터 결과 | contentFilterPromptResults | 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. | 아니오 |
내부 오류 코드
내부 오류 개체에 대한 오류 코드입니다.
재산 | 가치 |
---|---|
설명 | 내부 오류 개체에 대한 오류 코드입니다. |
유형 | 문자열 |
값 | ResponsibleAIPolicyViolation |
dalleErrorResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
오류 | dalleError | 아니오 |
dalleError
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내부_오류 | dalleInnerError | 추가 세부 정보가 포함된 내부 오류입니다. | 아니오 | |
param | 문자열 | 아니오 | ||
유형 | 문자열 | 아니오 |
dalleInnerError
추가 세부 정보가 포함된 내부 오류입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | innerErrorCode | 내부 오류 개체에 대한 오류 코드입니다. | 아니오 | |
콘텐츠 필터 결과 | dalleFilterResults | 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. | 아니오 | |
수정된_프롬프트 | 문자열 | 프롬프트에 수정 버전이 있는 경우 이미지를 생성하는 데 사용된 프롬프트입니다. | 아니오 |
contentFilterCompletionTextSpan
생성된 완성 텍스트 내의 범위를 설명합니다. 오프셋 0은 완성 텍스트의 첫 번째 UTF32 코드 포인트입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
completion_end_offset | integer | 범위에서 제외되는 첫 번째 UTF32 코드 포인트의 오프셋입니다. 이 필드는 빈 범위에 대해 항상 completion_start_offset과 같습니다. 이 필드는 비어있지 않은 범위에 대해 항상 completion_start_offset보다 큽니다. | 예 | |
completion_start_offset | integer | 범위를 시작하는 UTF32 코드 포인트의 오프셋입니다. | 예 |
contentFilterResultBase
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filtered | boolean | 예 |
contentFilterSeverityResult
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filtered | boolean | 예 | ||
심각성 | 문자열 | 아니오 |
콘텐츠 필터 감지 결과
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
탐지됨 | boolean | 아니오 | ||
filtered | boolean | 예 |
콘텐츠 필터가 인용 결과와 함께 감지됨
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
인용 | 객체 | 아니오 | ||
└─ URL | 문자열 | 아니오 | ||
└) 라이선스 | 문자열 | 아니오 |
contentFilterDetectedWithCompletionTextSpansResult
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
세부 정보 | array | 아니오 |
contentFilterIdResult
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filtered | boolean | 예 | ||
아이디 | 문자열 | 아니오 |
contentFilterResultsBase
콘텐츠 필터링 결과에 대한 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
사용자 지정 차단 목록 | 콘텐츠 필터 상세 결과 | 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. | 아니오 | |
오류 | errorBase | 아니오 | ||
hate | 내용필터심각도결과 | 아니오 | ||
모독 | 컨텐츠 필터 감지 결과 | 아니오 | ||
자해 | 내용필터심각도결과 | 아니오 | ||
성적인 | 내용필터심각도결과 | 아니오 | ||
폭력 | 내용필터심각도결과 | 아니오 |
contentFilterPromptResults
콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
사용자 정의 차단 목록 | 콘텐츠 필터 상세 결과 | 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. | 아니오 | |
오류 | errorBase | 아니오 | ||
hate | 내용필터심각도결과 | 아니오 | ||
간접 공격 | 컨텐츠 필터 감지 결과 | 아니오 | ||
탈옥 | 컨텐츠 필터 감지 결과 | 아니오 | ||
모독 | 컨텐츠 필터 감지 결과 | 아니오 | ||
자해 | 내용필터심각도결과 | 아니오 | ||
성적인 | 내용필터심각도결과 | 아니오 | ||
폭력 | 내용필터심각도결과 | 아니오 |
콘텐츠 필터 선택 결과
콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 타사 텍스트 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
사용자 지정 차단 목록 | 콘텐츠 필터 상세 결과 | 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. | 아니오 | |
오류 | errorBase | 아니오 | ||
hate | 내용필터심각도결과 | 아니오 | ||
모독 | 컨텐츠 필터 감지 결과 | 아니오 | ||
보호된_자료_코드 | 콘텐츠 필터가 인용 결과로 감지됨 | 아니오 | ||
보호된_자료_텍스트 | 컨텐츠 필터 감지 결과 | 아니오 | ||
자해 | 내용필터심각도결과 | 아니오 | ||
성적인 | 내용필터심각도결과 | 아니오 | ||
ungrounded_material | contentFilterDetectedWithCompletionTextSpansResult | 아니오 | ||
폭력 | 내용필터심각도결과 | 아니오 |
콘텐츠 필터 상세 결과
필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
세부 정보 | array | 아니오 | ||
filtered | boolean | 예 |
promptFilterResult
요청의 단일 프롬프트에 대한 콘텐츠 필터링 결과입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠 필터 결과 | contentFilterPromptResults | 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. | 아니오 | |
프롬프트_인덱스 | integer | 아니오 |
promptFilterResults
요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
달레 콘텐츠 필터 결과
콘텐츠 필터링 결과에 대한 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
hate | 내용필터심각도결과 | 아니오 | ||
자해 | 내용필터심각도결과 | 아니오 | ||
성적인 | 내용필터심각도결과 | 아니오 | ||
폭력 | 내용필터심각도결과 | 아니오 |
dalleFilterResults
콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
사용자 지정 차단 목록 | 콘텐츠 필터 상세 결과 | 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. | 아니오 | |
hate | 내용필터심각도결과 | 아니오 | ||
탈옥 | 컨텐츠 필터 감지 결과 | 아니오 | ||
모독 | 컨텐츠 필터 감지 결과 | 아니오 | ||
자해 | 내용필터심각도결과 | 아니오 | ||
성적인 | 내용필터심각도결과 | 아니오 | ||
폭력 | 내용필터심각도결과 | 아니오 |
chatCompletionsRequestCommon
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
frequency_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. | 아니오 | 0 |
logit_bias | 객체 | 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 json 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. | 아니오 | |
최대_완료_토큰 | integer | 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. | 아니오 | |
최대 토큰 수 | integer | 생성된 답변에 허용되는 최대 토큰 수입니다. 기본적으로 모델이 반환할 수 있는 토큰 수는 (4096 - 프롬프트 토큰)입니다. o1 시리즈 모델과 호환되지 않습니다. | 아니오 | 4096 |
메타데이터 | 객체 | 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. | 아니오 | |
presence_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. | 아니오 | 0 |
멈춰! | 문자열 또는 배열 | API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. | 아니오 | |
store | boolean | 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. | 아니오 | |
스트림 | boolean | 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. |
아니오 | 거짓 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | Azure OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. | 아니오 |
완료요청생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
best_of | integer | 서버 쪽에서 best_of 완료를 생성하고 "최상"(토큰당 로그 확률이 가장 높은 것)을 반환합니다. 결과를 스트리밍할 수 없습니다.사용할 n best_of 경우 후보 완료 횟수를 제어하고 n 반환할 수를 지정합니다. best_of 는 n 보다 커야 합니다.참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokens 및 stop 에 대한 설정이 적절한지 확인합니다. |
아니오 | 1 |
echo | boolean | 완성을 제공하는 것 외에 프롬프트를 다시 표시합니다. |
아니오 | 거짓 |
frequency_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. |
아니오 | 0 |
logit_bias | 객체 | 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(GPT 토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. 예를 들어, {"50256": -100} 을 전달하면 <|endoftext|> 토큰이 생성되지 않습니다. |
아니오 | 없음 |
logprobs | integer | 가장 가능성이 높은 logprobs 출력 토큰과 선택한 토큰에 대한 로그 확률을 포함합니다. 예를 들어, logprobs 가 5이면 API는 가장 가능성 있는 5개의 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 logprob 를 반환하므로 응답에 최대 logprobs+1 개의 요소가 있을 수 있습니다.logprobs 의 최댓값은 5입니다. |
아니오 | 없음 |
최대 토큰 수 | integer | 완료 시 최대 토큰 수를 생성할 수 있습니다. 프롬프트의 토큰 수에 max_tokens 를 더한 값은 모델의 컨텍스트 길이를 초과할 수 없습니다. |
아니오 | 16 |
n | integer | 각 프롬프트에 대해 생성할 완성 수입니다. 참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokens 및 stop 에 대한 설정이 적절한지 확인합니다. |
아니오 | 1 |
presence_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. |
아니오 | 0 |
프롬프트 | 문자열 또는 배열 | 문자열, 문자열 배열, 토큰 배열 또는 토큰 배열의 배열로 인코딩된 완성을 생성하라는 프롬프트입니다. <|endoftext|>는 학습 중에 모델이 보는 문서 구분 기호이므로 프롬프트가 지정되지 않은 경우 모델은 새 문서의 시작 부분에서 생성되는 것처럼 생성됩니다. |
예 | |
씨앗 | integer | 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다. |
아니오 | |
멈춰! | 문자열 또는 배열 | API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다. |
아니오 | |
스트림 | boolean | 부분 진행률을 다시 스트리밍할지 여부를 나타냅니다. 설정된 경우 토큰은 데이터 전용 서버 전송 이벤트로 전송되며 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제 |
아니오 | 거짓 |
suffix | 문자열 | 삽입된 텍스트 완성 뒤에 오는 접미사입니다. 이 매개 변수는 gpt-3.5-turbo-instruct 에만 지원됩니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. |
아니오 |
완성 응답 생성
API의 완성 응답을 나타냅니다. 참고: 스트리밍된 응답 개체와 비스트림 응답 개체는 채팅 엔드포인트와 달리 동일한 셰이프를 공유합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
선택 | array | 입력 프롬프트에 대해 생성된 모델의 완료 선택 목록입니다. | 예 | |
created | integer | 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | 완성의 고유 식별자입니다. | 예 | |
model | 문자열 | 완성에 사용되는 모델입니다. | 예 | |
객체 | enum | 항상 “text_completion”인 개체 형식입니다. 가능한 값: text_completion |
예 | |
prompt_filter_results | promptFilterResults | 요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다. | 아니오 | |
system_fingerprint | 문자열 | 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다. 결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다. |
아니오 | |
사용량 | completionUsage | 완성 요청의 사용 통계입니다. | 아니오 |
채팅 완료 요청 생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
audio | 객체 | 오디오 출력에 대한 매개 변수입니다. 을 modalities: ["audio"] 사용하여 오디오 출력을 요청할 때 필요합니다. |
아니오 | |
└─ 형식 | enum | 출력 오디오 형식을 지정합니다. wav , mp3 , flac , opus , 또는 pcm16 중 하나여야 합니다. 가능한 값: wav , mp3 , flac , opus pcm16 |
아니오 | |
└─ 음성 | enum | 음성 유형을 지정합니다. 지원되는 음성은 alloy ,echo , fable , onyx nova 및 shimmer .가능한 값: alloy , echo , fable onyx , nova shimmer |
아니오 | |
데이터_소스 | array | 이를 사용하는 Azure OpenAI 채팅 확장에 대한 구성 항목입니다. 이 추가 사양은 Azure OpenAI와만 호환됩니다. |
아니오 | |
frequency_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. |
아니오 | 0 |
함수 호출 | 문자열 또는 chatCompletionFunctionCallOption | tool_choice 에는 더 이상 사용되지 않습니다.모델에서 호출되는 함수(해당하는 경우)를 제어합니다. none 은 모델이 함수를 호출하지 않고 대신 메시지를 생성함을 의미합니다.auto 는 모델이 메시지 생성 또는 함수 호출 중에서 선택할 수 있음을 의미합니다.{"name": "my_function"} 을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.함수가 없을 경우 none 이 기본값입니다. 함수가 있는 경우 auto 가 기본값입니다. |
아니오 | |
기능 | array | tools 에는 더 이상 사용되지 않습니다.모델이 JSON 입력을 생성할 수 있는 함수 목록입니다. |
아니오 | |
logit_bias | 객체 | 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. |
아니오 | 없음 |
logprobs | boolean | 출력 토큰의 로그 확률을 반환할지 여부를 나타냅니다. true인 경우 content 의 message 에 반환된 각 출력 토큰의 로그 확률을 반환합니다. |
아니오 | 거짓 |
최대_완료_토큰 | integer | 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. | 아니오 | |
최대 토큰 수 | integer | 채팅 완성 시 생성할 수 있는 최대 토큰 수입니다. 입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 따라 제한됩니다. |
아니오 | |
메시지 | array | 지금까지의 대화를 구성하는 메시지 목록입니다. Python 코드 예제 | 예 | |
메타데이터 | 객체 | 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. | 아니오 | |
형식 | ChatCompletionModalities | 이 요청에 대해 모델이 생성할 출력 형식입니다. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다. ["text"] gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.["text", "audio"] |
아니오 | |
n | integer | 각 입력 메시지에 대해 생성할 채팅 완성 선택 항목 수입니다. 모든 선택 항목에 걸쳐 생성된 토큰 수에 따라 요금이 부과됩니다. 비용을 최소화하려면 n 을 1 로 유지합니다. |
아니오 | 1 |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
prediction | PredictionContent | 예측 출력에 대한 구성으로, 모델 응답의 많은 부분이 미리 알려진 경우 응답 시간을 크게 향상시킬 수 있습니다. 대부분의 콘텐츠가 약간만 변경된 파일을 다시 생성할 때 가장 일반적입니다. | 아니오 | |
presence_penalty | 숫자 | -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. |
아니오 | 0 |
추론 노력 | enum | o1 모델만 추론 모델에서 추론 작업을 제한합니다. 현재 지원되는 값은 low , medium 및 high 입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.가능한 값: low , medium high |
아니오 | |
응답_형식 | ResponseFormatText, ResponseFormatJsonObject 또는 ResponseFormatJsonSchema | 모델이 출력해야 하는 형식을 지정하는 개체입니다. GPT-4o, GPT-4o mini, GPT-4 Turbo 및 보다 최신인 모든 gpt-3.5-turbo-1106 Turbo 모델과 호환됩니다.{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조적 출력을 사용하도록 설정합니다.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
씨앗 | integer | 이 기능은 베타 버전으로 제공됩니다. 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다. |
아니오 | |
멈춰! | 문자열 또는 배열 | API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. |
아니오 | |
store | boolean | 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. | 아니오 | |
스트림 | boolean | 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제 |
아니오 | 거짓 |
스트림 옵션 | 채팅완료스트림옵션 | 스트리밍 응답에 대한 옵션입니다. stream: true 를 설정할 때만 설정합니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
도구_선택 | chatCompletionToolChoiceOption | 모델이 호출하는 도구(있는 경우)를 제어합니다. none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다. auto 는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required 는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}} 을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none 은 도구가 없는 경우 기본값입니다. auto 는 도구가 있는 경우 기본값입니다. |
아니오 | |
도구들 | array | 모델이 호출할 수 있는 도구 목록입니다. 현재 함수만 도구로 지원됩니다. 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하려면 이를 사용합니다. 최대 128개의 함수가 지원됩니다. |
아니오 | |
top_logprobs | integer | 각 토큰 위치에서 반환될 가능성이 가장 높은 토큰 수를 지정하는 0에서 20 사이의 정수로, 각 토큰에는 관련 로그 가능성이 있습니다. 이 매개 변수를 사용하는 경우 logprobs 를 true 로 설정해야 합니다. |
아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. |
아니오 | |
사용자 보안 컨텍스트 | userSecurityContext | 사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다. | 아니오 |
사용자보안컨텍스트
사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
애플리케이션 이름 | 문자열 | 애플리케이션의 이름입니다. 중요한 개인 정보는 이 필드에 포함하지 않아야 합니다. | 아니오 | |
end_user_id | 문자열 | 이 식별자는 생성형 AI 애플리케이션 내에서 최종 사용자를 인증하는 데 사용되는 Microsoft Entra ID(이전의 Azure Active Directory) 사용자 개체 ID입니다. 중요한 개인 정보는 이 필드에 포함하지 않아야 합니다. | 아니오 | |
최종 사용자 테넌트 ID | 문자열 | 최종 사용자가 속한 Microsoft 365 테넌트 ID입니다. 생성형 AI 애플리케이션이 다중 테넌트인 경우 필요합니다. | 아니오 | |
출처 아이피 | 문자열 | IPv4 및 IPv6 형식을 모두 수락하여 원래 클라이언트의 IP 주소를 캡처합니다. | 아니오 |
채팅완료기능
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. | 아니오 | |
이름 | 문자열 | 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. | 예 | |
매개 변수 | FunctionParameters | 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요. parameters 를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다. |
아니오 |
chatCompletionFunctionCallOption
{"name": "my_function"}
을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이름 | 문자열 | 호출할 함수의 이름입니다. | 예 |
채팅 완성 기능 매개변수 (chatCompletionFunctionParameters)
함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드/를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.
이 구성 요소에 대해 정의된 속성이 없습니다.
채팅 완료 요청 메시지
이 구성 요소는 다음 중 하나일 수 있습니다.
- ChatCompletionRequestDeveloperMessage
- chatCompletionRequestSystemMessage
- chatCompletionRequestUserMessage
- 채팅완료요청도우미메시지
- 채팅 완료 요청 도구 메시지
- chatCompletionRequestFunctionMessage (채팅 완료 요청 함수 메시지)
대화완성요청개발자메시지
사용자가 보낸 메시지에 관계없이 모델이 따라야 하는 개발자 제공 지침입니다.
o1 모델 이상에서는 developer
메시지가 이전 system
메시지를 대체합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 개발자 메시지의 콘텐츠입니다. | 예 | |
이름 | 문자열 | 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. | 아니오 | |
역할 | enum | 메시지 작성자의 역할(이 경우 developer )입니다.가능한 값: developer |
예 |
채팅 완료 요청 시스템 메시지
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 시스템 메시지의 콘텐츠입니다. | 예 | |
이름 | 문자열 | 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. | 아니오 | |
역할 | enum | 메시지 작성자의 역할(이 경우 system )입니다.가능한 값: system |
예 |
채팅완료요청사용자메시지
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 사용자 메시지의 콘텐츠입니다. |
예 | |
이름 | 문자열 | 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. | 아니오 | |
역할 | enum | 메시지 작성자의 역할(이 경우 user )입니다.가능한 값: user |
예 |
chatCompletionRequestAssistantMessage
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 보조 메시지의 콘텐츠입니다. tool_calls 또는 function_call 이 지정되지 않은 경우 필수입니다. |
아니오 | |
함수 호출 | 객체 | 더 이상 사용되지 않으며 tool_calls 로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. |
아니오 | |
└─ 인수 | 문자열 | JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. | 아니오 | |
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
이름 | 문자열 | 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. | 아니오 | |
거절 | 문자열 | 도우미가 보낸 거절 메시지입니다. | 아니오 | |
역할 | enum | 메시지 작성자의 역할(이 경우 assistant )입니다.가능한 값: assistant |
예 | |
도구 호출 | chatCompletionMessageToolCalls | 함수 호출과 같이 모델에서 생성된 도구 호출입니다. | 아니오 |
chatCompletionRequestToolMessage
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 도구 메시지의 콘텐츠입니다. | 예 | |
역할 | enum | 메시지 작성자의 역할(이 경우 tool )입니다.가능한 값: tool |
예 | |
도구_호출_아이디 | 문자열 | 이 메시지가 응답하는 도구 호출입니다. | 예 |
채팅완성요청기능메시지
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 | 함수 메시지의 콘텐츠입니다. | 예 | |
이름 | 문자열 | 호출할 함수의 이름입니다. | 예 | |
역할 | enum | 메시지 작성자의 역할(이 경우 function )입니다.가능한 값: function |
예 |
채팅 완료 요청 개발자 메시지 콘텐츠 부분
이 구성 요소는 다음 중 하나일 수 있습니다.
채팅 완성 요청 시스템 메시지 콘텐츠 부분
이 구성 요소는 다음 중 하나일 수 있습니다.
채팅완료요청사용자메시지내용부분
이 구성 요소는 다음 중 하나일 수 있습니다.
채팅 완료 요청 어시스턴트 메시지 콘텐츠 부분
이 구성 요소는 다음 중 하나일 수 있습니다.
chatCompletionRequestToolMessageContentPart
이 구성 요소는 다음 중 하나일 수 있습니다.
chatCompletionRequestMessageContentPartText
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 문자열 | 텍스트 콘텐츠입니다. | 예 | |
유형 | enum | 콘텐츠 부분의 형식입니다. 가능한 값: text |
예 |
chatCompletionRequestMessageContentPartAudio
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
오디오 입력 | 객체 | 예 | ||
└) 데이터 | 문자열 | Base64로 인코딩된 오디오 데이터입니다. | 아니오 | |
└─ 형식 | enum | 인코딩된 오디오 데이터의 형식입니다. 현재 "wav" 및 "mp3"를 지원합니다. 가능한 값: wav mp3 |
아니오 | |
유형 | enum | 콘텐츠 부분의 형식입니다. 항상 input_audio 입니다.가능한 값: input_audio |
예 |
chatCompletionRequestMessageContentPartImage
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
image_url | 객체 | 예 | ||
└) 세부 정보 | enum | 이미지의 세부 수준을 지정합니다. 자세한 내용은 비전 가이드에서 확인합니다. 가능한 값: auto , low high |
아니오 | |
└─ url | 문자열 | 이미지의 URL 또는 base64로 인코딩된 이미지 데이터입니다. | 아니오 | |
유형 | enum | 콘텐츠 부분의 형식입니다. 가능한 값: image_url |
예 |
chatCompletionRequestMessageContentPartRefusal
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
거절 | 문자열 | 모델이 생성한 거부 메시지입니다. | 예 | |
유형 | enum | 콘텐츠 부분의 형식입니다. 가능한 값: refusal |
예 |
Azure 채팅 확장 구성
단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.
###azureChatExtensionConfiguration의 판별자
이 구성 요소는 속성을 type
사용하여 서로 다른 형식을 구분합니다.
형식 값 | 스키마 |
---|---|
azure_search |
azureSearchChatExtensionConfiguration |
azure_cosmos_db |
azureCosmosDBChatExtensionConfiguration |
elasticsearch |
elasticsearchChatExtensionConfiguration |
mongo_db |
mongoDBChatExtensionConfiguration |
pinecone |
pineconeChatExtensionConfiguration |
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
azureChatExtensionType
단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.
재산 | 가치 |
---|---|
설명 | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
유형 | 문자열 |
값 | azure_search azure_cosmos_db elasticsearch mongo_db pinecone |
azureSearchChatExtensionConfiguration
Azure OpenAI 채팅 확장으로 사용할 때 Azure Search에 대한 구성 가능한 옵션의 특정 표현입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
매개 변수 | Azure 검색 채팅 확장 매개변수 | Azure OpenAI 채팅 확장으로 사용되는 경우 Azure Search에 대한 매개 변수입니다. | 아니오 | |
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
Azure 검색 채팅 확장 매개변수
Azure OpenAI 채팅 확장으로 사용되는 경우 Azure Search에 대한 매개 변수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
부분 결과 허용 | boolean | true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. | 아니오 | 거짓 |
인증 | onYourDataApiKeyAuthenticationOptions or onYourDataSystemAssignedManagedIdentityAuthenticationOptions, onYourDataUserAssignedManagedIdentityAuthenticationOptions 또는 onYourDataAccessTokenAuthenticationOptions | 예 | ||
embedding_dependency | onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource 또는 onYourDataIntegratedVectorizationSource | 아니오 | ||
끝점 | 문자열 | 사용할 Azure Search 리소스의 절대 엔드포인트 경로입니다. | 예 | |
fields_mapping | Azure 검색 인덱스 필드 매핑 옵션 | 구성된 Azure Search 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. | 아니오 | |
필터 | 문자열 | 검색 필터입니다. | 아니오 | |
in_scope | boolean | 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. | 아니오 | |
include_contexts | array | 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citations 및 intent 입니다. |
아니오 | |
인덱스_이름 | 문자열 | 참조된 Azure Search 리소스에서 사용할 수 있는 인덱스의 이름입니다. | 예 | |
최대 검색 쿼리 수 | integer | 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. | 아니오 | |
쿼리_유형 | azureSearchQueryType | Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다. | 아니오 | |
의미적 구성 | 문자열 | 쿼리에 대한 추가 의미 체계 구성입니다. | 아니오 | |
엄격성 | integer | 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. | 아니오 | |
top_n_documents | integer | 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. | 아니오 |
Azure 검색 인덱스 필드 매핑 옵션
구성된 Azure Search 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
content_fields | array | 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. | 아니오 | |
콘텐츠_필드_구분자 | 문자열 | 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. | 아니오 | |
filepath_field | 문자열 | 파일 경로로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
이미지_벡터_필드 | array | 이미지 벡터 데이터를 나타내는 필드의 이름입니다. | 아니오 | |
제목_필드 | 문자열 | 제목으로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
url_field | 문자열 | URL로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
벡터 필드 | array | 벡터 데이터를 나타내는 필드의 이름입니다. | 아니오 |
Azure 검색 쿼리 유형
Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다.
재산 | 가치 |
---|---|
설명 | Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다. |
유형 | 문자열 |
값 | simple semantic vector vector_simple_hybrid vector_semantic_hybrid |
Azure Cosmos DB 채팅 확장 구성
Azure OpenAI 채팅 확장으로 사용할 때 Azure Cosmos DB에 대한 구성 가능한 옵션의 특정 표현입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
매개 변수 | azureCosmosDBChatExtensionParameters | Azure Cosmos DB for MongoDB vCore를 사용할 때 데이터 채팅 확장에서 Azure OpenAI를 구성할 때 사용할 매개 변수입니다. | 아니오 | |
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
애저코스모스DB챗익스텐션파라미터
Azure Cosmos DB for MongoDB vCore를 사용할 때 데이터 채팅 확장에서 Azure OpenAI를 구성할 때 사용할 매개 변수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
부분 결과 허용 | boolean | true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. | 아니오 | 거짓 |
인증 | onYourDataConnectionStringAuthenticationOptions | 연결 문자열을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다. | 예 | |
컨테이너_이름 | 문자열 | Azure Cosmos DB 리소스 컨테이너의 이름입니다. | 예 | |
데이터베이스_이름 | 문자열 | Azure Cosmos DB와 함께 사용할 MongoDB vCore 데이터베이스 이름입니다. | 예 | |
embedding_dependency | onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource | 예 | ||
fields_mapping | azureCosmosDBFieldMappingOptions | 구성된 Azure Cosmos DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. | 예 | |
in_scope | boolean | 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. | 아니오 | |
include_contexts | array | 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citations 및 intent 입니다. |
아니오 | |
인덱스_이름 | 문자열 | Azure Cosmos DB와 함께 사용할 MongoDB vCore 인덱스 이름입니다. | 예 | |
최대 검색 쿼리 수 | integer | 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. | 아니오 | |
엄격성 | integer | 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. | 아니오 | |
top_n_documents | integer | 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. | 아니오 |
azureCosmosDB필드매핑옵션
구성된 Azure Cosmos DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
content_fields | array | 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. | 예 | |
콘텐츠_필드_구분자 | 문자열 | 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. | 아니오 | |
filepath_field | 문자열 | 파일 경로로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
제목_필드 | 문자열 | 제목으로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
url_field | 문자열 | URL로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
벡터 필드 | array | 벡터 데이터를 나타내는 필드의 이름입니다. | 예 |
엘라스틱서치채팅확장구성(ElasticsearchChatExtensionConfiguration)
Azure OpenAI 채팅 확장으로 사용할 때 Elasticsearch에 대한 구성 가능한 옵션의 특정 표현입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
매개 변수 | elasticsearchChatExtensionParameters | Elasticsearch®를 Azure OpenAI 채팅 확장으로 구성할 때 사용할 매개 변수입니다. | 아니오 | |
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
엘라스틱서치채팅확장매개변수
Elasticsearch®를 Azure OpenAI 채팅 확장으로 구성할 때 사용할 매개 변수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
부분 결과 허용 | boolean | true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. | 아니오 | 거짓 |
인증 | onYourDataKeyAndKeyIdAuthenticationOptions 또는 onYourDataEncodedApiKeyAuthenticationOptions | 예 | ||
embedding_dependency | onYourDataEndpointVectorizationSource, onYourDataDeploymentNameVectorizationSource 또는 onYourDataModelIdVectorizationSource | 아니오 | ||
끝점 | 문자열 | Elasticsearch®의 엔드포인트입니다. | 예 | |
fields_mapping | elasticsearchIndexFieldMappingOptions | 구성된 Elasticsearch® 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. | 아니오 | |
in_scope | boolean | 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. | 아니오 | |
include_contexts | array | 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citations 및 intent 입니다. |
아니오 | |
인덱스_이름 | 문자열 | Elasticsearch®의 인덱스 이름입니다. | 예 | |
최대 검색 쿼리 수 | integer | 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. | 아니오 | |
쿼리_유형 | elasticsearchQueryType | Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다. | 아니오 | |
엄격성 | integer | 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. | 아니오 | |
top_n_documents | integer | 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. | 아니오 |
엘라스틱서치 인덱스 필드 매핑 옵션
구성된 Elasticsearch® 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
content_fields | array | 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. | 아니오 | |
콘텐츠_필드_구분자 | 문자열 | 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. | 아니오 | |
filepath_field | 문자열 | 파일 경로로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
제목_필드 | 문자열 | 제목으로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
url_field | 문자열 | URL로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
벡터 필드 | array | 벡터 데이터를 나타내는 필드의 이름입니다. | 아니오 |
엘라스틱서치쿼리유형
Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다.
재산 | 가치 |
---|---|
설명 | Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다. |
유형 | 문자열 |
값 | simple vector |
몽고DB채팅확장설정
Azure OpenAI 채팅 확장 기능으로 Mongo DB를 사용할 때 구성 가능한 옵션에 대한 구체적인 표현입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
매개 변수 | mongoDBChatExtensionParameters | Mongo DB를 사용하여 Azure OpenAI On Your Data 채팅 확장을 구성할 때 사용할 매개 변수입니다. | 아니오 | |
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
mongoDB채팅확장매개변수
Mongo DB를 사용하여 Azure OpenAI On Your Data 채팅 확장을 구성할 때 사용할 매개 변수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
부분 결과 허용 | boolean | true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. | 아니오 | 거짓 |
앱_이름 | 문자열 | Mongo DB 애플리케이션의 이름입니다. | 예 | |
인증 | onYourDataUsernameAndPasswordAuthenticationOptions | 사용자 이름과 암호를 사용할 때 Azure OpenAI On Your Data에 대한 인증 옵션입니다. | 예 | |
컬렉션 이름 | 문자열 | Mongo DB 컬렉션의 이름입니다. | 예 | |
데이터베이스_이름 | 문자열 | MongoDB 데이터베이스의 이름입니다. | 예 | |
embedding_dependency | onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource | 예 | ||
끝점 | 문자열 | Mongo DB 클러스터 엔드포인트의 이름입니다. | 예 | |
fields_mapping | mongoDBFieldMappingOptions | 구성된 Mongo DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하기 위한 선택적 설정입니다. | 예 | |
in_scope | boolean | 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. | 아니오 | |
include_contexts | array | 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citations 및 intent 입니다. |
아니오 | |
인덱스_이름 | 문자열 | MongoDB 인덱스의 이름입니다. | 예 | |
최대 검색 쿼리 수 | integer | 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. | 아니오 | |
엄격성 | integer | 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. | 아니오 | |
top_n_documents | integer | 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. | 아니오 |
mongoDB필드매핑옵션
구성된 Mongo DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하기 위한 선택적 설정입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
content_fields | array | 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. | 예 | |
콘텐츠_필드_구분자 | 문자열 | 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. | 아니오 | |
filepath_field | 문자열 | 파일 경로로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
제목_필드 | 문자열 | 제목으로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
url_field | 문자열 | URL로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
벡터 필드 | array | 벡터 데이터를 나타내는 필드의 이름입니다. | 예 |
pineconeChatExtensionConfiguration
Azure OpenAI 채팅 확장으로 사용할 때 Pinecone에 대한 구성 가능한 옵션의 특정 표현입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
매개 변수 | pineconeChatExtensionParameters | Azure OpenAI Pinecone 채팅 확장을 구성하기 위한 매개 변수입니다. | 아니오 | |
유형 | azureChatExtensionType | 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다. |
예 |
pineconeChatExtensionParameters
Azure OpenAI Pinecone 채팅 확장을 구성하기 위한 매개 변수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
부분 결과 허용 | boolean | true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. | 아니오 | 거짓 |
인증 | onYourDataApiKeyAuthenticationOptions | API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다. | 예 | |
embedding_dependency | onYourDataDeploymentNameVectorizationSource | 벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 동일한 Azure OpenAI 리소스의 내부 포함 모델 배포 이름을 기준으로 하는 벡터화 원본의 세부 정보입니다. | 예 | |
환경 | 문자열 | Pinecone의 환경 이름입니다. | 예 | |
fields_mapping | 파인콘 필드 매핑 옵션 | 구성된 Pinecone 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. | 예 | |
in_scope | boolean | 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. | 아니오 | |
include_contexts | array | 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citations 및 intent 입니다. |
아니오 | |
인덱스_이름 | 문자열 | Pinecone 데이터베이스 인덱스의 이름입니다. | 예 | |
최대 검색 쿼리 수 | integer | 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. | 아니오 | |
엄격성 | integer | 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. | 아니오 | |
top_n_documents | integer | 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. | 아니오 |
pineconeFieldMappingOptions
구성된 Pinecone 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
content_fields | array | 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. | 예 | |
콘텐츠_필드_구분자 | 문자열 | 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. | 아니오 | |
filepath_field | 문자열 | 파일 경로로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
제목_필드 | 문자열 | 제목으로 사용할 인덱스 필드의 이름입니다. | 아니오 | |
url_field | 문자열 | URL로 사용할 인덱스 필드의 이름입니다. | 아니오 |
onYourDataAuthenticationOptions
Azure OpenAI On Your Data에 대한 인증 옵션입니다.
onYourDataAuthenticationOptions에 대한 판별자
이 구성 요소는 속성을 type
사용하여 서로 다른 형식을 구분합니다.
형식 값 | 스키마 |
---|---|
api_key |
onYourDataApiKeyAuthenticationOptions |
connection_string |
onYourDataConnectionStringAuthenticationOptions |
key_and_key_id |
귀하의 데이터 키 및 키 ID 인증 옵션에서 |
encoded_api_key |
onYourDataEncodedApiKeyAuthenticationOptions |
access_token |
onYourDataAccessTokenAuthenticationOptions |
system_assigned_managed_identity |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions |
user_assigned_managed_identity |
onYourDataUserAssignedManagedIdentityAuthenticationOptions |
username_and_password |
onYourDataUsernameAndPasswordAuthenticationOptions |
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataContextProperty
컨텍스트 속성입니다.
재산 | 가치 |
---|---|
설명 | 컨텍스트 속성입니다. |
유형 | 문자열 |
값 | citations intent all_retrieved_documents |
onYourDataAuthenticationType
Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.
재산 | 가치 |
---|---|
설명 | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. |
유형 | 문자열 |
값 | api_key connection_string key_and_key_id encoded_api_key access_token system_assigned_managed_identity user_assigned_managed_identity username_and_password |
onYourDataApiKeyAuthenticationOptions
API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
열쇠 | 문자열 | 인증에 사용할 API 키입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataConnectionStringAuthenticationOptions
연결 문자열을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
연결 문자열 | 문자열 | 인증에 사용할 연결 문자열입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataKeyAndKeyIdAuthenticationOptions
Elasticsearch 키 및 키 ID 쌍을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
열쇠 | 문자열 | 인증에 사용할 Elasticsearch 키입니다. | 아니오 | |
키_아이디 | 문자열 | 인증에 사용할 Elasticsearch 키 ID입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataEncodedApiKeyAuthenticationOptions
Elasticsearch 인코딩된 API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
인코딩된_API_키 | 문자열 | 인증에 사용할 Elasticsearch로 인코딩된 API 키입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataAccessTokenAuthenticationOptions
액세스 토큰을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
액세스 토큰 (access_token) | 문자열 | 인증에 사용할 액세스 토큰입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions
시스템 할당 관리 ID를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataUserAssignedManagedIdentityAuthenticationOptions
사용자 할당 관리 ID를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
managed_identity_resource_id | 문자열 | 인증에 사용할 사용자 할당 관리 ID의 리소스 ID입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 |
onYourDataUsernameAndPasswordAuthenticationOptions
사용자 이름과 암호를 사용할 때 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
암호 | 문자열 | 암호입니다. 암호입니다. | 아니오 | |
유형 | onYourDataAuthenticationType | Azure OpenAI On Your Data에서 지원되는 인증 유형입니다. | 예 | |
사용자 이름 | 문자열 | 인증에 사용할 사용자 이름입니다. | 아니오 |
onYourDataVectorizationSource
벡터 검색을 사용하여 Azure OpenAI On Your Data에 대한 벡터화 원본의 추상 표현입니다.
이 구성 요소는 속성을 type
사용하여 서로 다른 형식을 구분합니다.
형식 값 | 스키마 |
---|---|
endpoint |
onYourDataEndpointVectorizationSource |
deployment_name |
onYourDataDeploymentNameVectorizationSource |
integrated |
onYourDataIntegratedVectorizationSource |
model_id |
onYourDataModelIdVectorizationSource |
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. | 예 |
onYourDataVectorizationSourceType
Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.
재산 | 가치 |
---|---|
설명 | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. |
유형 | 문자열 |
값 | endpoint deployment_name integrated model_id |
onYourDataEndpointVectorizationSource
벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 포함에 대한 공용 Azure OpenAI 엔드포인트 호출을 기준으로 하는 벡터화 원본의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
인증 | onYourDataApiKeyAuthenticationOptions 또는 onYourDataAccessTokenAuthenticationOptions | 아니오 | ||
dimensions | integer | 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. |
아니오 | |
끝점 | 문자열 | 포함을 검색할 리소스 엔드포인트 URL을 지정합니다. https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings 형식이어야 합니다. api-version 쿼리 매개 변수는 허용되지 않습니다. |
아니오 | |
유형 | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. | 예 |
onYourDataDeploymentNameVectorizationSource
벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 동일한 Azure OpenAI 리소스의 내부 포함 모델 배포 이름을 기준으로 하는 벡터화 원본의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
배포_이름 (deployment_name) | 문자열 | 벡터화에 사용할 모델 배포의 이름을 지정합니다. 이 모델 배포는 동일한 Azure OpenAI 리소스에 있어야 하지만 On Your Data는 퍼블릭 호출이 아닌 내부 호출을 통해 이 모델 배포를 사용하므로 프라이빗 네트워크에서도 벡터를 검색할 수 있습니다. | 아니오 | |
dimensions | integer | 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. |
아니오 | |
유형 | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. | 예 |
onYourDataIntegratedVectorizationSource
검색 리소스 내에 정의된 통합 벡터라이저를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. | 예 |
귀하의 데이터 모델 ID 벡터화 소스에 따라
벡터 검색을 적용하는 경우 Azure OpenAI On Your Data에서 사용하며 검색 서비스 모델 ID를 기준으로 하는 벡터화 원본의 세부 정보입니다. 현재 Elasticsearch®에서만 지원됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
모델_아이디 | 문자열 | 벡터화에 사용할 모델 ID를 지정합니다. 이 모델 ID는 검색 서비스에서 정의해야 합니다. | 아니오 | |
유형 | onYourDataVectorizationSourceType | Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다. | 예 |
Azure 채팅 확장 메시지 컨텍스트
Azure OpenAI 채팅 확장 프로그램이 해당 채팅 완성 응답 생성에 관련될 때 사용할 수 있는 추가 컨텍스트 정보의 표현입니다. 이 컨텍스트 정보는 일치하는 확장을 사용하도록 구성된 Azure OpenAI 요청을 사용하는 경우에만 채워집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
모든_검색된_문서들 | array | 검색된 모든 문서입니다. | 아니오 | |
인용 | array | 응답에서 도우미 메시지를 생성하는 데 사용되는 데이터 원본 검색 결과입니다. | 아니오 | |
intent | 문자열 | 채팅 기록에서 검색된 의도로, 컨텍스트를 진행하기 위해 다음 발화 턴으로 넘어가는 데 사용됩니다. | 아니오 |
인용
채팅 완성 응답 메시지에 대한 인용 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunk_id | 문자열 | 인용의 청크 ID입니다. | 아니오 | |
내용 | 문자열 | 인용의 콘텐츠입니다. | 예 | |
파일 경로 | 문자열 | 인용의 파일 경로입니다. | 아니오 | |
rerank_score | 숫자 | 검색된 문서의 순위 다시 매김 점수입니다. | 아니오 | |
제목 | 문자열 | 인용의 제목입니다. | 아니오 | |
url | 문자열 | 인용의 URL입니다. | 아니오 |
검색된 문서
검색된 문서입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunk_id | 문자열 | 인용의 청크 ID입니다. | 아니오 | |
내용 | 문자열 | 인용의 콘텐츠입니다. | 예 | |
데이터_소스_인덱스 | integer | 데이터 원본의 인덱스입니다. | 아니오 | |
파일 경로 | 문자열 | 인용의 파일 경로입니다. | 아니오 | |
필터 이유 | filterReason | 검색된 문서의 필터링 이유입니다. | 아니오 | |
원본_검색_점수 | 숫자 | 검색된 문서의 원래 검색 점수입니다. | 아니오 | |
rerank_score | 숫자 | 검색된 문서의 순위 다시 매김 점수입니다. | 아니오 | |
검색 쿼리 | array | 문서를 검색하는 데 사용되는 검색 쿼리입니다. | 아니오 | |
제목 | 문자열 | 인용의 제목입니다. | 아니오 | |
url | 문자열 | 인용의 URL입니다. | 아니오 |
필터 이유
검색된 문서의 필터링 이유입니다.
재산 | 가치 |
---|---|
설명 | 검색된 문서의 필터링 이유입니다. |
유형 | 문자열 |
값 | score rerank |
chatCompletionMessageToolCall
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 모델이 호출한 함수입니다. | 예 | |
└─ 인수 | 문자열 | JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. | 아니오 | |
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
아이디 | 문자열 | 도구 호출의 ID입니다. | 예 | |
유형 | 도구호출유형 | 도구 호출의 형식(이 경우 function )입니다. |
예 |
툴 호출 유형
도구 호출의 형식(이 경우 function
)입니다.
재산 | 가치 |
---|---|
설명 | 도구 호출의 형식(이 경우 function )입니다. |
유형 | 문자열 |
값 | function |
채팅완료요청메시지도구
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 | 메시지의 콘텐츠입니다. | 아니오 | |
도구_호출_아이디 | 문자열 | 이 메시지가 응답하는 도구 호출입니다. | 아니오 |
채팅완료요청메시지함수
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 | 메시지의 콘텐츠입니다. | 아니오 | |
이름 | 문자열 | 메시지의 콘텐츠입니다. | 아니오 | |
역할 | enum | 메시지 작성자의 역할(이 경우 function )입니다.가능한 값: function |
아니오 |
createChatCompletionResponse
제공된 입력을 기준으로 모델이 반환한 채팅 완성 응답을 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
선택 | array | 채팅 완성 선택 항목 목록입니다. n 이 1보다 큰 경우 2개 이상이 될 수 있습니다. |
예 | |
created | integer | 채팅 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | 채팅 완성의 고유 식별자입니다. | 예 | |
model | 문자열 | 채팅 완성에 사용되는 모델입니다. | 예 | |
객체 | enum | 항상 chat.completion 인 개체 형식입니다.가능한 값: chat.completion |
예 | |
prompt_filter_results | promptFilterResults | 요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다. | 아니오 | |
system_fingerprint | 문자열 | 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다. 결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다. |
아니오 | |
사용량 | completionUsage | 완성 요청의 사용 통계입니다. | 아니오 |
createChatCompletionStreamResponse
제공된 입력을 기준으로 모델이 반환한 채팅 완성 응답의 스트리밍된 청크를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
선택 | array | 채팅 완성 선택 항목 목록입니다. n 이 1보다 큰 경우 두 개 이상의 요소를 포함할 수 있습니다. |
예 | |
created | integer | 채팅 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다. 각 청크에는 동일한 타임스탬프가 있습니다. | 예 | |
아이디 | 문자열 | 채팅 완성의 고유 식별자입니다. 각 청크는 동일한 ID를 갖습니다. | 예 | |
model | 문자열 | 완성을 생성할 모델입니다. | 예 | |
객체 | enum | 항상 chat.completion.chunk 인 개체 형식입니다.가능한 값: chat.completion.chunk |
예 | |
system_fingerprint | 문자열 | 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다. 결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다. |
아니오 |
chatCompletionStreamResponseDelta
스트리밍된 모델 응답을 통해 생성된 채팅 완성 델타입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 | 청크 메시지의 콘텐츠입니다. | 아니오 | |
함수 호출 | 객체 | 더 이상 사용되지 않으며 tool_calls 로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. |
아니오 | |
└─ 인수 | 문자열 | JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. | 아니오 | |
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
거절 | 문자열 | 모델이 생성한 거부 메시지입니다. | 아니오 | |
역할 | enum | 이 메시지 작성자의 역할입니다. 가능한 값: system , user , assistant tool |
아니오 | |
도구 호출 | array | 아니오 |
chatCompletionMessageToolCallChunk
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 아니오 | ||
└─ 인수 | 문자열 | JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. | 아니오 | |
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
아이디 | 문자열 | 도구 호출의 ID입니다. | 아니오 | |
인덱스 | integer | 예 | ||
유형 | enum | 도구의 종류입니다. 현재는 function 만 지원됩니다.가능한 값: function |
아니오 |
chatCompletionStreamOptions
스트리밍 응답에 대한 옵션입니다. stream: true
를 설정할 때만 설정합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
include_usage | boolean | 설정된 경우 data: [DONE] 메시지 전에 추가 청크가 스트리밍됩니다. 이 청크의 usage 필드는 전체 요청에 대한 토큰 사용 통계를 표시하며 choices 필드는 항상 빈 배열입니다. 다른 모든 청크에도 usage 필드가 포함되지만 null 값이 포함됩니다. |
아니오 |
chatCompletionChoiceLogProbs
선택 항목에 대한 로그 확률 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | array | 로그 확률 정보가 포함된 메시지 콘텐츠 토큰 목록입니다. | 예 | |
거절 | array | 로그 가능성 정보가 포함된 메시지 거부 토큰 목록입니다. | 아니오 |
chatCompletionTokenLogprob
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
바이트 | array | 토큰의 UTF-8 바이트 표현을 나타내는 정수 목록입니다. 문자가 여러 토큰으로 표현되고 해당 바이트 표현이 결합되어 올바른 텍스트 표현을 생성해야 하는 경우에 유용합니다. 토큰에 대한 바이트 표현이 없는 경우 null 일 수 있습니다. |
예 | |
logprob | 숫자 | 이 토큰의 로그 확률입니다. | 예 | |
토큰 | 문자열 | 토큰입니다. | 예 | |
top_logprobs | array | 이 토큰 위치에서 가장 가능성이 높은 토큰 및 해당 로그 확률의 목록입니다. 드문 경우지만 반환된 요청 top_logprobs 의 수보다 적을 수 있습니다. |
예 |
채팅 완료 응답 메시지
모델에서 생성된 채팅 완성 메시지입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
audio | 객체 | 오디오 출력 형식이 요청되면 이 개체는 모델의 오디오 응답에 대한 데이터를 포함합니다. | 아니오 | |
└) 데이터 | 문자열 | 모델에 의해 생성된 Base64로 인코딩된 오디오 바이트(요청에 지정된 형식)입니다. |
아니오 | |
└─ 만료_시간 | integer | 다중 턴 대화에 사용하기 위해 서버에서 이 오디오 응답에 더 이상 액세스할 수 없는 경우의 Unix 타임스탬프(초)입니다. |
아니오 | |
└─ id | 문자열 | 이 오디오 응답의 고유 식별자입니다. | 아니오 | |
└) 대본 | 문자열 | 모델에서 생성한 오디오의 음성 텍스트입니다. | 아니오 | |
내용 | 문자열 | 메시지의 콘텐츠입니다. | 예 | |
문맥 | azureChatExtensionsMessageContext | Azure OpenAI 채팅 확장 프로그램이 해당 채팅 완성 응답 생성에 관련될 때 사용할 수 있는 추가 컨텍스트 정보의 표현입니다. 이 컨텍스트 정보는 일치하는 확장을 사용하도록 구성된 Azure OpenAI 요청을 사용하는 경우에만 채워집니다. | 아니오 | |
함수 호출 | 채팅완료기능호출 | 더 이상 사용되지 않으며 tool_calls 로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. |
아니오 | |
거절 | 문자열 | 모델이 생성한 거부 메시지입니다. | 예 | |
역할 | 채팅 완성 응답 메시지 역할 | 응답 메시지 작성자의 역할입니다. | 예 | |
도구 호출 | array | 함수 호출과 같이 모델에서 생성된 도구 호출입니다. | 아니오 |
chatCompletionResponseMessageRole
응답 메시지 작성자의 역할입니다.
재산 | 가치 |
---|---|
설명 | 응답 메시지 작성자의 역할입니다. |
유형 | 문자열 |
값 | assistant |
chatCompletionToolChoiceOption
모델이 호출하는 도구(있는 경우)를 제어합니다. none
는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다. auto
는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required
는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}}
을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none
은 도구가 없는 경우 기본값입니다. auto
는 도구가 있는 경우 기본값입니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
chatCompletionNamedToolChoice
모델에서 사용해야 하는 도구를 지정합니다. 강제로 모델이 특정 함수를 호출하도록 하는 데 사용합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 예 | ||
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
유형 | enum | 도구의 종류입니다. 현재는 function 만 지원됩니다.가능한 값: function |
예 |
ParallelToolCalls
도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
예측 내용
다시 생성되는 텍스트 파일의 콘텐츠와 같은 정적 예측 출력 콘텐츠입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 배열 | 모델 응답을 생성할 때 일치해야 하는 콘텐츠입니다. 생성된 토큰이 이 콘텐츠와 일치하면 전체 모델 응답을 훨씬 더 빠르게 반환할 수 있습니다. | 예 | |
유형 | enum | 제공하려는 예측 콘텐츠의 형식입니다. 이 형식은 현재 항상 content 입니다.가능한 값: content |
예 |
chatCompletionMessageToolCalls
함수 호출과 같이 모델에서 생성된 도구 호출입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
채팅완성방식
이 요청에 대해 모델이 생성할 출력 형식입니다. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.
["text"]
gpt-4o-audio-preview
모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.
["text", "audio"]
이 구성 요소에 대해 정의된 속성이 없습니다.
chatCompletionFunctionCall
더 이상 사용되지 않으며 tool_calls
로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
논쟁들 | 문자열 | JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. | 예 | |
이름 | 문자열 | 호출할 함수의 이름입니다. | 예 |
completionUsage
완성 요청의 사용 통계입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
완료 토큰 | integer | 생성된 완성의 토큰 수입니다. | 예 | |
completion_tokens_details | 객체 | 완성에 사용되는 토큰 분석입니다. | 아니오 | |
└─ 수락된 예측 토큰 | integer | 예측 출력을 사용하는 경우 완성에 나타난 예측의 토큰 수입니다. | 아니오 | |
└─ audio_tokens | integer | 모델에서 생성된 오디오 입력 토큰입니다. | 아니오 | |
└─ 추론_토큰 | integer | 추론을 위해 모델에서 생성한 토큰입니다. | 아니오 | |
└─ 거부된_예측_토큰 | integer | 예측 출력을 사용하는 경우 완성에 나타나지 않은 예측의 토큰 수입니다. 그러나 추론 토큰과 마찬가지로 이러한 토큰은 청구, 출력 및 컨텍스트 창 제한을 위해 총 완성 토큰에서 계속 계산됩니다. | 아니오 | |
프롬프트 토큰 | integer | 프롬프트에 있는 토큰 수입니다. | 예 | |
프롬프트_토큰_세부 사항 | 객체 | 프롬프트 토큰의 세부 정보입니다. | 아니오 | |
└─ audio_tokens | integer | 프롬프트에 있는 오디오 입력 토큰입니다. | 아니오 | |
└─ 캐시된_토큰 (cached_tokens) | integer | 캐시된 프롬프트 토큰의 수입니다. | 아니오 | |
총_토큰 | integer | 요청에 사용된 총 토큰 수입니다(프롬프트 + 완성). | 예 |
chatCompletionTool
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | FunctionObject | 예 | ||
유형 | enum | 도구의 종류입니다. 현재는 function 만 지원됩니다.가능한 값: function |
예 |
함수 매개변수
함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.
parameters
를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
FunctionObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. | 아니오 | |
이름 | 문자열 | 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. | 예 | |
매개 변수 | FunctionParameters | 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요. parameters 를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다. |
아니오 | |
엄격한 | boolean | 함수 호출을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다. true로 설정하면 모델은 parameters 필드에 정의된 정확한 스키마를 따릅니다. strict 가 true 인 경우 JSON 스키마의 하위 집합만 지원됩니다. |
아니오 | 거짓 |
응답형식텍스트
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 정의되는 응답 형식의 형식: text 가능한 값: text |
예 |
ResponseFormatJsonObject (응답 형식 JSON 객체)
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 정의되는 응답 형식의 형식: json_object 가능한 값: json_object |
예 |
ResponseFormatJsonSchemaSchema
JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
응답 형식 JSON 스키마
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
json_schema | 객체 | 예 | ||
└) 설명 | 문자열 | 응답 형식의 용도에 대한 설명이며, 모델에서 형식으로 응답하는 방법을 결정하는 데 사용됩니다. | 아니오 | |
└) 이름 | 문자열 | 응답 형식의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. | 아니오 | |
└─ 스키마 | 응답형식JsonSchemaSchema | JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다. | 아니오 | |
└─ 엄격한 | boolean | 출력을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다. true로 설정하면 모델은 항상 schema 필드에 정의된 정확한 스키마를 따릅니다. strict 가 true 인 경우 JSON 스키마의 하위 집합만 지원됩니다. |
아니오 | 거짓 |
유형 | enum | 정의되는 응답 형식의 형식: json_schema 가능한 값: json_schema |
예 |
chatCompletionChoiceCommon
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
완료_이유 | 문자열 | 아니오 | ||
인덱스 | integer | 아니오 |
번역요청생성
번역 요청입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 | 문자열 | 번역할 오디오 파일입니다. | 예 | |
프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다. | 아니오 | |
응답_형식 | audioResponseFormat | 출력의 형식을 정의합니다. | 아니오 | |
온도 | 숫자 | 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. | 아니오 | 0 |
audioResponse
response_format이 json일 때 번역 또는 전사 응답입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 문자열 | 번역되거나 전사된 텍스트입니다. | 예 |
audioVerboseResponse
response_format이 verbose_json일 때 번역 또는 전사 응답입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기간 | 숫자 | 기간. | 아니오 | |
언어 | 문자열 | 언어. | 아니오 | |
세그먼트 | array | 아니오 | ||
task | 문자열 | 오디오 작업의 형식입니다. | 아니오 | |
문자 메시지 | 문자열 | 번역되거나 전사된 텍스트입니다. | 예 | |
단어 | array | 아니오 |
오디오응답형식
출력의 형식을 정의합니다.
재산 | 가치 |
---|---|
설명 | 출력의 형식을 정의합니다. |
유형 | 문자열 |
값 | json text srt verbose_json vtt |
createTranscriptionRequest
전사 요청입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 | 문자열 | 전사할 오디오 파일 개체입니다. | 예 | |
언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1 형식으로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. | 아니오 | |
프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다. | 아니오 | |
응답_형식 | audioResponseFormat | 출력의 형식을 정의합니다. | 아니오 | |
온도 | 숫자 | 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. | 아니오 | 0 |
timestamp_granularities[] | array | 이 전사를 위해 채울 타임스탬프 세분성입니다. 타임스탬프 세분성을 사용하려면 response_format 을 verbose_json 으로 설정해야 합니다. word 또는 segment 옵션 중 하나 또는 둘 다 지원됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다. |
아니오 | ['segment'] |
audioSegment
전사 또는 번역 세그먼트입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
avg_logprob | 숫자 | 평균 로그 확률입니다. | 아니오 | |
압축비 | 숫자 | 압축 비율입니다. | 아니오 | |
끝 | 숫자 | 세그먼트 끝 오프셋입니다. | 아니오 | |
아이디 | integer | 세그먼트 식별자입니다. | 아니오 | |
no_speech_prob | 숫자 | '음성 없음'의 확률입니다. | 아니오 | |
seek | 숫자 | 세그먼트의 오프셋입니다. | 아니오 | |
시작하다 | 숫자 | 세그먼트 시작 오프셋입니다. | 아니오 | |
온도 | 숫자 | 온도. | 아니오 | |
문자 메시지 | 문자열 | 세그먼트 텍스트입니다. | 아니오 | |
토큰 | array | 텍스트의 토큰입니다. | 아니오 |
audioWord
전사 또는 번역 단어입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
끝 | 숫자 | 단어 끝 오프셋입니다. | 아니오 | |
시작하다 | 숫자 | 단어 시작 오프셋입니다. | 아니오 | |
단어 | 문자열 | Word | 아니오 |
음성요청생성 (createSpeechRequest)
음성 요청입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력 | 문자열 | 오디오를 합성할 텍스트입니다. 최대 길이는 4096자입니다. | 예 | |
응답_형식 | enum | 오디오를 합성할 형식입니다. 가능한 값: mp3 , opus , aac flac , wav pcm |
아니오 | |
속도 | 숫자 | 합성된 오디오의 속도입니다. 0.25 ~4.0 의 값을 선택합니다. 1.0 기본값입니다. |
아니오 | 1.0 |
목소리 | enum | 음성 합성에 사용할 음성입니다. 가능한 값: alloy , echo , fable onyx , nova shimmer |
예 |
이미지 품질
생성될 이미지의 품질입니다.
재산 | 가치 |
---|---|
설명 | 생성될 이미지의 품질입니다. |
유형 | 문자열 |
기본값 | auto |
값 | auto high medium low hd standard |
이미지응답형식
생성된 이미지가 반환되는 형식입니다.
재산 | 가치 |
---|---|
설명 | 생성된 이미지가 반환되는 형식입니다. |
유형 | 문자열 |
기본값 | url |
값 | url b64_json |
이미지 출력 형식
생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다.
재산 | 가치 |
---|---|
설명 | 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다. |
유형 | 문자열 |
기본값 | png |
값 | png jpeg |
이미지 크기
생성된 이미지의 크기입니다.
재산 | 가치 |
---|---|
설명 | 생성된 이미지의 크기입니다. |
유형 | 문자열 |
기본값 | auto |
값 | auto 1792x1024 1024x1792 1024x1024 1024x1536 1536x1024 |
imageStyle
생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다.
재산 | 가치 |
---|---|
설명 | 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다. |
유형 | 문자열 |
기본값 | vivid |
값 | vivid natural |
이미지 배경
생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다.
재산 | 가치 |
---|---|
설명 | 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다. |
유형 | 문자열 |
기본값 | auto |
값 | transparent opaque auto |
이미지 생성 요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
background | imageBackground | 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다. | 아니오 | auto |
n | integer | 생성할 이미지 수입니다. dall-e-3의 경우 n=1만 지원됩니다. | 아니오 | 1 |
출력 압축 | integer | 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 jpeg 출력 형식의 gpt-image-1에 대해서만 지원됩니다. | 아니오 | 100 |
출력 형식 | imagesOutputFormat | 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다. | 아니오 | png |
프롬프트 | 문자열 | 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 gpt-image-1의 경우 32000자, dall-e-3의 경우 4,000자입니다. | 예 | |
질 | imageQuality | 생성될 이미지의 품질입니다. | 아니오 | auto |
응답_형식 | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | 아니오 | url |
크기 | imageSize | 생성된 이미지의 크기입니다. | 아니오 | auto |
style | imageStyle | 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다. | 아니오 | vivid |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. | 아니오 |
이미지 편집 요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 | 문자열 또는 배열 | 편집할 이미지입니다. 지원되는 이미지 파일 또는 이미지 배열이어야 합니다. 각 이미지는 png 또는 jpg 파일이 25MB 미만이어야 합니다. | 예 | |
마스크 | 문자열 | 완전히 투명한 영역(예: 알파가 0인 경우)이 있는 추가 이미지는 이미지를 편집해야 하는 위치를 나타냅니다. 여러 이미지가 제공되면 마스크가 첫 번째 이미지에 적용됩니다. 유효한 PNG 파일(4MB 미만)이어야 하며 이미지와 크기가 같아야 합니다. | 아니오 | |
n | integer | 생성할 이미지 수입니다. | 아니오 | 1 |
프롬프트 | 문자열 | 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 32000자입니다. | 예 | |
질 | imageQuality | 생성될 이미지의 품질입니다. | 아니오 | auto |
응답_형식 | imagesResponseFormat | 생성된 이미지가 반환되는 형식입니다. | 아니오 | url |
크기 | imageSize | 생성된 이미지의 크기입니다. | 아니오 | auto |
사용자 | 문자열 | 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. | 아니오 |
generateImagesResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created | integer | 작업을 만들 때의 unix 타임스탬프입니다. | 예 | |
데이터 | array | 성공한 경우 작업의 결과 데이터입니다. | 예 | |
사용량 | imageGenerationsUsage | 이미지 생성 요청에 대한 토큰 사용 세부 정보를 나타냅니다. gpt-image-1에만 해당합니다. | 아니오 |
이미지 결과
성공하면 이미지 URL 또는 인코딩된 이미지이고, 그렇지 않으면 오류가 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
b64_json | 문자열 | base64로 인코딩된 이미지 | 아니오 | |
콘텐츠 필터 결과 | dalle 콘텐츠 필터 결과 | 콘텐츠 필터링 결과에 대한 정보입니다. | 아니오 | |
prompt_filter_results | dalleFilterResults | 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. | 아니오 | |
수정된_프롬프트 | 문자열 | 프롬프트에 수정 버전이 있는 경우 이미지를 생성하는 데 사용된 프롬프트입니다. | 아니오 | |
url | 문자열 | 이미지 URL입니다. | 아니오 |
이미지 생성 사용량
이미지 생성 요청에 대한 토큰 사용 세부 정보를 나타냅니다. gpt-image-1에만 해당합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력_토큰 | integer | 입력 토큰의 수입니다. | 아니오 | |
input_tokens_details | 객체 | 입력 토큰에 대한 자세한 분석입니다. | 아니오 | |
└─ image_tokens | integer | 이미지 토큰의 수입니다. | 아니오 | |
└─ text_tokens | integer | 텍스트 토큰의 수입니다. | 아니오 | |
출력_토큰 | integer | 출력 토큰의 수입니다. | 아니오 | |
총_토큰 | integer | 사용된 총 토큰 수입니다. | 아니오 |
line
단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
spans | array | 검색된 개체와 해당 경계 상자 정보를 나타내는 범위의 배열입니다. | 예 | |
문자 메시지 | 문자열 | 예 |
span
검색된 개체와 해당 경계 상자 정보를 나타내는 범위 개체입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
length | integer | 유니코드 코드 포인트로 측정되는 문자의 범위 길이입니다. | 예 | |
상쇄 | integer | 범위가 시작되는 텍스트 내의 문자 오프셋입니다. 이 오프셋은 범위의 첫 번째 문자 위치로 정의되며, 텍스트 시작부터 유니코드 코드포인트로 계산합니다. | 예 | |
polygon | array | 검색된 개체를 묶는 다각형의 점을 나타내는 개체의 배열입니다. | 예 | |
문자 메시지 | 문자열 | 검색된 개체를 나타내는 범위의 텍스트 콘텐츠입니다. | 예 |
runCompletionUsage
실행과 관련된 사용 통계입니다. 실행이 종료 상태가 아닌 경우(예: null
, in_progress
등) 이 값은 queued
이 됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
완료 토큰 | integer | 실행 과정에서 사용된 완성 토큰 수입니다. | 예 | |
프롬프트 토큰 | integer | 실행 과정에서 사용된 프롬프트 토큰 수입니다. | 예 | |
총_토큰 | integer | 사용된 총 토큰 수입니다(프롬프트 + 완성). | 예 |
runStepCompletionUsage
실행 단계와 관련된 사용 통계입니다. 이 값은 실행 단계의 상태가 null
인 동안 in_progress
이 됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
완료 토큰 | integer | 실행 단계 과정에서 사용된 완성 토큰 수입니다. | 예 | |
프롬프트 토큰 | integer | 실행 단계 과정에서 사용된 프롬프트 토큰 수입니다. | 예 | |
총_토큰 | integer | 사용된 총 토큰 수입니다(프롬프트 + 완성). | 예 |
assistantsApiResponseFormatOption
모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106
이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.
구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} }
모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.
{ "type": "json_object" }
로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.
중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"
를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens
인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
assistantsApiResponseFormat
모델의 예상 출력을 설명하는 개체입니다. json_object
인 경우 function
형식 tools
만 실행에 전달할 수 있습니다. text
인 경우 모델은 텍스트 또는 필요한 값을 반환할 수 있습니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | 문자열 | text 또는 json_object 중 하나여야 합니다. |
아니오 | 문자 메시지 |
type 열거형: AssistantsApiResponseFormat
가치 | 설명 |
---|---|
문자 메시지 | |
json 객체 |
assistantObject
모델을 호출하고 도구를 사용할 수 있는 assistant
를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created_at | integer | 도우미가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
설명 | 문자열 | 도우미에 대한 설명입니다. 최대 길이는 512자입니다. |
예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
지침 | 문자열 | 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다. |
예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
model | 문자열 | 사용할 모델의 ID입니다. | 예 | |
이름 | 문자열 | 도우미의 이름입니다. 최대 길이는 256자입니다. |
예 | |
객체 | 문자열 | 항상 assistant 인 개체 형식입니다. |
예 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter , file_search 또는 function 형식일 수 있습니다. |
예 | [] |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
object 열거형: AssistantObjectType
가치 | 설명 |
---|---|
assistant | 개체 형식으로, 항상 assistant입니다. |
비서요청생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 도우미에 대한 설명입니다. 최대 길이는 512자입니다. |
아니오 | |
지침 | 문자열 | 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 예 | ||
이름 | 문자열 | 도우미의 이름입니다. 최대 길이는 256자입니다. |
아니오 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
└─ 벡터_스토어 | array | file_ids를 사용하여 벡터 저장소를 만들고 이 도우미에 연결하기 위한 도우미입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter , retrieval 또는 function 형식일 수 있습니다. |
아니오 | [] |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
조수 요청 수정
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 도우미에 대한 설명입니다. 최대 길이는 512자입니다. |
아니오 | |
지침 | 문자열 | 도우미가 사용하는 시스템 지침입니다. 최대 길이는 32768자입니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 아니오 | ||
이름 | 문자열 | 도우미의 이름입니다. 최대 길이는 256자입니다. |
아니오 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록을 재정의합니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소를 재정의합니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter , retrieval 또는 function 형식일 수 있습니다. |
아니오 | [] |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
보조 응답 삭제
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
삭제됨 | boolean | 예 | ||
아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
object 열거형: DeleteAssistantResponseState
가치 | 설명 |
---|---|
도우미가 삭제됨 |
listAssistantsResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
보조자 도구 코드
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | 문자열 | 정의되는 도구의 형식: code_interpreter |
예 |
type 열거형: assistantToolsCodeType
가치 | 설명 |
---|---|
코드 인터프리터 |
assistantToolsFileSearch
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 검색 | 객체 | 파일 검색 도구에 대한 재정의입니다. | 아니오 | |
└─ max_num_results | integer | 파일 검색 도구에서 출력해야 하는 최대 결과 수입니다. 기본값은 gpt-4* 모델의 경우 20이고 gpt-3.5-turbo의 경우 5입니다. 이 숫자는 1에서 50 사이여야 합니다. 파일 검색 도구는 max_num_results 개 결과보다 적게 출력할 수 있습니다. |
아니오 | |
유형 | 문자열 | 정의되는 도구의 형식: file_search |
예 |
type 열거형: assistantToolsFileSearchType
가치 | 설명 |
---|---|
파일 검색 |
assistantToolsFileSearchTypeOnly
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | 문자열 | 정의되는 도구의 형식: file_search |
예 |
type 열거형: assistantToolsFileSearchType
가치 | 설명 |
---|---|
파일 검색 |
assistantToolsFunction
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 함수 정의입니다. | 예 | |
└) 설명 | 문자열 | 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. | 아니오 | |
└) 이름 | 문자열 | 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. | 아니오 | |
└) 매개 변수 | 채팅완료함수매개변수 | 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드/를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요. | 아니오 | |
유형 | 문자열 | 정의되는 도구의 형식: function |
예 |
type 열거형: assistantToolsFunction
가치 | 설명 |
---|---|
기능 |
절단객체
실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
마지막 메시지들 | integer | 실행에 대한 컨텍스트를 생성할 때 스레드의 가장 최근 메시지 수입니다. | 아니오 | |
유형 | 문자열 | 스레드에 사용할 잘림 전략입니다. 기본값은 auto 입니다. last_messages 로 설정하면 스레드가 스레드에서 가장 최근의 n개의 메시지로 잘립니다. auto 로 설정하면 스레드 중간에 있는 메시지가 모델의 컨텍스트 길이인 max_prompt_tokens 에 맞게 삭제됩니다. |
예 |
type 열거형: TruncationType
가치 | 설명 |
---|---|
auto | |
마지막 메시지들 |
assistantsApiToolChoiceOption
모델이 호출하는 도구(있는 경우)를 제어합니다.
none
는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.
auto
는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"}
또는 {"type": "function", "function": {"name": "my_function"}}
과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
assistantsNamedToolChoice
모델에서 사용해야 하는 도구를 지정합니다. 모델이 강제로 특정 도구를 호출하도록 하는 데 사용합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 아니오 | ||
└) 이름 | 문자열 | 호출할 함수의 이름입니다. | 아니오 | |
유형 | 문자열 | 도구의 종류입니다. 형식이 function 인 경우 함수 이름을 설정해야 합니다. |
예 |
type 열거형: AssistantsNamedToolChoiceType
가치 | 설명 |
---|---|
기능 | |
코드 인터프리터 | |
파일 검색 |
runObject
스레드에서 실행되는 실행을 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
어시스턴트_아이디 | 문자열 | 이 실행을 실행하는 데 사용되는 도우미의 ID입니다. | 예 | |
cancelled_at | integer | 실행이 취소된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
completed_at | integer | 실행이 완료된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
created_at | integer | 실행이 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
만료_일자 | integer | 실행이 만료된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
failed_at | integer | 실행이 실패한 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
불완전한 세부사항 | 객체 | 실행이 완료되지 않은 이유에 대한 세부 정보입니다. 실행이 완료되지 않은 경우 null 이 됩니다. |
예 | |
└) 이유 | 문자열 | 실행이 완료되지 않은 이유입니다. 실행 과정에서 도달한 특정 토큰 제한을 가리킵니다. | 아니오 | |
지침 | 문자열 | 도우미가 이 실행에 사용한 지침입니다. | 예 | |
마지막_오류 | 객체 | 이 실행과 관련된 마지막 오류입니다. 오류가 없으면 null 이 됩니다. |
예 | |
└─ code | 문자열 | server_error 또는 rate_limit_exceeded 중 하나입니다. |
아니오 | |
└) 메시지 | 문자열 | 사람이 읽을 수 있는 오류 설명입니다. | 아니오 | |
최대_완료_토큰 | integer | 실행 과정에서 사용되도록 지정된 완료 토큰의 최대 수입니다. |
예 | |
최대_프롬프트_토큰 | integer | 실행 과정에서 사용되도록 지정된 프롬프트 토큰의 최대 수입니다. |
예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
model | 문자열 | 도우미가 이 실행에 사용한 모델입니다. | 예 | |
객체 | 문자열 | 항상 thread.run 인 개체 형식입니다. |
예 | |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
필요한_조치 | 객체 | 실행을 계속하는 데 필요한 작업에 대한 세부 정보입니다. 작업이 필요하지 않으면 null 이 됩니다. |
예 | |
└─ submit_tool_outputs | 객체 | 이 실행을 계속하는 데 필요한 도구 출력에 대한 세부 정보입니다. | 아니오 | |
└─ tool_calls | array | 관련 도구 호출 목록입니다. | 아니오 | |
└─ 형식 | enum | 지금은 항상 submit_tool_outputs 입니다.가능한 값: submit_tool_outputs |
아니오 | |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
예 | |
시작_시간 | integer | 실행이 시작된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
상태 | 문자열 | 실행 상태는 queued , in_progress , requires_action , cancelling , cancelled , failed , completed 또는 expired 일 수 있습니다. |
예 | |
온도 | 숫자 | 이 실행에 사용되는 샘플링 온도입니다. 설정하지 않으면 기본값은 1입니다. | 아니오 | |
스레드 ID | 문자열 | 이 실행의 일부로 실행된 스레드의 ID입니다. | 예 | |
도구_선택 | 보조자 API 도구 선택 옵션 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.auto 는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}} 과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다. |
예 | |
도구들 | array | 도우미가 이 실행에 사용한 도구 목록입니다. | 예 | [] |
top_p | 숫자 | 이 실행에 사용되는 핵 샘플링 값입니다. 설정하지 않으면 기본값은 1입니다. | 아니오 | |
truncation_strategy | truncationObject | 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. | 예 | |
사용량 | runCompletionUsage | 실행과 관련된 사용 통계입니다. 실행이 종료 상태가 아닌 경우(예: null , in_progress 등) 이 값은 queued 이 됩니다. |
예 |
object 열거형: runObjectType
가치 | 설명 |
---|---|
스레드 실행 | 실행 개체 형식으로, 항상 thread.run입니다. |
status 열거형: RunObjectStatus
가치 | 설명 |
---|---|
대기 중 | queued 상태 |
진행 중 | in_progress 상태 |
조치 필요 | required_action 상태 |
취소 | cancelling 상태 |
취소 | cancelled 상태 |
실패 | failed 상태 |
완료됨 | completed 상태 |
expired | expired 상태 |
실행 요청 생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
추가 지침 | 문자열 | 실행 지침 끝에 추가 지침을 추가합니다. 이는 다른 지침을 재정의하지 않고 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
추가 메시지 | array | 실행을 만들기 전에 스레드에 추가 메시지를 추가합니다. | 아니오 | |
어시스턴트_아이디 | 문자열 | 이 실행을 수행하는 데 사용할 도우미의 ID입니다. | 예 | |
지침 | 문자열 | 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
최대_완료_토큰 | integer | 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
최대_프롬프트_토큰 | integer | 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 이 실행을 수행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. | 아니오 | |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
도구_선택 | 보조자 API 도구 선택 옵션 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.auto 는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}} 과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다. |
아니오 | |
도구들 | array | 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
truncation_strategy | truncationObject | 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. | 아니오 |
listRunsResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
실행 요청 수정
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 |
submitToolOutputsRunRequest
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
도구 결과 | array | 출력이 제출되는 도구 목록입니다. | 예 |
도구호출객체실행
도구 호출 개체
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 함수 정의입니다. | 예 | |
└─ 인수 | 문자열 | 모델이 함수에 전달할 것으로 예상하는 인수입니다. | 아니오 | |
└) 이름 | 문자열 | 함수의 이름입니다. | 아니오 | |
아이디 | 문자열 | 도구 호출의 ID입니다. 엔드포인트를 실행하기 위해 제출 도구 출력을 사용하여 도구 출력을 제출할 때 이 ID를 참조해야 합니다. | 예 | |
유형 | 문자열 | 출력이 필요한 도구 호출의 형식입니다. 지금은 항상 function 입니다. |
예 |
type 열거형: RunToolCallObjectType
가치 | 설명 |
---|---|
기능 |
스레드를 생성하고 요청을 실행합니다
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
어시스턴트_아이디 | 문자열 | 이 실행을 수행하는 데 사용할 도우미의 ID입니다. | 예 | |
지침 | 문자열 | 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
최대_완료_토큰 | integer | 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
최대_프롬프트_토큰 | integer | 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete 로 종료됩니다. 자세한 내용은 incomplete_details 를 참조하세요. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
model | 문자열 | 이 실행을 실행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. | 아니오 | |
병렬 도구 호출 | ParallelToolCalls | 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. | 아니오 | 진실 |
응답_형식 | assistantsApiResponseFormatOption | 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.{ "type": "json_object" } 로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length" 를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens 인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다. |
아니오 | |
스트림 | boolean | true 인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다. |
아니오 | |
스트림 옵션 | 채팅완료스트림옵션 | 스트리밍 응답에 대한 옵션입니다. stream: true 를 설정할 때만 설정합니다. |
아니오 | 없음 |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. |
아니오 | 1 |
스레드(thread) | createThreadRequest | 아니오 | ||
도구_선택 | 보조자 API 도구 선택 옵션 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.auto 는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}} 과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다. |
아니오 | |
도구_자원 | 객체 | 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다. |
아니오 | |
도구들 | array | 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. | 아니오 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다. |
아니오 | 1 |
truncation_strategy | truncationObject | 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. | 아니오 |
threadObject
메시지를 포함하는 스레드를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created_at | integer | 스레드가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
객체 | 문자열 | 항상 thread 인 개체 형식입니다. |
예 | |
도구_자원 | 객체 | 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
예 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 |
object 열거형: ThreadObjectType
가치 | 설명 |
---|---|
스레드(thread) | 스레드 개체 형식으로, 항상 thread 입니다. |
스레드요청생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메시지 | array | 스레드를 시작하는 메시지 목록입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
도구_자원 | 객체 | 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 | |
└─ 벡터_스토어 | array | file_ids를 사용하여 벡터 저장소를 만들고 이 스레드에 연결하기 위한 도우미입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 |
스레드 요청 수정
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
도구_자원 | 객체 | 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다. |
아니오 | |
└─ code_interpreter | 객체 | 아니오 | ||
└─ file_ids | array | code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다. |
아니오 | [] |
└─ file_search | 객체 | 아니오 | ||
└─ vector_store_ids | array | 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다. |
아니오 |
deleteThreadResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
삭제됨 | boolean | 예 | ||
아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
object 열거형: DeleteThreadResponseObjectState
가치 | 설명 |
---|---|
스레드.삭제됨 | 삭제 스레드 응답 개체 상태는 thread.deleted 입니다. |
스레드 목록 응답
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
메시지 객체
스레드 내의 메시지를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
어시스턴트_아이디 | 문자열 | 해당하는 경우 이 메시지를 작성한 도우미의 ID입니다. | 예 | |
attachments | array | 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다. | 예 | |
completed_at | integer | 메시지가 완료된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
내용 | array | 텍스트 및/또는 이미지 배열에서 메시지의 콘텐츠입니다. | 예 | |
created_at | integer | 메시지가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
incomplete_at | integer | 메시지가 완료로 표시된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
불완전한 세부사항 | 객체 | 불완전한 메시지에서 메시지가 불완전한 이유에 대한 세부 정보입니다. | 예 | |
└) 이유 | 문자열 | 메시지가 완료되지 않은 이유입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
객체 | 문자열 | 항상 thread.message 인 개체 형식입니다. |
예 | |
역할 | 문자열 | 메시지를 생성한 엔터티입니다. user 또는 assistant 중 하나입니다. |
예 | |
run_id | 문자열 | 해당하는 경우 이 메시지의 작성과 연결된 실행의 ID입니다. | 예 | |
상태 | 문자열 | 메시지 상태로, in_progress , incomplete 또는 completed 일 수 있습니다. |
예 | |
스레드 ID | 문자열 | 이 메시지가 속한 스레드 ID입니다. | 예 |
object 열거형: MessageObjectType
가치 | 설명 |
---|---|
thread.message | 메시지 개체 형식 thread.message 입니다. |
status 열거형: MessageObjectStatus
가치 | 설명 |
---|---|
진행 중 | |
불완전 | |
완료됨 |
role 열거형: MessageObjectRole
가치 | 설명 |
---|---|
사용자 | |
assistant |
messageDeltaObject
메시지 델타, 즉 스트리밍 중에 메시지의 변경된 필드를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 객체 | 메시지에서 변경된 필드가 포함된 델타입니다. | 예 | |
└─ 콘텐츠 | array | 텍스트 및/또는 이미지 배열에서 메시지의 콘텐츠입니다. | 아니오 | |
└─ 역할 | 문자열 | 메시지를 생성한 엔터티입니다. user 또는 assistant 중 하나입니다. |
아니오 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 메시지의 식별자입니다. | 예 | |
객체 | 문자열 | 항상 thread.message.delta 인 개체 형식입니다. |
예 |
object 열거형: MessageDeltaObjectType
가치 | 설명 |
---|---|
thread.message.delta |
메시지생성요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
attachments | array | 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다. | 아니오 | |
내용 | 문자열 | 메시지의 내용입니다. | 예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
역할 | 문자열 | 메시지를 만드는 엔터티의 역할입니다. 허용되는 값은 다음과 같습니다. - user : 메시지가 실제 사용자에 의해 전송되었으며 대부분의 경우 사용자 생성 메시지를 나타내는 데 사용되어야 함을 나타냅니다.- assistant : 메시지가 도우미에 의해 생성되었음을 나타냅니다. 도우미의 메시지를 대화에 삽입하려면 이 값을 사용합니다. |
예 |
role 열거형: CreateMessageRequestRole
가치 | 설명 |
---|---|
사용자 | |
assistant |
메시지 수정 요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 |
deleteMessageResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
삭제됨 | boolean | 예 | ||
아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
object 열거형: DeleteMessageResponseObject
가치 | 설명 |
---|---|
스레드 메시지 삭제됨 | 삭제 메시지 응답 개체 상태입니다. |
listMessagesResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
messageContentImageFileObject
메시지 콘텐츠에서 이미지 파일을 참조합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 파일 | 객체 | 예 | ||
└─ file_id | 문자열 | 메시지 콘텐츠에 있는 이미지의 파일 ID입니다. | 아니오 | |
유형 | 문자열 | 항상 image_file 입니다. |
예 |
type 열거형: MessageContentImageFileObjectType
가치 | 설명 |
---|---|
이미지 파일 | 메시지 콘텐츠 이미지 파일 형식 |
메시지내용텍스트객체
메시지의 일부인 텍스트 콘텐츠입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 객체 | 예 | ||
└) 주석 | array | 아니오 | ||
└─ value | 문자열 | 텍스트를 구성하는 데이터입니다. | 아니오 | |
유형 | 문자열 | 항상 text 입니다. |
예 |
type 열거형: messageContentTextObjectType
가치 | 설명 |
---|---|
문자 메시지 | 메시지 콘텐츠 텍스트 개체 형식 |
messageContentTextAnnotationsFileCitationObject
도우미 또는 메시지와 연결된 특정 파일의 특정 인용을 가리키는 메시지 내의 인용입니다. 도우미가 "retrieval" 도구를 사용하여 파일을 검색할 때 생성됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
end_index | integer | 예 | ||
파일 인용 | 객체 | 예 | ||
└─ file_id | 문자열 | 인용의 원본인 특정 파일의 ID입니다. | 아니오 | |
start_index (시작 인덱스) | integer | 예 | ||
문자 메시지 | 문자열 | 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. | 예 | |
유형 | 문자열 | 항상 file_citation 입니다. |
예 |
type 열거형: FileCitationObjectType
가치 | 설명 |
---|---|
파일 인용 | 파일 인용 개체 형식 |
messageContentTextAnnotationsFilePathObject
도우미가 code_interpreter
도구를 사용하여 파일을 생성할 때 생성되는 파일의 URL입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
end_index | integer | 예 | ||
파일 경로 | 객체 | 예 | ||
└─ file_id | 문자열 | 생성된 파일의 ID입니다. | 아니오 | |
start_index | integer | 예 | ||
문자 메시지 | 문자열 | 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. | 예 | |
유형 | 문자열 | 항상 file_path 입니다. |
예 |
type 열거형: FilePathObjectType
가치 | 설명 |
---|---|
파일 경로 | 파일 경로 개체 형식 |
messageDeltaContentImageFileObject
메시지 콘텐츠에서 이미지 파일을 참조합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 파일 | 객체 | 아니오 | ||
└─ file_id | 문자열 | 메시지 콘텐츠에 있는 이미지의 파일 ID입니다. | 아니오 | |
인덱스 | integer | 메시지의 콘텐츠 부분에 대한 인덱스입니다. | 예 | |
유형 | 문자열 | 항상 image_file 입니다. |
예 |
type 열거형: MessageDeltaContentImageFileObjectType
가치 | 설명 |
---|---|
이미지 파일 |
메시지델타내용텍스트객체
메시지의 일부인 텍스트 콘텐츠입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
인덱스 | integer | 메시지의 콘텐츠 부분에 대한 인덱스입니다. | 예 | |
문자 메시지 | 객체 | 아니오 | ||
└) 주석 | array | 아니오 | ||
└─ value | 문자열 | 텍스트를 구성하는 데이터입니다. | 아니오 | |
유형 | 문자열 | 항상 text 입니다. |
예 |
type 열거형: MessageDeltaContentTextObjectType
가치 | 설명 |
---|---|
문자 메시지 |
messageDeltaContentTextAnnotationsFileCitationObject
도우미 또는 메시지와 연결된 특정 파일의 특정 인용을 가리키는 메시지 내의 인용입니다. 도우미가 "file_search" 도구를 사용하여 파일을 검색할 때 생성됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
end_index | integer | 아니오 | ||
파일 인용 | 객체 | 아니오 | ||
└─ file_id | 문자열 | 인용의 원본인 특정 파일의 ID입니다. | 아니오 | |
└─ quote | 문자열 | 파일의 특정 인용입니다. | 아니오 | |
인덱스 | integer | 텍스트 콘텐츠 부분에 있는 주석의 인덱스입니다. | 예 | |
start_index | integer | 아니오 | ||
문자 메시지 | 문자열 | 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. | 아니오 | |
유형 | 문자열 | 항상 file_citation 입니다. |
예 |
type 열거형: MessageDeltaContentTextAnnotationsFileCitationObjectType
가치 | 설명 |
---|---|
파일 인용 |
messageDeltaContentTextAnnotationsFilePathObject
도우미가 code_interpreter
도구를 사용하여 파일을 생성할 때 생성되는 파일의 URL입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
end_index | integer | 아니오 | ||
파일 경로 | 객체 | 아니오 | ||
└─ file_id | 문자열 | 생성된 파일의 ID입니다. | 아니오 | |
인덱스 | integer | 텍스트 콘텐츠 부분에 있는 주석의 인덱스입니다. | 예 | |
start_index | integer | 아니오 | ||
문자 메시지 | 문자열 | 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. | 아니오 | |
유형 | 문자열 | 항상 file_path 입니다. |
예 |
type 열거형: MessageDeltaContentTextAnnotationsFilePathObjectType
가치 | 설명 |
---|---|
파일 경로 |
runStepObject
실행 수행의 단계를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
어시스턴트_아이디 | 문자열 | 실행 단계와 연결된 도우미의 ID입니다. | 예 | |
cancelled_at | integer | 실행 단계가 취소된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
completed_at | integer | 실행 단계가 완료된 시점의 Unix 타임스탬프(초)입니다. | 예 | |
created_at | integer | 실행 단계가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
만료 날짜 | integer | 실행 단계가 만료된 시점의 Unix 타임스탬프(초)입니다. 부모 실행이 만료되면 단계가 만료된 것으로 간주됩니다. | 예 | |
failed_at | integer | 실행 단계가 실패한 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 실행 단계의 식별자입니다. | 예 | |
마지막_오류 | 객체 | 이 실행 단계와 관련된 마지막 오류입니다. 오류가 없으면 null 이 됩니다. |
예 | |
└─ code | 문자열 | server_error 또는 rate_limit_exceeded 중 하나입니다. |
아니오 | |
└) 메시지 | 문자열 | 사람이 읽을 수 있는 오류 설명입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
객체 | 문자열 | 항상 assistant.run.step 인 개체 형식입니다. |
예 | |
run_id | 문자열 | 이 실행 단계가 포함된 실행의 ID입니다. | 예 | |
상태 | 문자열 | 실행 상태로, in_progress , cancelled , failed , completed 또는 expired 일 수 있습니다. |
예 | |
step_details | runStepDetailsMessageCreationObject 또는 runStepDetailsToolCallsObject | 실행 단계의 세부 정보입니다. | 예 | |
스레드 ID | 문자열 | 실행된 스레드의 ID입니다. | 예 | |
유형 | 문자열 | 실행 단계의 형식으로, message_creation 또는 tool_calls 일 수 있습니다. |
예 |
object 열거형: RunStepObjectType
가치 | 설명 |
---|---|
assistant.run.step | 항상 assistant.run.step 인 개체 형식입니다. |
type 열거형: RunStepObjectType
가치 | 설명 |
---|---|
메시지 생성 | message_creation 실행 단계 |
도구 호출 | tool_calls 실행 단계 |
status 열거형: RunStepObjectStatus
가치 | 설명 |
---|---|
진행 중 | in_progress 실행 상태 |
취소 | cancelled 실행 상태 |
실패 | cancelled 실행 상태 |
완료됨 | cancelled 실행 상태 |
expired | cancelled 실행 상태 |
러닝스텝델타오브젝트
실행 단계 델타, 즉, 스트리밍 중에 실행 단계에서 변경된 필드를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 객체 | 실행 단계에서 변경된 필드가 포함된 델타입니다. | 예 | |
└─ step_details | runStepDeltaStepDetailsMessageCreationObject 또는 runStepDeltaStepDetailsToolCallsObject | 실행 단계의 세부 정보입니다. | 아니오 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 실행 단계의 식별자입니다. | 예 | |
객체 | 문자열 | 항상 thread.run.step.delta 인 개체 형식입니다. |
예 |
object 열거형: RunStepDeltaObjectType
가치 | 설명 |
---|---|
thread.run.step.delta |
listRunStepsResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
runStepDetailsMessageCreationObject
실행 단계의 메시지 생성 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메시지 생성 | 객체 | 예 | ||
└─ message_id | 문자열 | 이 실행 단계에서 만든 메시지의 ID입니다. | 아니오 | |
유형 | 문자열 | 항상 message_creation 입니다. |
예 |
type 열거형: RunStepDetailsMessageCreationObjectType
가치 | 설명 |
---|---|
메시지 생성 |
런스텝 델타 스텝 세부사항 메시지 생성 오브젝트
실행 단계의 메시지 생성 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메시지 생성 | 객체 | 아니오 | ||
└─message_id | 문자열 | 이 실행 단계에서 만든 메시지의 ID입니다. | 아니오 | |
유형 | 문자열 | 항상 message_creation 입니다. |
예 |
type 열거형: RunStepDeltaStepDetailsMessageCreationObjectType
가치 | 설명 |
---|---|
메시지 생성 |
runStepDetailsToolCallsObject
도구 호출의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
도구 호출 | array | 실행 단계가 관련된 도구 호출의 배열입니다. 세 가지 도구 형식 code_interpreter , retrieval 또는 function 중 하나와 연결될 수 있습니다. |
예 | |
유형 | 문자열 | 항상 tool_calls 입니다. |
예 |
type 열거형: RunStepDetailsToolCallsObjectType
가치 | 설명 |
---|---|
도구 호출 |
runStepDeltaStepDetailsToolCallsObject
도구 호출의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
도구 호출 | array | 실행 단계가 관련된 도구 호출의 배열입니다. 세 가지 도구 형식 code_interpreter , file_search 또는 function 중 하나와 연결될 수 있습니다. |
아니오 | |
유형 | 문자열 | 항상 tool_calls 입니다. |
예 |
type 열거형: RunStepDeltaStepDetailsToolCallsObjectType
가치 | 설명 |
---|---|
도구 호출 |
runStepDetailsToolCallsCodeObject
실행 단계가 관련된 코드 인터프리터 도구 호출의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 인터프리터 | 객체 | 코드 인터프리터 도구 호출 정의입니다. | 예 | |
└─ 입력 | 문자열 | 코드 인터프리터 도구 호출에 대한 입력입니다. | 아니오 | |
└─ outputs | array | 코드 인터프리터 도구 호출의 출력입니다. 코드 인터프리터는 텍스트(logs ) 또는 이미지(image )를 포함하는 하나 이상의 항목을 출력할 수 있습니다. 이러한 각 항목은 서로 다른 개체 형식으로 표시됩니다. |
아니오 | |
아이디 | 문자열 | 도구 호출의 ID입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 code_interpreter 가 됩니다. |
예 |
type 열거형: RunStepDetailsToolCallsCodeObjectType
가치 | 설명 |
---|---|
코드 인터프리터 |
runStepDeltaStepDetailsToolCallsCodeObject
실행 단계가 관련된 코드 인터프리터 도구 호출의 세부 정보입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 인터프리터 | 객체 | 코드 인터프리터 도구 호출 정의입니다. | 아니오 | |
└─ 입력 | 문자열 | 코드 인터프리터 도구 호출에 대한 입력입니다. | 아니오 | |
└─ outputs | array | 코드 인터프리터 도구 호출의 출력입니다. 코드 인터프리터는 텍스트(logs ) 또는 이미지(image )를 포함하는 하나 이상의 항목을 출력할 수 있습니다. 이러한 각 항목은 서로 다른 개체 형식으로 표시됩니다. |
아니오 | |
아이디 | 문자열 | 도구 호출의 ID입니다. | 아니오 | |
인덱스 | integer | 도구 호출 배열의 도구 호출 인덱스입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 code_interpreter 가 됩니다. |
예 |
type 열거형: RunStepDeltaStepDetailsToolCallsCodeObjectType
가치 | 설명 |
---|---|
코드 인터프리터 |
runStepDetailsToolCallsCodeOutputLogsObject
실행 단계의 일부인 코드 인터프리터 도구 호출의 텍스트 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
로그 | 문자열 | 코드 인터프리터 도구 호출의 텍스트 출력입니다. | 예 | |
유형 | 문자열 | 항상 logs 입니다. |
예 |
type 열거형: RunStepDetailsToolCallsCodeOutputLogsObjectType
가치 | 설명 |
---|---|
로그 |
runStepDeltaStepDetailsToolCallsCodeOutputLogsObject
실행 단계의 일부인 코드 인터프리터 도구 호출의 텍스트 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
인덱스 | integer | 출력 배열의 출력 인덱스입니다. | 예 | |
로그 | 문자열 | 코드 인터프리터 도구 호출의 텍스트 출력입니다. | 아니오 | |
유형 | 문자열 | 항상 logs 입니다. |
예 |
type 열거형: RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType
가치 | 설명 |
---|---|
로그 |
runStepDetailsToolCallsCodeOutputImageObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 | 객체 | 예 | ||
└─ file_id | 문자열 | 이미지의 파일 ID입니다. | 아니오 | |
유형 | 문자열 | 항상 image 입니다. |
예 |
type 열거형: RunStepDetailsToolCallsCodeOutputImageObjectType
가치 | 설명 |
---|---|
이미지 |
runStepDeltaStepDetailsToolCallsCodeOutputImageObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이미지 | 객체 | 아니오 | ||
└─ file_id | 문자열 | 이미지의 파일 ID입니다. | 아니오 | |
인덱스 | integer | 출력 배열의 출력 인덱스입니다. | 예 | |
유형 | 문자열 | 항상 image 입니다. |
예 |
type 열거형: RunStepDeltaStepDetailsToolCallsCodeOutputImageObject
가치 | 설명 |
---|---|
이미지 |
runStepDetailsToolCallsFileSearchObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 검색 | 객체 | 지금은 항상 빈 개체가 됩니다. | 예 | |
└─ 결과 | array | 파일 검색의 결과입니다. | 아니오 | |
아이디 | 문자열 | 도구 호출 개체의 ID입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 file_search 가 됩니다. |
예 |
type 열거형: RunStepDetailsToolCallsFileSearchObjectType
가치 | 설명 |
---|---|
파일 검색 |
runStepDetailsToolCallsFileSearchResultObject
파일 검색의 결과 인스턴스입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | array | 발견된 결과의 콘텐츠입니다. 이 콘텐츠는 include 쿼리 매개 변수를 통해 요청된 경우에만 포함됩니다. | 아니오 | |
file_id | 문자열 | 결과를 찾은 파일의 ID입니다. | 예 | |
파일_이름 | 문자열 | 결과를 찾은 파일의 이름입니다. | 예 | |
score | 숫자 | 결과의 점수입니다. 모든 값은 0에서 1 사이의 부동 소수점 숫자여야 합니다. | 예 |
runStepDeltaStepDetailsToolCallsFileSearchObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 검색 | 객체 | 지금은 항상 빈 개체가 됩니다. | 예 | |
아이디 | 문자열 | 도구 호출 개체의 ID입니다. | 아니오 | |
인덱스 | integer | 도구 호출 배열의 도구 호출 인덱스입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 retrieval 가 됩니다. |
예 |
type 열거형: RunStepDeltaStepDetailsToolCallsFileSearchObjectType
가치 | 설명 |
---|---|
파일 검색 |
runStepDetailsToolCallsFunctionObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 호출된 함수의 정의입니다. | 예 | |
└─ 인수 | 문자열 | 함수에 전달된 인수입니다. | 아니오 | |
└) 이름 | 문자열 | 함수의 이름입니다. | 아니오 | |
└─ output | 문자열 | 함수의 출력입니다. 출력이 아직 제출되지 않은 경우 null 이 됩니다. |
아니오 | |
아이디 | 문자열 | 도구 호출 개체의 ID입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 function 가 됩니다. |
예 |
type 열거형: RunStepDetailsToolCallsFunctionObjectType
가치 | 설명 |
---|---|
기능 |
runStepDeltaStepDetailsToolCallsFunctionObject
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
기능 | 객체 | 호출된 함수의 정의입니다. | 아니오 | |
└─ 인수 | 문자열 | 함수에 전달된 인수입니다. | 아니오 | |
└) 이름 | 문자열 | 함수의 이름입니다. | 아니오 | |
└─ output | 문자열 | 함수의 출력입니다. 출력이 아직 제출되지 않은 경우 null 이 됩니다. |
아니오 | |
아이디 | 문자열 | 도구 호출 개체의 ID입니다. | 아니오 | |
인덱스 | integer | 도구 호출 배열의 도구 호출 인덱스입니다. | 예 | |
유형 | 문자열 | 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 function 가 됩니다. |
예 |
type 열거형: RunStepDetailsToolCallsFunctionObjectType
가치 | 설명 |
---|---|
기능 |
vectorStoreExpirationAfter
벡터 저장소에 대한 만료 정책입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
닻 | 문자열 | 만료 정책이 적용되는 앵커 타임스탬프입니다. 지원되는 앵커: last_active_at . |
예 | |
일 | integer | 벡터 저장소가 만료되는 앵커 시간 이후의 일 수입니다. | 예 |
anchor 열거형: VectorStoreExpirationAfterAnchor
가치 | 설명 |
---|---|
최근 활동 시간 | 만료 정책이 적용되는 앵커 타임스탬프입니다. |
vectorStoreObject
벡터 저장소는 file_search
도구에서 사용할 수 있는 처리된 파일의 컬렉션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created_at | integer | 벡터 저장소가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
expires_after | 벡터 저장 만료 후 | 벡터 저장소에 대한 만료 정책입니다. | 아니오 | |
만료_일자 | integer | 벡터 저장소가 만료될 시점의 Unix 타임스탬프(초)입니다. | 아니오 | |
파일_개수 | 객체 | 예 | ||
└' 취소됨 | integer | 취소된 파일 수입니다. | 아니오 | |
└> 완료됨 | integer | 성공적으로 처리된 파일 수입니다. | 아니오 | |
└> 실패 | integer | 처리하지 못한 파일 수입니다. | 아니오 | |
└진행 중 | integer | 현재 처리 중인 파일 수입니다. | 아니오 | |
└합계 | integer | 총 파일 수입니다. | 아니오 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
최근 활동 시간 | integer | 벡터 저장소가 마지막으로 활성 상태였던 시점의 Unix 타임스탬프(초)입니다. | 예 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
예 | |
이름 | 문자열 | 벡터 저장소의 이름입니다. | 예 | |
객체 | enum | 항상 vector_store 인 개체 형식입니다.가능한 값: vector_store |
예 | |
상태 | 문자열 | 벡터 저장소의 상태로, expired , in_progress 또는 completed 일 수 있습니다. completed 의 상태는 벡터 저장소를 사용할 준비가 되었음을 나타냅니다. |
예 | |
usage_bytes | integer | 벡터 저장소의 파일에 사용되는 총 바이트 수입니다. | 예 |
status 열거형: VectorStoreObjectStatus
가치 | 설명 |
---|---|
expired | |
진행 중 | |
완료됨 |
벡터저장소요청 생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. |
아니오 | |
expires_after | 벡터 저장 만료 후 | 벡터 저장소에 대한 만료 정책입니다. | 아니오 | |
파일_아이디 | array | 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
이름 | 문자열 | 벡터 저장소의 이름입니다. | 아니오 |
벡터 저장소 요청 업데이트
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
expires_after | 벡터 저장 만료 후 | 벡터 저장소에 대한 만료 정책입니다. | 아니오 | |
메타데이터 | 객체 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다. |
아니오 | |
이름 | 문자열 | 벡터 저장소의 이름입니다. | 아니오 |
listVectorStoresResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
벡터 저장소 삭제 응답
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
삭제됨 | boolean | 예 | ||
아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
object 열거형: DeleteVectorStoreResponseObject
가치 | 설명 |
---|---|
벡터_저장소.삭제됨 | 삭제 벡터 저장소 응답 개체 상태입니다. |
vectorStoreFileObject
벡터 저장소에 연결된 파일 목록입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. |
아니오 | |
created_at | integer | 벡터 저장소 파일이 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
마지막_오류 | 객체 | 이 벡터 저장소 파일과 연결된 마지막 오류입니다. 오류가 없으면 null 이 됩니다. |
예 | |
└─ code | 문자열 | server_error , invalid_file 또는 unsupported_file 중 하나입니다. |
아니오 | |
└) 메시지 | 문자열 | 사람이 읽을 수 있는 오류 설명입니다. | 아니오 | |
객체 | 문자열 | 항상 vector_store.file 인 개체 형식입니다. |
예 | |
상태 | 문자열 | 벡터 저장소 파일의 상태로, in_progress , completed , cancelled 또는 failed 일 수 있습니다. completed 상태는 벡터 저장소 파일을 사용할 준비가 되었음을 나타냅니다. |
예 | |
usage_bytes | integer | 총 벡터 저장소 사용량(바이트)입니다. 원래 파일 크기와 다를 수 있습니다. | 예 | |
벡터 저장소 ID | 문자열 | 파일이 연결된 벡터 저장소의 ID입니다. | 예 |
object 열거형: VectorStoreFileObjectType
가치 | 설명 |
---|---|
벡터_스토어.파일 |
status 열거형: VectorStoreFileObjectStatus
가치 | 설명 |
---|---|
진행 중 | |
완료됨 | |
취소 | |
실패 |
otherChunkingStrategyResponseParam
청크 전략을 알 수 없는 경우 반환됩니다. 일반적으로 이는 chunking_strategy
개념이 API에 도입되기 전에 파일이 인덱싱되었기 때문입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | 문자열 | 항상 other 입니다. |
예 |
type 열거형: OtherChunkingStrategyResponseParamType
가치 | 설명 |
---|---|
기타 |
staticChunkingStrategyResponseParam
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
정적 | staticChunkingStrategy (정적 청킹 전략) | 예 | ||
유형 | 문자열 | 항상 static 입니다. |
예 |
type 열거형: StaticChunkingStrategyResponseParamType
가치 | 설명 |
---|---|
정적 |
staticChunkingStrategy
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunk_overlap_tokens | integer | 청크 간에 겹치는 토큰 수입니다. 기본값은 400 입니다.겹침은 max_chunk_size_tokens 의 절반을 초과할 수 없습니다. |
예 | |
max_chunk_size_tokens | integer | 각 청크의 최대 토큰 수입니다. 기본값은 800 입니다. 최솟값은 100 이고 최댓값은 4096 입니다. |
예 |
autoChunkingStrategyRequestParam
기본 전략. 이 전략은 현재 max_chunk_size_tokens
의 800
및 chunk_overlap_tokens
의 400
을 사용합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 항상 auto 입니다.가능한 값: auto |
예 |
staticChunkingStrategyRequestParam
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
정적 | staticChunkingStrategy | 예 | ||
유형 | enum | 항상 static 입니다.가능한 값: static |
예 |
chunkingStrategyRequestParam
파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto
전략을 사용합니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
벡터 저장소 파일 요청 생성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | 청킹 전략 요청 매개변수 | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. |
아니오 | |
file_id | 문자열 | 벡터 저장소에서 사용해야 하는 파일 ID입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
예 |
listVectorStoreFilesResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 예 | ||
첫번째_아이디 | 문자열 | 예 | ||
has_more | boolean | 예 | ||
마지막 아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
deleteVectorStoreFileResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
삭제됨 | boolean | 예 | ||
아이디 | 문자열 | 예 | ||
객체 | 문자열 | 예 |
object 열거형: DeleteVectorStoreFileResponseObject
가치 | 설명 |
---|---|
벡터_저장소.파일.삭제됨 |
vectorStoreFileBatchObject
벡터 저장소에 연결된 파일의 일괄 처리입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created_at | integer | 벡터 저장소 파일 일괄 처리가 만들어진 시점의 Unix 타임스탬프(초)입니다. | 예 | |
파일_개수 | 객체 | 예 | ||
└' 취소됨 | integer | 취소된 파일 수입니다. | 아니오 | |
└> 완료됨 | integer | 처리된 파일 수입니다. | 아니오 | |
└> 실패 | integer | 처리하지 못한 파일 수입니다. | 아니오 | |
└진행 중 | integer | 현재 처리 중인 파일 수입니다. | 아니오 | |
└합계 | integer | 총 파일 수입니다. | 아니오 | |
아이디 | 문자열 | API 엔드포인트에서 참조할 수 있는 식별자입니다. | 예 | |
객체 | 문자열 | 항상 vector_store.file_batch 인 개체 형식입니다. |
예 | |
상태 | 문자열 | 벡터 저장소 파일 일괄 처리의 상태로, in_progress , completed , cancelled 또는 failed 일 수 있습니다. |
예 | |
벡터 저장소 ID | 문자열 | 파일이 연결된 벡터 저장소의 ID입니다. | 예 |
object 열거형: VectorStoreFileBatchObjectType
가치 | 설명 |
---|---|
vector_store.files_batch |
status 열거형: VectorStoreFileBatchObjectStatus
가치 | 설명 |
---|---|
진행 중 | |
완료됨 | |
취소 | |
실패 |
createVectorStoreFileBatchRequest
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
chunking_strategy | 청킹 전략 요청 매개변수 | 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. |
아니오 | |
파일_아이디 | array | 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search 와 같은 도구에 유용합니다. |
예 |
assistantStreamEvent
실행을 스트리밍할 때 발생하는 이벤트를 나타냅니다.
서버에서 보낸 이벤트 스트림의 각 이벤트에는 event
및 data
속성이 있습니다.
event: thread.created
data: {"id": "thread_123", "object": "thread", ...}
새 개체가 만들어지거나, 새 상태로 전환되거나, 부분(델타)으로 스트리밍될 때마다 이벤트를 내보냅니다. 예를 들어, 새 실행이 만들어지면 thread.run.created
를 내보내고, 실행이 완료되면 thread.run.completed
를 내보냅니다. 도우미가 실행 중에 메시지 만들기를 선택하면 thread.message.created event
이벤트, thread.message.in_progress
이벤트, 많은 thread.message.delta
이벤트, 마지막으로 thread.message.completed
이벤트를 차례로 내보냅니다.
시간이 지남에 따라 이벤트를 더 추가할 수 있으므로 코드의 알 수 없는 이벤트를 정상적으로 처리하는 것이 좋습니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
threadStreamEvent
이 구성 요소는 다음 중 하나일 수 있습니다.
스레드 생성됨
새 스레드가 만들어질 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | threadObject | 메시지를 포함하는 스레드를 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: threadObject
Event 열거형: ThreadStreamEventEnum
가치 | 설명 |
---|---|
스레드 생성됨 | 스레드 생성 이벤트입니다. |
스트림 이벤트 실행
이 구성 요소는 다음 중 하나일 수 있습니다.
thread.run.created
새 실행이 만들어지면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventCreated
가치 | 설명 |
---|---|
thread.run.created |
thread.run.queued
실행이 queued
상태로 이동할 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventQueued
가치 | 설명 |
---|---|
thread.run.queued |
thread.run.in_progress
실행이 in_progress
상태로 이동할 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventInProgress
가치 | 설명 |
---|---|
thread.run.in_progress |
thread.run.requires_action
실행이 requires_action
상태로 이동할 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventRequiresAction
가치 | 설명 |
---|---|
thread.run.requires_action |
스레드 실행 완료
실행이 완료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventCompleted
가치 | 설명 |
---|---|
스레드 실행 완료 |
스레드 실행 실패
실행이 실패하면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventFailed
가치 | 설명 |
---|---|
스레드 실행 실패 |
thread.run.cancelling
실행이 cancelling
상태로 이동할 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventCancelling
가치 | 설명 |
---|---|
thread.run.cancelling |
스레드.실행.취소됨
실행이 취소되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventCancelled
가치 | 설명 |
---|---|
스레드.실행.취소됨 |
스레드 실행 만료
실행이 만료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runObject | 스레드에서 실행되는 실행을 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: runObject
Event 열거형: RunStreamEventExpired
가치 | 설명 |
---|---|
스레드 실행 만료 |
runStepStreamEvent
이 구성 요소는 다음 중 하나일 수 있습니다.
thread.run.step.created
실행 단계가 만들어지면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventCreated
가치 | 설명 |
---|---|
thread.run.step.created |
thread.run.step.in_progress
실행 단계가 in_progress
상태로 전환되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventInProgress
가치 | 설명 |
---|---|
thread.run.step.in_progress |
thread.run.step.delta
실행 단계의 일부가 스트리밍되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepDeltaObject | 실행 단계 델타, 즉, 스트리밍 중에 실행 단계에서 변경된 필드를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepDeltaObject
Event 열거형: RunStepStreamEventDelta
가치 | 설명 |
---|---|
thread.run.step.delta |
thread.run.step.completed
실행 단계가 완료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventCompleted
가치 | 설명 |
---|---|
thread.run.step.completed |
thread.run.step.failed
실행 단계가 실패하면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventFailed
가치 | 설명 |
---|---|
thread.run.step.failed |
스레드 실행 단계가 취소됨
실행 단계가 취소되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventCancelled
가치 | 설명 |
---|---|
스레드 실행 단계가 취소됨 |
thread.run.step.expired
실행 단계가 만료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | runStepObject | 실행 수행의 단계를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: runStepObject
Event 열거형: RunStepStreamEventExpired
가치 | 설명 |
---|---|
thread.run.step.expired |
메시지스트림이벤트
이 구성 요소는 다음 중 하나일 수 있습니다.
thread.message.created
메시지가 만들어질 때 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | messageObject | 스레드 내의 메시지를 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: messageObject
Event 열거형: MessageStreamEventCreated
가치 | 설명 |
---|---|
thread.message.created |
thread.message.in_progress
메시지가 in_progress
상태로 전환하면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | messageObject | 스레드 내의 메시지를 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: messageObject
Event 열거형: MessageStreamEventInProgress
가치 | 설명 |
---|---|
thread.message.in_progress |
thread.message.delta
메시지의 일부가 스트리밍되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | messageDeltaObject | 메시지 델타, 즉 스트리밍 중에 메시지의 변경된 필드를 나타냅니다. |
예 | |
이벤트 | 문자열 | 예 |
데이터: messageDeltaObject
Event 열거형: MessageStreamEventDelta
가치 | 설명 |
---|---|
thread.message.delta |
thread.message.completed
메시지가 완료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | messageObject | 스레드 내의 메시지를 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: messageObject
Event 열거형: MessageStreamEventCompleted
가치 | 설명 |
---|---|
thread.message.completed |
thread.message.incomplete
메시지가 완료되기 전에 종료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | messageObject | 스레드 내의 메시지를 나타냅니다. | 예 | |
이벤트 | 문자열 | 예 |
데이터: messageObject
Event 열거형: MessageStreamEventIncomplete
가치 | 설명 |
---|---|
thread.message.incomplete |
주석
이 구성 요소는 다음 중 하나일 수 있습니다.
그런 다음
클릭 동작입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
단추 | enum | 클릭하는 동안 누른 마우스 단추를 나타냅니다. left , right , wheel , back , forward 중 하나입니다.가능한 값: left , right , wheel , back forward |
예 | |
유형 | enum | 이벤트 유형을 지정합니다. 클릭 작업의 경우 이 속성은 항상 .로 설정됩니다 click .가능한 값: click |
예 | |
x | integer | 클릭이 발생한 x 좌표입니다. |
예 | |
y | integer | 클릭이 발생한 y 좌표입니다. |
예 |
코드 해석기 파일 출력
파일인 코드 인터프리터 도구 호출의 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일 | array | 예 | ||
유형 | enum | 코드 인터프리터 파일 출력의 형식입니다. 항상 files 입니다.가능한 값: files |
예 |
CodeInterpreterTextOutput
텍스트인 코드 인터프리터 도구 호출의 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
로그 | 문자열 | 코드 인터프리터 도구 호출의 로그입니다. |
예 | |
유형 | enum | 코드 인터프리터 텍스트 출력의 형식입니다. 항상 logs 입니다.가능한 값: logs |
예 |
CodeInterpreterTool
코드를 실행하는 도구입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일_아이디 | array | 코드를 실행할 파일의 ID입니다. |
예 | |
유형 | enum | 코드 인터프리터 도구의 형식입니다. 항상 code_interpreter 입니다.가능한 값: code_interpreter |
예 |
코드 해석기 도구 호출
코드를 실행하는 도구 호출입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | 문자열 | 실행할 코드입니다. |
예 | |
아이디 | 문자열 | 코드 인터프리터 도구 호출의 고유 ID입니다. |
예 | |
결과 | array | 코드 인터프리터 도구 호출의 결과입니다. |
예 | |
상태 | enum | 코드 인터프리터 도구 호출의 상태입니다. 가능한 값: in_progress , interpreting completed |
예 | |
유형 | enum | 코드 인터프리터 도구 호출의 형식입니다. 항상 code_interpreter_call 입니다.가능한 값: code_interpreter_call |
예 |
코드 인터프리터 도구 출력
이 구성 요소는 다음 중 하나일 수 있습니다.
비교 필터
정의된 비교 작업을 사용하여 지정된 특성 키를 지정된 값과 비교하는 데 사용되는 필터입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
열쇠 | 문자열 | 값과 비교할 키입니다. | 예 | |
유형 | enum | 비교 연산eq ne gt gte lt lte 자를 지정합니다.- eq :같음- ne : 같지 않음- gt : 보다 큼- gte : 크거나 같음- lt :미만- lte : 작거나 같음가능한 값: eq , ne , gt gte , lt lte |
예 | |
가치 | 문자열 또는 숫자 또는 불리언 | 특성 키와 비교할 값입니다. 문자열, 숫자 또는 부울 유형을 지원합니다. | 예 |
복합 필터
and
또는 or
를 사용하여 여러 필터를 결합합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filters | array | 결합할 필터의 배열입니다. 항목은 ComparisonFilter 또는 CompoundFilter 일 수 있습니다. |
예 | |
유형 | enum | 작업 유형: and 또는 or .가능한 값: and or |
예 |
ComputerAction
이 구성 요소는 다음 중 하나일 수 있습니다.
컴퓨터스크린샷이미지
컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
file_id | 문자열 | 스크린샷을 포함하는 업로드된 파일의 식별자입니다. | 아니오 | |
image_url | 문자열 | 스크린샷 이미지의 URL입니다. | 아니오 | |
유형 | enum | 이벤트 유형을 지정합니다. 컴퓨터 스크린샷의 경우 이 속성은 항상 .로 설정됩니다 computer_screenshot .가능한 값: computer_screenshot |
예 |
ComputerTool
가상 컴퓨터를 제어하는 도구입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
디스플레이 높이 | 숫자 | 컴퓨터 디스플레이의 높이입니다. |
예 | |
디스플레이 너비 | 숫자 | 컴퓨터 표시의 너비입니다. |
예 | |
환경 | enum | 제어할 컴퓨터 환경의 유형입니다. 가능한 값: mac , windows , ubuntu browser |
예 | |
유형 | enum | 컴퓨터 사용 도구의 유형입니다. 항상 computer_use_preview 입니다.가능한 값: computer-use-preview |
예 |
컴퓨터 도구 호출
컴퓨터 사용 도구에 대한 도구 호출입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
조치 | ComputerAction | 예 | ||
call_id | 문자열 | 출력을 사용하여 도구 호출에 응답할 때 사용되는 식별자입니다. |
예 | |
아이디 | 문자열 | 컴퓨터 호출의 고유 ID입니다. | 예 | |
대기 중인 안전 검사 | array | 보류 중인 보안 검사에서 컴퓨터 호출을 확인합니다. |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
예 | |
유형 | enum | 컴퓨터 호출의 유형입니다. 항상 computer_call 입니다.가능한 값: computer_call |
예 |
ComputerToolCallOutput
컴퓨터 도구 호출의 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
acknowledged_safety_checks | array | 개발자가 승인한 API에서 보고한 안전 검사입니다. |
아니오 | |
call_id | 문자열 | 출력을 생성한 컴퓨터 도구 호출의 ID입니다. |
예 | |
아이디 | 문자열 | 컴퓨터 도구 호출 출력의 ID입니다. |
아니오 | |
출력 | ComputerScreenshotImage | 컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다. |
예 | |
상태 | 열거형 | 메시지 입력의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 컴퓨터 도구 호출 출력의 형식입니다. 항상 computer_call_output 입니다.가능한 값: computer_call_output |
예 |
ComputerToolCallOutputResource
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
acknowledged_safety_checks | array | 개발자가 승인한 API에서 보고한 안전 검사입니다. |
아니오 | |
call_id | 문자열 | 출력을 생성한 컴퓨터 도구 호출의 ID입니다. |
예 | |
아이디 | 문자열 | 컴퓨터 호출 도구 출력의 고유 ID입니다. |
예 | |
출력 | ComputerScreenshotImage | 컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다. |
예 | |
상태 | 열거형 | 메시지 입력의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 컴퓨터 도구 호출 출력의 형식입니다. 항상 computer_call_output 입니다.가능한 값: computer_call_output |
예 |
ComputerToolCallSafetyCheck
컴퓨터 호출에 대한 보류 중인 안전 검사입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | 문자열 | 보류 중인 안전 검사의 유형입니다. | 예 | |
아이디 | 문자열 | 보류 중인 안전 검사의 ID입니다. | 예 | |
메시지 | 문자열 | 보류 중인 안전 검사에 대한 세부 정보입니다. | 예 |
콘텐츠
다중 모달 입력 및 출력 콘텐츠입니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
좌표
x/y 좌표 쌍(예: { x: 100, y: 200 }
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
x | 정수 | X 좌표입니다. |
예 | |
y | 정수 | Y 좌표입니다. |
예 |
CreateModelResponseProperties
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 메타데이터 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다. |
아니오 | |
model | 문자열 | 응답을 생성하는 데 사용되는 모델입니다. | 아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. . |
아니오 |
createResponse
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
include | 배열 | {"$ref": "#/components/schemas/includable/description"} | 아니오 | |
입력 | 문자열 또는 배열 | 응답을 생성하는 데 사용되는 모델에 대한 텍스트, 이미지 또는 파일 입력입니다. | 예 | |
지침 | 문자열 | 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다. 함께 previous_response_id 사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다. |
아니오 | |
최대 출력 토큰 | integer | 표시되는 출력 토큰 및 추론 토큰을 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다. |
아니오 | |
병렬 도구 호출 | boolean | 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다. |
아니오 | 진실 |
이전_응답_아이디 | 문자열 | 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. | 아니오 | |
추리 | 이성적 사고 | o 시리즈 모델만 추론 모델에 대한 구성 옵션입니다. |
아니오 | |
store | boolean | API를 통해 나중에 검색할 수 있도록 생성된 모델 응답을 저장할지 여부입니다. |
아니오 | 진실 |
스트림 | boolean | true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다. | 아니오 | 거짓 |
문자 메시지 | 객체 | 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요: - 텍스트 입력 및 출력 - 구조적 출력 |
아니오 | |
└─ 형식 | TextResponseFormatConfiguration | 모델이 출력해야 하는 형식을 지정하는 개체입니다. 구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.gpt-4o 및 최신 모델에는 권장되지 않습니다. { "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다. |
아니오 | |
도구_선택 | ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction | 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다. |
아니오 | |
도구들 | array | 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다. - 기본 제공 도구 |
아니오 | |
truncation | 열거형 | 모델 응답에 사용할 잘림 전략입니다. - auto : 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하면 모델은 컨텍스트를 잘라낸다. 는 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞도록 응답합니다. - disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.가능한 값: auto disabled |
아니오 |
DoubleClick
두 번 클릭 동작입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트 유형을 지정합니다. 두 번 클릭 작업의 경우 이 속성은 항상 .로 설정됩니다 double_click .가능한 값: double_click |
예 | |
x | integer | 두 번 클릭이 발생한 x 좌표입니다. |
예 | |
y | integer | 이중 클릭이 발생한 y 좌표입니다. |
예 |
Drag
끌기 작업입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
길 | array | 끌기 동작의 경로를 나타내는 좌표 배열입니다. 좌표는 개체의 배열로 표시됩니다( 예:[{ x: 100, y: 200 }, { x: 200, y: 300 }] |
예 | |
유형 | enum | 이벤트 유형을 지정합니다. 끌기 작업의 경우 이 속성은 항상 .로 설정됩니다 drag .가능한 값: drag |
예 |
쉬운 입력 메시지
계층 구조 다음 명령을 나타내는 역할이 있는 모델에 대한 메시지 입력입니다. developer
역할 또는 system
역할과 함께 제공된 지침은 user
역할과 함께 제공된 지침보다 우선합니다. 역할이 있는 assistant
메시지는 이전 상호 작용에서 모델에 의해 생성된 것으로 추정됩니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 문자열 또는 InputMessageContentList | 응답을 생성하는 데 사용되는 모델에 대한 텍스트, 이미지 또는 오디오 입력입니다. 이전 도우미 응답을 포함할 수도 있습니다. |
예 | |
역할 | enum | 메시지 입력의 역할입니다. user , assistant , system 또는 developer 중 하나입니다.가능한 값: user , assistant , system developer |
예 | |
유형 | enum | 메시지 입력의 형식입니다. 항상 message 입니다.가능한 값: message |
아니오 |
FileCitation
파일에 대한 인용입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
file_id | 문자열 | 파일의 ID입니다. |
예 | |
인덱스 | integer | 파일 목록에 있는 파일의 인덱스입니다. |
예 | |
유형 | enum | 파일 인용의 형식입니다. 항상 file_citation 입니다.가능한 값: file_citation |
예 |
FilePath
파일의 경로입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
file_id | 문자열 | 파일의 ID입니다. |
예 | |
인덱스 | integer | 파일 목록에 있는 파일의 인덱스입니다. |
예 | |
유형 | enum | 파일 경로의 형식입니다. 항상 file_path 입니다.가능한 값: file_path |
예 |
FileSearchRanker
파일 검색에 사용할 순위입니다. 지정하지 않으면 auto
순위 결정기를 사용합니다.
재산 | 가치 |
---|---|
설명 | 파일 검색에 사용할 순위입니다. 지정하지 않으면 auto 순위 결정기를 사용합니다. |
유형 | 문자열 |
값 | auto default_2024_08_21 |
파일검색도구
업로드된 파일에서 관련 콘텐츠를 검색하는 도구입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filters | ComparisonFilter 또는 CompoundFilter | 파일 특성에 따라 적용할 필터입니다. | 아니오 | |
결과_최대수량 (max_num_results) | integer | 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다. |
아니오 | |
랭킹 옵션 | 객체 | 검색에 대한 순위 옵션입니다. | 아니오 | |
└─ ranker | enum | 파일 검색에 사용할 순위입니다. 가능한 값: auto default-2024-11-15 |
아니오 | |
└점수 임계값 | 숫자 | 파일 검색의 점수 임계값으로, 0에서 1 사이의 숫자입니다. 1에 가까운 숫자는 가장 관련성이 큰 결과만 반환하려고 시도하지만 더 적은 결과를 반환할 수 있습니다. |
아니오 | 0 |
유형 | enum | 파일 검색 도구의 형식입니다. 항상 file_search 입니다.가능한 값: file_search |
예 | |
vector_store_ids | array | 검색할 벡터 저장소의 ID입니다. |
예 |
FileSearchToolCall (파일 검색 도구 호출)
파일 검색 도구 호출의 결과입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
아이디 | 문자열 | 파일 검색 도구 호출의 고유 ID입니다. |
예 | |
쿼리 | array | 파일을 검색하는 데 사용되는 쿼리입니다. |
예 | |
결과 | array | 파일 검색 도구 호출의 결과입니다. |
아니오 | |
상태 | enum | 파일 검색 도구 호출의 상태입니다. in_progress , searching , incomplete 또는 failed 중 하나가능한 값: in_progress , searching , completed , incomplete failed |
예 | |
유형 | enum | 파일 검색 도구 호출의 형식입니다. 항상 file_search_call 입니다.가능한 값: file_search_call |
예 |
펑션툴 (FunctionTool)
모델에서 호출하도록 선택할 수 있는 함수를 사용자 고유의 코드로 정의합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 함수에 대한 설명입니다. 모델에서 함수를 호출할지 여부를 결정하는 데 사용됩니다. |
아니오 | |
이름 | 문자열 | 호출할 함수의 이름입니다. |
예 | |
매개 변수 | 객체 | 함수의 매개 변수를 설명하는 JSON 스키마 개체입니다. |
예 | |
엄격한 | boolean | 엄격한 매개 변수 유효성 검사를 적용할지 여부입니다. 기본값 true . |
예 | |
유형 | enum | 함수 도구의 형식입니다. 항상 function 입니다.가능한 값: function |
예 |
FunctionToolCall
함수를 실행하는 도구 호출입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
논쟁들 | 문자열 | 함수에 전달할 인수의 JSON 문자열입니다. |
예 | |
call_id | 문자열 | 모델에서 생성된 함수 도구 호출의 고유 ID입니다. |
예 | |
아이디 | 문자열 | 함수 도구 호출의 고유 ID입니다. |
예 | |
이름 | 문자열 | 실행할 함수의 이름입니다. |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 함수 도구 호출의 형식입니다. 항상 function_call 입니다.가능한 값: function_call |
예 |
FunctionToolCallOutput
함수 도구 호출의 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
call_id | 문자열 | 모델에서 생성된 함수 도구 호출의 고유 ID입니다. |
예 | |
아이디 | 문자열 | 함수 도구 호출 출력의 고유 ID입니다. 이 항목이 API를 통해 반환될 때 채워집니다. |
아니오 | |
출력 | 문자열 | 함수 도구 호출 출력의 JSON 문자열입니다. |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 함수 도구 호출 출력의 형식입니다. 항상 function_call_output 입니다.가능한 값: function_call_output |
예 |
FunctionToolCallOutputResource
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
call_id | 문자열 | 모델에서 생성된 함수 도구 호출의 고유 ID입니다. |
예 | |
아이디 | 문자열 | 함수 호출 도구 출력의 고유 ID입니다. |
예 | |
출력 | 문자열 | 함수 도구 호출 출력의 JSON 문자열입니다. |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 함수 도구 호출 출력의 형식입니다. 항상 function_call_output 입니다.가능한 값: function_call_output |
예 |
includable
모델 응답에 포함할 추가 출력 데이터를 지정합니다. 현재 지원되는 값은 다음과 같습니다.
file_search_call.results
: 파일 검색 도구 호출의 검색 결과를 포함합니다.message.input_image.image_url
: 입력 메시지의 이미지 URL을 포함합니다.computer_call_output.output.image_url
: 컴퓨터 호출 출력의 이미지 URL을 포함합니다.
재산 | 가치 |
---|---|
설명 | 모델 응답에 포함할 추가 출력 데이터를 지정합니다. 현재 지원되는 값은 다음과 같습니다. - file_search_call.results : 파일 검색 도구 호출의 검색 결과를 포함합니다.- message.input_image.image_url : 입력 메시지의 이미지 URL을 포함합니다.- computer_call_output.output.image_url : 컴퓨터 호출 출력의 이미지 URL을 포함합니다. |
유형 | 문자열 |
값 | file_search_call.results message.input_image.image_url computer_call_output.output.image_url |
InputAudio
모델에 대한 오디오 입력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | 문자열 | Base64로 인코딩된 오디오 데이터입니다. |
예 | |
포맷 | enum | 오디오 데이터의 형식입니다. 현재 지원되는 형식은 다음과 같습니다 mp3 wav .가능한 값: mp3 wav |
예 | |
유형 | enum | 입력 항목의 형식입니다. 항상 input_audio 입니다.가능한 값: input_audio |
예 |
입력 내용
이 구성 요소는 다음 중 하나일 수 있습니다.
입력 파일
모델에 대한 파일 입력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
파일_데이터 | 문자열 | 모델로 보낼 파일의 콘텐츠입니다. |
아니오 | |
file_id | 문자열 | 모델로 보낼 파일의 ID입니다. |
아니오 | |
파일 이름 | 문자열 | 모델로 보낼 파일의 이름입니다. |
아니오 | |
유형 | enum | 입력 항목의 형식입니다. 항상 input_file 입니다.가능한 값: input_file |
예 |
InputImage
모델에 대한 이미지 입력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
세부사항 | enum | 모델에 보낼 이미지의 세부 수준입니다. high , low 또는 auto 중 하나입니다. 기본값은 auto 입니다.가능한 값: high , low auto |
예 | |
file_id | 문자열 | 모델로 보낼 파일의 ID입니다. |
아니오 | |
image_url | 문자열 | 모델로 보낼 이미지의 URL입니다. 데이터 URL의 정규화된 URL 또는 base64로 인코딩된 이미지입니다. |
아니오 | |
유형 | enum | 입력 항목의 형식입니다. 항상 input_image 입니다.가능한 값: input_image |
예 |
입력항목
이 구성 요소는 다음 중 하나일 수 있습니다.
입력메시지
계층 구조 다음 명령을 나타내는 역할이 있는 모델에 대한 메시지 입력입니다. developer
역할 또는 system
역할과 함께 제공된 지침은 user
역할과 함께 제공된 지침보다 우선합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 입력메시지콘텐츠리스트 | 다른 콘텐츠를 포함하는 모델에 대한 하나 이상의 입력 항목 목록 형식을 포함합니다. |
예 | |
역할 | enum | 메시지 입력의 역할입니다. user , system 또는 developer 중 하나입니다.가능한 값: user , system developer |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 메시지 입력의 형식입니다. 항상 message 로 설정하세요.가능한 값: message |
아니오 |
입력메시지콘텐츠목록
다양한 콘텐츠 형식을 포함하는 모델에 대한 하나 이상의 입력 항목 목록입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
입력메시지자원
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | 입력메시지콘텐츠리스트 | 다른 콘텐츠를 포함하는 모델에 대한 하나 이상의 입력 항목 목록 형식을 포함합니다. |
예 | |
아이디 | 문자열 | 메시지 입력의 고유 ID입니다. |
예 | |
역할 | enum | 메시지 입력의 역할입니다. user , system 또는 developer 중 하나입니다.가능한 값: user , system developer |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 메시지 입력의 형식입니다. 항상 message 로 설정하세요.가능한 값: message |
아니오 |
입력 텍스트
모델에 대한 텍스트 입력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 문자열 | 모델에 대한 텍스트 입력입니다. |
예 | |
유형 | enum | 입력 항목의 형식입니다. 항상 input_text 입니다.가능한 값: input_text |
예 |
항목
응답을 생성하는 데 사용되는 콘텐츠 항목입니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
- InputMessage
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- 컴퓨터 도구 호출 출력
- FunctionToolCall
- FunctionToolCallOutput
- 추론 항목
ItemReference
참조할 항목의 내부 식별자입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
아이디 | 문자열 | 참조할 항목의 ID입니다. |
예 | |
유형 | enum | 참조할 항목의 형식입니다. 항상 item_reference 입니다.가능한 값: item_reference |
예 |
아이템리소스
응답을 생성하는 데 사용되는 콘텐츠 항목입니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
- InputMessageResource
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutputResource
- FunctionToolCall
- FunctionToolCallOutputResource
KeyPress
모델이 수행하려는 키 프레스의 컬렉션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
열쇠 | array | 모델이 누르도록 요청하는 키 조합입니다. 각각 키를 나타내는 문자열 배열입니다. |
예 | |
유형 | enum | 이벤트 유형을 지정합니다. 키 프레스 작업의 경우 이 속성은 항상 .로 설정됩니다 keypress .가능한 값: keypress |
예 |
메타데이터
개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다.
키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
모델 응답 속성
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
메타데이터 | 메타데이터 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다. |
아니오 | |
model | 문자열 | 응답을 생성하는 데 사용되는 모델입니다. | 아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
아니오 | 1 |
사용자 | 문자열 | 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. . |
아니오 |
움직이다
마우스 이동 동작입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트 유형을 지정합니다. 이동 작업의 경우 이 속성은 항상 .로 설정됩니다 move .가능한 값: move |
예 | |
x | 정수 | 이동할 x 좌표입니다. |
예 | |
y | 정수 | 이동할 y 좌표입니다. |
예 |
OutputAudio
모델의 오디오 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | 문자열 | 모델의 Base64로 인코딩된 오디오 데이터입니다. |
예 | |
transcript | 문자열 | 모델의 오디오 데이터 대본입니다. |
예 | |
유형 | enum | 출력 오디오의 형식입니다. 항상 output_audio 입니다.가능한 값: output_audio |
예 |
출력내용
이 구성 요소는 다음 중 하나일 수 있습니다.
출력 항목
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
조치 | ComputerAction | 예 | ||
논쟁들 | 문자열 | 함수에 전달할 인수의 JSON 문자열입니다. |
예 | |
call_id | 문자열 | 출력을 사용하여 도구 호출에 응답할 때 사용되는 식별자입니다. |
예 | |
내용 | array | 추론 텍스트 내용입니다. |
예 | |
아이디 | 문자열 | 추론 콘텐츠의 고유 식별자입니다. |
예 | |
이름 | 문자열 | 실행할 함수의 이름입니다. |
예 | |
대기 중인 안전 검사 | array | 보류 중인 보안 검사에서 컴퓨터 호출을 확인합니다. |
예 | |
쿼리 | array | 파일을 검색하는 데 사용되는 쿼리입니다. |
예 | |
결과 | array | 파일 검색 도구 호출의 결과입니다. |
아니오 | |
역할 | enum | 출력 메시지의 역할입니다. 항상 assistant 입니다.가능한 값: assistant |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
예 | |
유형 | enum | 개체의 유형. 항상 reasoning 입니다.가능한 값: reasoning |
예 |
출력 메시지
모델의 출력 메시지입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | array | 출력 메시지의 내용입니다. |
예 | |
아이디 | 문자열 | 출력 메시지의 고유 ID입니다. |
예 | |
역할 | enum | 출력 메시지의 역할입니다. 항상 assistant 입니다.가능한 값: assistant |
예 | |
상태 | 열거형 | 메시지 입력의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
예 | |
유형 | enum | 출력 메시지의 형식입니다. 항상 message 입니다.가능한 값: message |
예 |
출력 텍스트
모델의 텍스트 출력입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
주석 | array | 텍스트 출력의 주석입니다. |
예 | |
문자 메시지 | 문자열 | 모델의 텍스트 출력입니다. |
예 | |
유형 | enum | 출력 텍스트의 형식입니다. 항상 output_text 입니다.가능한 값: output_text |
예 |
실시간 세션 생성 요청
실시간 세션 개체 구성입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력 오디오 형식 | enum | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.pcm16 의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
input_audio_noise_reduction | 객체 | 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다. 오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다. |
아니오 | |
└─ 형식 | enum | 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.가능한 값: near_field far_field |
아니오 | |
input_audio_transcription | 객체 | 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null 로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 전사 엔드포인트를 통해 비동기적으로 실행되며 모델이 들은 정확한 내용이라기보다 입력 오디오 콘텐츠의 지침으로 취급해야 합니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다. |
아니오 | |
└) 언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1(예: en 형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. |
아니오 | |
└─ model | 문자열 | 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe , gpt-4o-mini-transcribe 및 whisper-1 입니다. |
아니오 | |
└) 프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.whisper-1 은 프롬프트가 키워드 목록입니다.모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대"). |
아니오 | |
지침 | 문자열 | 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친숙한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다. 서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다. |
아니오 | |
최대 응답 출력 토큰 | 정수 또는 문자열 | 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf 입니다. |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
model | 문자열 | 이 세션에 사용되는 배포의 이름입니다. |
아니오 | |
출력_오디오_포맷 | enum | 출력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.출력 pcm16 오디오는 24kHz 속도로 샘플링됩니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
온도 | 숫자 | 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 오디오 모델의 경우 최상의 성능을 위해 0.8의 온도를 사용하는 것이 좋습니다. |
아니오 | 0.8 |
도구_선택 | 문자열 | 모델이 도구를 선택하는 방법입니다. 옵션은 auto , none , required 또는 함수를 지정하십시오. |
아니오 | auto |
도구들 | array | 모델에서 사용할 수 있는 도구(함수)입니다. | 아니오 | |
회전 감지 | 객체 | 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. 의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다. |
아니오 | |
└ 생성_응답 | boolean | VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. |
아니오 | 진실 |
└) 열망 | enum | semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.가능한 값: low , medium , high auto |
아니오 | |
└interrupt_response | 부울 | VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto )으로 진행 중인 응답을 자동으로 중단할지 여부입니다. |
아니오 | 진실 |
└prefix_padding_ms | integer | server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | enum | 턴 감지 유형입니다. 가능한 값: server_vad semantic_vad |
아니오 | |
목소리 | VoiceIdsShared | 아니오 |
RealtimeSessionCreateResponse
임시 키가 있는 새 실시간 세션 구성입니다. 키의 기본 TTL은 1분입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
클라이언트 비밀번호 | 객체 | API에서 반환된 임시 키입니다. | 예 | |
└─ 만료_시간 | integer | 토큰이 만료되는 시기에 대한 타임스탬프입니다. 현재 모든 토큰은 1분 후에 만료됩니다. |
아니오 | |
└─ value | 문자열 | 클라이언트 환경에서 실시간 API에 대한 연결을 인증하는 데 사용할 수 있는 임시 키입니다. 서버 쪽에서만 사용해야 하는 표준 API 토큰이 아닌 클라이언트 쪽 환경에서 사용합니다. |
아니오 | |
입력 오디오 형식 | 문자열 | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다. |
아니오 | |
input_audio_transcription | 객체 | 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null 로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 Whisper를 통해 비동기적으로 실행되며 모델이 이해하는 표현이 아닌 대략적인 지침으로 취급해야 합니다. |
아니오 | |
└─ model | 문자열 | 전사에 사용할 모델로, 현재 지원되는 유일한 모델은 whisper-1 입니다. |
아니오 | |
지침 | 문자열 | 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친절한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다. 서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다. |
아니오 | |
최대 응답 출력 토큰 | 정수 또는 문자열 | 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf 입니다. |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
출력_오디오_포맷 | 문자열 | 출력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다. |
아니오 | |
온도 | 숫자 | 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 기본값은 0.8입니다. |
아니오 | |
도구_선택 | 문자열 | 모델이 도구를 선택하는 방법입니다. 옵션은 auto , none , required 또는 함수를 지정하십시오. |
아니오 | |
도구들 | array | 모델에서 사용할 수 있는 도구(함수)입니다. | 아니오 | |
회전 감지 | 객체 | 턴 검색을 위한 구성입니다. null 로 설정하면 꺼집니다. 서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. |
아니오 | |
└prefix_padding_ms | integer | VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | 문자열 | 발화 턴 감지 형식으로, 현재 server_vad 만 지원됩니다. |
아니오 | |
목소리 | VoiceIdsShared | 아니오 |
RealtimeTranscriptionSessionCreateRequest
실시간 전사 세션 개체 구성입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
include | 배열 | 전사에 포함할 항목 집합입니다. 현재 사용 가능한 항목은 다음과 같습니다. - item.input_audio_transcription.logprobs |
아니오 | |
입력 오디오 형식 | enum | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다.pcm16 의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.가능한 값: pcm16 , g711_ulaw g711_alaw |
아니오 | |
input_audio_noise_reduction | 객체 | 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다. 오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다. |
아니오 | |
└─ 형식 | enum | 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.가능한 값: near_field far_field |
아니오 | |
input_audio_transcription | 객체 | 입력 오디오 전사에 대한 구성입니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다. |
아니오 | |
└) 언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1(예: en 형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. |
아니오 | |
└─ model | 열거형 | 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe , gpt-4o-mini-transcribe 및 whisper-1 입니다.가능한 값: gpt-4o-transcribe , gpt-4o-mini-transcribe whisper-1 |
아니오 | |
└) 프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.whisper-1 은 프롬프트가 키워드 목록입니다.모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대"). |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
회전 감지 | 객체 | 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. 의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다. |
아니오 | |
└ 생성_응답 | boolean | VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. 전사 세션에는 사용할 수 없습니다. |
아니오 | 진실 |
└) 열망 | enum | semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.가능한 값: low , medium , high auto |
아니오 | |
└interrupt_response | 부울 | VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto )으로 진행 중인 응답을 자동으로 중단할지 여부입니다. 전사 세션에는 사용할 수 없습니다. |
아니오 | 진실 |
└prefix_padding_ms | integer | server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | enum | 턴 감지 유형입니다. 가능한 값: server_vad semantic_vad |
아니오 |
RealtimeTranscriptionSessionCreateResponse
새 실시간 전사 세션 구성입니다.
REST API를 통해 서버에서 세션을 만들 때 세션 개체에는 임시 키도 포함됩니다. 키의 기본 TTL은 1분입니다. WebSocket API를 통해 세션을 업데이트할 때는 이 속성이 없습니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
클라이언트 비밀번호 | 객체 | API에서 반환된 임시 키입니다. REST API를 통해 서버에서 세션이 만들어지는 경우에만 존재합니다. |
예 | |
└─ 만료_시간 | integer | 토큰이 만료되는 시기에 대한 타임스탬프입니다. 현재 모든 토큰은 1분 후에 만료됩니다. |
아니오 | |
└─ value | 문자열 | 클라이언트 환경에서 실시간 API에 대한 연결을 인증하는 데 사용할 수 있는 임시 키입니다. 서버 쪽에서만 사용해야 하는 표준 API 토큰이 아닌 클라이언트 쪽 환경에서 사용합니다. |
아니오 | |
입력 오디오 형식 | 문자열 | 입력 오디오의 형식입니다. 옵션은 pcm16 , g711_ulaw 또는 g711_alaw 입니다. |
아니오 | |
input_audio_transcription | 객체 | 전사 모델의 구성입니다. |
아니오 | |
└) 언어 | 문자열 | 입력 오디오의 언어입니다. ISO-639-1(예: en 형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. |
아니오 | |
└─ model | 열거형 | 전사에 사용할 모델입니다. gpt-4o-transcribe , gpt-4o-mini-transcribe 또는 whisper-1 일 수 있습니다.가능한 값: gpt-4o-transcribe , gpt-4o-mini-transcribe whisper-1 |
아니오 | |
└) 프롬프트 | 문자열 | 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다. |
아니오 | |
형식 | 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다. |
아니오 | ||
회전 감지 | 객체 | 턴 검색을 위한 구성입니다. null 로 설정하면 꺼집니다. 서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다. |
아니오 | |
└prefix_padding_ms | integer | VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다. |
아니오 | |
└침묵 지속 시간(ms) silence_duration_ms | integer | 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다. |
아니오 | |
└) 임계값 | 숫자 | VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다. |
아니오 | |
└─ 형식 | 문자열 | 발화 턴 감지 형식으로, 현재 server_vad 만 지원됩니다. |
아니오 |
논리적 사고
o 시리즈 모델만
추론 모델에 대한 구성 옵션입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
노력 | 추론 노력 | o 시리즈 모델만 추론 모델에서 추론 작업을 제한합니다. 현재 지원되는 값은 low , medium 및 high 입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다. |
예 | 중간 |
요약 | enum | o 시리즈 모델만 모델에서 수행하는 추론에 대한 요약입니다. 이는 모델의 추론 프로세스를 디버깅하고 이해하는 데 유용할 수 있습니다. concise 또는 detailed 중 하나입니다.가능한 값: concise detailed |
아니오 |
추리 항목
응답을 생성하는 동안 추론 모델에서 사용하는 생각 체인에 대한 설명입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
내용 | array | 추론 텍스트 내용입니다. |
예 | |
아이디 | 문자열 | 추론 콘텐츠의 고유 식별자입니다. |
예 | |
상태 | 열거형 | 항목의 상태입니다. in_progress , completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.가능한 값: in_progress , completed incomplete |
아니오 | |
유형 | enum | 개체의 유형. 항상 reasoning 입니다.가능한 값: reasoning |
예 |
거절
모델의 거부입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
거절 | 문자열 | 모델의 거부 설명입니다. |
예 | |
유형 | enum | 거부의 유형입니다. 항상 refusal 입니다.가능한 값: refusal |
예 |
응답
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
created_at | 숫자 | 이 응답을 만든 시점의 Unix 타임스탬프(초)입니다. |
예 | |
오류 | ResponseError | 모델이 응답을 생성하지 못할 때 반환되는 오류 개체입니다. |
예 | |
아이디 | 문자열 | 이 응답의 고유 식별자입니다. |
예 | |
불완전한 세부사항 | 객체 | 응답이 불완전한 이유에 대한 세부 정보입니다. |
예 | |
└) 이유 | enum | 응답이 불완전한 이유입니다. 가능한 값: max_output_tokens content_filter |
아니오 | |
지침 | 문자열 | 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다. 함께 previous_response_id 사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다. |
예 | |
최대 출력 토큰 | integer | 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다. |
아니오 | |
메타데이터 | 메타데이터 | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다. |
예 | |
model | 문자열 | 응답을 생성하는 데 사용되는 모델입니다. | 예 | |
객체 | enum | 이 리소스의 개체 유형은 항상 response 로 설정됩니다.가능한 값: response |
예 | |
출력 | array | 모델에서 생성된 콘텐츠 항목의 배열입니다. - 배열의 항목 output 길이와 순서는 모델의 응답에 따라 달라집니다.- 배열의 첫 번째 항목에 접근하여 그것을 모델에서 생성한 콘텐츠가 포함된 메시지라고 가정하는 대신, SDK에서 지원되는 속성을 사용하는 것이 좋습니다. |
예 | |
출력_텍스트 | 문자열 | SDK 전용 편의 속성으로, output_text 배열에 있는 모든 output 항목이 포함된 경우 해당 항목의 집계된 텍스트 출력을 포함합니다. Python 및 JavaScript SDK에서 지원됩니다. |
아니오 | |
병렬 도구 호출 | boolean | 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다. |
예 | 진실 |
이전_응답_아이디 | 문자열 | 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. | 아니오 | |
추리 | 이성적 사고 | o 시리즈 모델만 추론 모델에 대한 구성 옵션입니다. |
아니오 | |
상태 | enum | 응답 생성의 상태입니다. completed , failed , in_progress 또는 incomplete 중 하나입니다.가능한 값: completed , failed , in_progress incomplete |
아니오 | |
온도 | 숫자 | 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다. |
예 | 1 |
문자 메시지 | 객체 | 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요: - 텍스트 입력 및 출력 - 구조적 출력 |
아니오 | |
└─ 형식 | TextResponseFormatConfiguration | 모델이 출력해야 하는 형식을 지정하는 개체입니다. 구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.gpt-4o 및 최신 모델에는 권장되지 않습니다. { "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다. |
아니오 | |
도구_선택 | ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction | 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다. |
예 | |
도구들 | array | 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다. - 기본 제공 도구 |
예 | |
top_p | 숫자 | 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다. 일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다. |
예 | 1 |
truncation | 열거형 | 모델 응답에 사용할 잘림 전략입니다. - auto : 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다. - disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.가능한 값: auto disabled |
아니오 | |
사용량 | ResponseUsage | 입력 토큰, 출력 토큰, 출력 토큰 분석 및 사용된 총 토큰을 포함한 토큰 사용량 세부 정보를 나타냅니다. |
아니오 | |
사용자 | 문자열 | 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. . |
아니오 |
ResponseAudioDeltaEvent
부분 오디오 응답이 있을 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 문자열 | Base64로 인코딩된 응답 오디오 바이트의 청크입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.audio.delta 입니다.가능한 값: response.audio.delta |
예 |
ResponseAudioDoneEvent
오디오 응답이 완료되면 내보냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트의 형식입니다. 항상 response.audio.done 입니다.가능한 값: response.audio.done |
예 |
ResponseAudioTranscriptDeltaEvent
오디오의 부분 대본이 있을 때 내보냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 문자열 | 오디오 응답의 부분 대본입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.audio.transcript.delta 입니다.가능한 값: response.audio.transcript.delta |
예 |
ResponseAudioTranscriptDoneEvent
전체 오디오 대본이 완료될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트의 형식입니다. 항상 response.audio.transcript.done 입니다.가능한 값: response.audio.transcript.done |
예 |
ResponseCodeInterpreterCallCodeDeltaEvent
코드 인터프리터에서 부분 코드 조각을 추가할 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 문자열 | 코드 인터프리터가 추가한 부분 코드 조각입니다. |
예 | |
출력 인덱스 | integer | 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.code_interpreter_call.code.delta 입니다.가능한 값: response.code_interpreter_call.code.delta |
예 |
ResponseCodeInterpreterCallCodeDoneEvent
코드 조각 출력이 코드 인터프리터에 의해 종료될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | 문자열 | 코드 인터프리터의 최종 코드 조각 출력입니다. |
예 | |
출력 인덱스 | integer | 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.code_interpreter_call.code.done 입니다.가능한 값: response.code_interpreter_call.code.done |
예 |
ResponseCodeInterpreterCallCompletedEvent
코드 인터프리터 호출이 완료되면 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드_인터프리터_호출 | CodeInterpreterToolCall | 코드를 실행하는 도구 호출입니다. |
예 | |
출력 인덱스 | integer | 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.code_interpreter_call.completed 입니다.가능한 값: response.code_interpreter_call.completed |
예 |
ResponseCodeInterpreterCallInProgressEvent
코드 인터프리터 호출이 진행 중일 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드_인터프리터_호출 | CodeInterpreterToolCall | 코드를 실행하는 도구 호출입니다. |
예 | |
출력 인덱스 | integer | 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.code_interpreter_call.in_progress 입니다.가능한 값: response.code_interpreter_call.in_progress |
예 |
ResponseCodeInterpreterCallInterpretingEvent
코드 인터프리터가 코드 조각을 적극적으로 해석할 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드_인터프리터_호출 | CodeInterpreterToolCall | 코드를 실행하는 도구 호출입니다. |
예 | |
출력 인덱스 | integer | 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.code_interpreter_call.interpreting 입니다.가능한 값: response.code_interpreter_call.interpreting |
예 |
응답완료이벤트
모델 응답이 완료되면 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
응답 | 응답 | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.completed 입니다.가능한 값: response.completed |
예 |
ResponseContentPartAddedEvent
새 콘텐츠 파트가 추가될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 추가된 콘텐츠 파트의 인덱스입니다. |
예 | |
항목_아이디 | 문자열 | 콘텐츠 파트가 추가된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 콘텐츠 파트가 추가된 출력 항목의 인덱스입니다. |
예 | |
부분 | OutputContent | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.content_part.added 입니다.가능한 값: response.content_part.added |
예 |
ResponseContentPartDoneEvent
콘텐츠 파트가 완료되면 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 완료된 콘텐츠 파트의 인덱스입니다. |
예 | |
항목_아이디 | 문자열 | 콘텐츠 파트가 추가된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 콘텐츠 파트가 추가된 출력 항목의 인덱스입니다. |
예 | |
부분 | OutputContent | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.content_part.done 입니다.가능한 값: response.content_part.done |
예 |
ResponseCreatedEvent
응답을 만들 때 내보내는 이벤트입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
응답 | 응답 | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.created 입니다.가능한 값: response.created |
예 |
응답 오류
모델이 응답을 생성하지 못할 때 반환되는 오류 개체입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | ResponseErrorCode | 응답에 대한 오류 코드입니다. |
예 | |
메시지 | 문자열 | 사람이 읽을 수 있는 오류 설명입니다. |
예 |
응답 오류 코드
응답에 대한 오류 코드입니다.
재산 | 가치 |
---|---|
설명 | 응답에 대한 오류 코드입니다. |
유형 | 문자열 |
값 | server_error rate_limit_exceeded invalid_prompt vector_store_timeout invalid_image invalid_image_format invalid_base64_image invalid_image_url image_too_large image_too_small image_parse_error image_content_policy_violation invalid_image_mode image_file_too_large unsupported_image_media_type empty_image_file failed_to_download_image image_file_not_found |
응답 오류 이벤트
오류가 발생할 때 내보냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
코드 | 문자열 | 오류 코드입니다. |
예 | |
메시지 | 문자열 | 오류 메시지입니다. |
예 | |
param | 문자열 | 오류 매개 변수입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 error 입니다.가능한 값: error |
예 |
응답 실패 이벤트
응답이 실패할 때 내보내는 이벤트입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
응답 | 응답 | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.failed 입니다.가능한 값: response.failed |
예 |
ResponseFileSearchCallCompletedEvent
파일 검색 호출이 완료될 때 내보내집니다(결과를 찾은 경우).
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
항목_아이디 | 문자열 | 파일 검색 호출이 시작되는 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 파일 검색 호출이 시작되는 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.file_search_call.completed 입니다.가능한 값: response.file_search_call.completed |
예 |
ResponseFileSearchCallInProgressEvent
파일 검색 호출이 시작될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
항목_아이디 | 문자열 | 파일 검색 호출이 시작되는 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 파일 검색 호출이 시작되는 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.file_search_call.in_progress 입니다.가능한 값: response.file_search_call.in_progress |
예 |
ResponseFileSearchCallSearchingEvent
파일 검색이 현재 검색 중일 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
항목_아이디 | 문자열 | 파일 검색 호출이 시작되는 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 파일 검색 호출에서 검색하는 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.file_search_call.searching 입니다.가능한 값: response.file_search_call.searching |
예 |
ResponseFunctionCallArgumentsDeltaEvent
부분 함수 호출 인수 델타가 있을 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
델타 | 문자열 | 추가되는 함수 호출 인수 델타입니다. |
예 | |
항목_아이디 | 문자열 | 함수 호출 인수 델타가 추가되는 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 함수 호출 인수 델타가 추가되는 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.function_call_arguments.delta 입니다.가능한 값: response.function_call_arguments.delta |
예 |
ResponseFunctionCallArgumentsDoneEvent
함수 호출 인수가 종료될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
논쟁들 | 문자열 | 함수 호출 인수입니다. | 예 | |
항목_아이디 | 문자열 | 항목의 ID입니다. | 예 | |
출력 인덱스 | integer | 출력 항목의 인덱스입니다. | 예 | |
유형 | enum | 가능한 값: response.function_call_arguments.done |
예 |
ResponseInProgressEvent
응답이 진행 중일 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
응답 | 응답 | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.in_progress 입니다.가능한 값: response.in_progress |
예 |
ResponseIncompleteEvent
응답이 완료되지 않은 것으로 완료될 때 내보내지는 이벤트입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
응답 | 응답 | 예 | ||
유형 | enum | 이벤트의 형식입니다. 항상 response.incomplete 입니다.가능한 값: response.incomplete |
예 |
응답항목목록
응답 항목 목록입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 이 응답을 생성하는 데 사용되는 항목 목록입니다. | 예 | |
첫번째_아이디 | 문자열 | 목록의 첫 번째 항목 ID입니다. | 예 | |
has_more | boolean | 사용할 수 있는 항목이 더 있는지 여부입니다. | 예 | |
마지막 아이디 | 문자열 | 목록의 마지막 항목 ID입니다. | 예 | |
객체 | enum | 반환되는 개체의 형식은 list 이어야 합니다.가능한 값: list |
예 |
반응 방식
모델이 생성하도록 할 출력 형식. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.
["text"]
gpt-4o-audio-preview
모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.
["text", "audio"]
이 구성 요소에 대해 정의된 속성이 없습니다.
응답 양식(텍스트 전용)
모델이 생성하도록 할 출력 형식. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.
["text"]
이 API는 곧 오디오 및 이미지를 포함한 다른 출력 형식을 지원합니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
응답출력항목추가이벤트
새 출력 항목이 추가될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
물품 | OutputItem | 예 | ||
출력 인덱스 | integer | 추가된 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_item.added 입니다.가능한 값: response.output_item.added |
예 |
응답출력항목완료이벤트
출력 항목이 완료된 것으로 표시될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
물품 | OutputItem | 예 | ||
출력 인덱스 | integer | 완료된 것으로 표시된 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_item.done 입니다.가능한 값: response.output_item.done |
예 |
ResponseProperties
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
지침 | 문자열 | 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다. 함께 previous_response_id 사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다. |
아니오 | |
최대 출력 토큰 | integer | 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다. |
아니오 | |
이전_응답_아이디 | 문자열 | 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. | 아니오 | |
추리 | 이성적 사고 | o 시리즈 모델만 추론 모델에 대한 구성 옵션입니다. |
아니오 | |
문자 메시지 | 객체 | 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요: - 텍스트 입력 및 출력 - 구조적 출력 |
아니오 | |
└─ 형식 | TextResponseFormatConfiguration | 모델이 출력해야 하는 형식을 지정하는 개체입니다. 구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.gpt-4o 및 최신 모델에는 권장되지 않습니다. { "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다. |
아니오 | |
도구_선택 | ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction | 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다. |
아니오 | |
도구들 | array | 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다. - 기본 제공 도구 |
아니오 | |
truncation | 열거형 | 모델 응답에 사용할 잘림 전략입니다. - auto : 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다. - disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.가능한 값: auto disabled |
아니오 |
ResponseRefusalDeltaEvent
부분 거부 텍스트가 있을 때 내보냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 거부 텍스트가 추가되는 콘텐츠 부분의 인덱스입니다. |
예 | |
델타 | 문자열 | 추가되는 거부 텍스트입니다. |
예 | |
항목_아이디 | 문자열 | 거부 텍스트가 추가되는 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 거부 텍스트가 추가되는 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.refusal.delta 입니다.가능한 값: response.refusal.delta |
예 |
응답거부완료이벤트
거부 텍스트가 종료될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 거부 텍스트가 완료된 콘텐츠 부분의 인덱스입니다. |
예 | |
항목_아이디 | 문자열 | 거부 텍스트가 완료된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 거부 텍스트가 완료된 출력 항목의 인덱스입니다. |
예 | |
거절 | 문자열 | 최종 거부 텍스트입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.refusal.done 입니다.가능한 값: response.refusal.done |
예 |
responseStreamEvent
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
annotation | Annotation | 예 | ||
annotation_index | integer | 추가된 주석의 인덱스입니다. |
예 | |
논쟁들 | 문자열 | 함수 호출 인수입니다. | 예 | |
코드 | 문자열 | 오류 코드입니다. |
예 | |
코드_인터프리터_호출 | CodeInterpreterToolCall | 코드를 실행하는 도구 호출입니다. |
예 | |
콘텐츠_인덱스 | integer | 텍스트 콘텐츠가 종료되는 콘텐츠 부분의 인덱스입니다. |
예 | |
델타 | 문자열 | 추가된 텍스트 델타입니다. |
예 | |
물품 | OutputItem | 완료된 것으로 표시된 출력 항목입니다. |
예 | |
항목_아이디 | 문자열 | 텍스트 콘텐츠가 최종 확정된 출력 항목의 ID입니다. |
예 | |
메시지 | 문자열 | 오류 메시지입니다. |
예 | |
출력 인덱스 | integer | 텍스트가 완성될 때의 출력 항목 인덱스입니다. |
예 | |
param | 문자열 | 오류 매개 변수입니다. |
예 | |
부분 | OutputContent | 완료된 콘텐츠 부분입니다. |
예 | |
거절 | 문자열 | 최종 거부 텍스트입니다. |
예 | |
응답 | 응답 | 불완전한 응답입니다. |
예 | |
문자 메시지 | 문자열 | 최종 확정된 텍스트 콘텐츠입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_text.done 입니다.가능한 값: response.output_text.done |
예 |
ResponseTextAnnotationDeltaEvent
텍스트 주석이 추가될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
annotation | Annotation | 예 | ||
annotation_index | integer | 추가된 주석의 인덱스입니다. |
예 | |
콘텐츠_인덱스 | integer | 텍스트 주석이 추가된 콘텐츠 파트의 인덱스입니다. |
예 | |
항목_아이디 | 문자열 | 텍스트 주석이 추가된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 텍스트 주석이 추가된 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_text.annotation.added 입니다.가능한 값: response.output_text.annotation.added |
예 |
ResponseTextDeltaEvent
추가 텍스트 델타가 있을 때 내보냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 텍스트 델타가 추가된 콘텐츠 부분의 인덱스입니다. |
예 | |
델타 | 문자열 | 추가된 텍스트 델타입니다. |
예 | |
항목_아이디 | 문자열 | 텍스트 델타가 추가된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 텍스트 델타가 추가된 출력 항목의 인덱스입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_text.delta 입니다.가능한 값: response.output_text.delta |
예 |
ResponseTextDoneEvent
텍스트 콘텐츠가 종료될 때 내보내집니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
콘텐츠_인덱스 | integer | 텍스트 콘텐츠가 종료되는 콘텐츠 부분의 인덱스입니다. |
예 | |
항목_아이디 | 문자열 | 텍스트 콘텐츠가 최종 확정된 출력 항목의 ID입니다. |
예 | |
출력 인덱스 | integer | 텍스트가 완성될 때의 출력 항목 인덱스입니다. |
예 | |
문자 메시지 | 문자열 | 최종 확정된 텍스트 콘텐츠입니다. |
예 | |
유형 | enum | 이벤트의 형식입니다. 항상 response.output_text.done 입니다.가능한 값: response.output_text.done |
예 |
ResponseUsage
입력 토큰, 출력 토큰, 출력 토큰 분석 및 사용된 총 토큰을 포함한 토큰 사용량 세부 정보를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
입력_토큰 | integer | 입력 토큰의 수입니다. | 예 | |
출력_토큰 | integer | 출력 토큰의 수입니다. | 예 | |
output_tokens_details | 객체 | 출력 토큰에 대한 자세한 분석입니다. | 예 | |
└─ 추론_토큰 | integer | 추론 토큰의 수입니다. | 아니오 | |
총_토큰 | integer | 사용된 총 토큰 수입니다. | 예 |
스크린샷
스크린샷 작업입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트 유형을 지정합니다. 스크린샷 작업의 경우 이 속성은 항상 .로 설정됩니다 screenshot .가능한 값: screenshot |
예 |
Scroll
스크롤 동작입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
스크롤_엑스 | integer | 가로 스크롤 거리입니다. |
예 | |
scroll_y | integer | 세로 스크롤 거리입니다. |
예 | |
유형 | enum | 이벤트 유형을 지정합니다. 스크롤 작업의 경우 이 속성은 항상 .로 설정됩니다 scroll .가능한 값: scroll |
예 | |
x | integer | 스크롤이 발생한 x 좌표입니다. |
예 | |
y | integer | 스크롤이 발생한 y 좌표입니다. |
예 |
StopConfiguration
API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
텍스트 응답 형식 구성
모델이 출력해야 하는 형식을 지정하는 개체입니다.
구성 { "type": "json_schema" }
은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다.
기본 형식은 { "type": "text" }
추가 옵션이 없습니다.
gpt-4o 및 최신 모델에는 권장되지 않습니다.
{ "type": "json_object" }
이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema
것이 좋습니다.
이 구성 요소는 다음 중 하나일 수 있습니다.
텍스트응답형식JSON스키마
JSON 스키마 응답 형식입니다. 구조적 JSON 응답을 생성하는 데 사용됩니다. 구조적 출력에 대해 자세히 알아봅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
설명 | 문자열 | 응답 형식의 용도에 대한 설명이며, 모델에서 형식으로 응답하는 방법을 결정하는 데 사용됩니다. |
아니오 | |
이름 | 문자열 | 응답 형식의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. |
아니오 | |
schema(스키마) | 응답형식JsonSchemaSchema | JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다. | 예 | |
엄격한 | boolean | 출력을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다. true로 설정하면 모델은 항상 schema 필드에 정의된 정확한 스키마를 따릅니다. strict 가 true 인 경우 JSON 스키마의 하위 집합만 지원됩니다. |
아니오 | 거짓 |
유형 | enum | 정의되는 응답 형식의 유형입니다. 항상 json_schema 입니다.가능한 값: json_schema |
예 |
도구
이 구성 요소는 다음 중 하나일 수 있습니다.
도구 선택 함수
모델을 강제로 특정 함수를 호출하려면 이 옵션을 사용합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
이름 | 문자열 | 호출할 함수의 이름입니다. | 예 | |
유형 | enum | 함수 호출의 경우 형식은 항상 function .입니다.가능한 값: function |
예 |
도구 선택 옵션
모델이 호출하는 도구(있는 경우)를 제어합니다.
none
는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.
auto
는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다.
required
는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다.
재산 | 가치 |
---|---|
설명 | 모델이 호출하는 도구(있는 경우)를 제어합니다.none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.auto 는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다.required 는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. |
유형 | 문자열 |
값 | none auto required |
도구 선택 유형
모델이 기본 제공 도구를 사용하여 응답을 생성해야 임을 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 모델에서 사용해야 하는 호스트된 도구의 형식입니다. 허용되는 값은 다음과 같습니다. - file_search - computer_use_preview 가능한 값: file_search computer_use_preview |
예 |
유형
텍스트에 입력할 작업입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 문자열 | 입력할 텍스트입니다. |
예 | |
유형 | enum | 이벤트 유형을 지정합니다. 형식 작업의 경우 이 속성은 항상 .로 설정됩니다 type .가능한 값: type |
예 |
벡터 저장소 파일 속성 수정 요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
특성 | VectorStoreFileAttributes | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다. |
예 |
URL 인용
모델 응답을 생성하는 데 사용되는 웹 리소스에 대한 인용입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
end_index | integer | 메시지에서 URL 인용의 마지막 문자 인덱스입니다. |
예 | |
start_index | integer | 메시지에서 URL 인용의 첫 번째 문자 인덱스입니다. |
예 | |
제목 | 문자열 | 웹 리소스의 제목입니다. |
예 | |
유형 | enum | URL 인용의 형식입니다. 항상 url_citation 입니다.가능한 값: url_citation |
예 | |
url | 문자열 | 웹 리소스의 URL입니다. |
예 |
VectorStore 파일 속성
개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다.
이 구성 요소에 대해 정의된 속성이 없습니다.
VectorStoreFileContentResponse
벡터 저장소 파일의 구문 분석된 콘텐츠를 나타냅니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 파일의 콘텐츠를 구문 분석했습니다. | 예 | |
has_more | boolean | 가져올 콘텐츠 페이지가 더 있는지를 나타냅니다. | 예 | |
다음_페이지 | 문자열 | 다음 페이지의 토큰(있는 경우)입니다. | 예 | |
객체 | enum | 항상 vector_store.file_content.page 인 개체 형식입니다.가능한 값: vector_store.file_content.page |
예 |
벡터 스토어 검색 요청
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
filters | ComparisonFilter 또는 CompoundFilter | 파일 특성에 따라 적용할 필터입니다. | 아니오 | |
결과_최대수량 (max_num_results) | integer | 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다. | 아니오 | 10 |
문의 | 문자열 또는 배열 | 검색에 대한 쿼리 문자열 | 예 | |
랭킹 옵션 | 객체 | 검색에 대한 순위 옵션입니다. | 아니오 | |
└─ ranker | enum | 가능한 값: auto default-2024-11-15 |
아니오 | |
└점수 임계값 | 숫자 | 아니오 | 0 | |
쿼리 재작성 | boolean | 벡터 검색을 위해 자연어 쿼리를 다시 작성할지 여부입니다. | 아니오 | 거짓 |
벡터 저장소 검색 결과 내용 객체
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
문자 메시지 | 문자열 | 검색에서 반환된 텍스트 콘텐츠입니다. | 예 | |
유형 | enum | 콘텐츠의 형식입니다. 가능한 값: text |
예 |
벡터스토어검색결과항목
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
특성 | VectorStoreFileAttributes | 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다. |
예 | |
내용 | array | 파일에서 가져온 콘텐츠 조각입니다. | 예 | |
file_id | 문자열 | 벡터 저장소 파일의 ID입니다. | 예 | |
파일 이름 | 문자열 | 벡터 저장소 파일의 이름입니다. | 예 | |
score | 숫자 | 결과의 유사성 점수입니다. | 예 |
벡터 저장소 검색 결과 페이지
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | array | 검색 결과 항목의 목록입니다. | 예 | |
has_more | boolean | 가져올 결과가 더 있는지를 나타냅니다. | 예 | |
다음_페이지 | 문자열 | 다음 페이지의 토큰(있는 경우)입니다. | 예 | |
객체 | enum | 항상 vector_store.search_results.page 인 개체 형식입니다.가능한 값: vector_store.search_results.page |
예 | |
검색_쿼리 | array | 예 |
VoiceIdsShared
이 구성 요소에 대해 정의된 속성이 없습니다.
대기
대기 작업입니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
유형 | enum | 이벤트 유형을 지정합니다. 대기 작업의 경우 이 속성은 항상 .로 설정됩니다 wait .가능한 값: wait |
예 |
추론노력
o 시리즈 모델만
추론 모델에서 추론 작업을 제한합니다.
현재 지원되는 값은 low
, medium
및 high
입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.
재산 | 가치 |
---|---|
설명 | o 시리즈 모델만 추론 모델에서 추론 작업을 제한합니다. 현재 지원되는 값은 low , medium 및 high 입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다. |
유형 | 문자열 |
기본값 | 중간 |
값 | low medium high |
errorEvent
오류가 발생하면 발생합니다. 이는 내부 서버 오류 또는 시간 제한으로 인해 발생할 수 있습니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | 오류 | 예 | ||
이벤트 | 문자열 | 예 |
event 열거형: ErrorEventEnum
가치 | 설명 |
---|---|
오류 |
완료된이벤트
스트림이 종료되면 발생합니다.
이름 | 유형 | 설명 | 필수 | 기본값 |
---|---|---|---|---|
데이터 | 문자열 | 예 | ||
이벤트 | 문자열 | 예 |
event 열거형: DoneEventEnum
가치 | 설명 |
---|---|
완료 |
data 열거형: DoneEventDataEnum
가치 | 설명 |
---|---|
[완료] |
다음 단계
모델 및 REST API를 사용한 미세 조정에 대해 알아보세요. Azure OpenAI를 지원하는 기본 모델에 대해 자세히 알아봅니다.