다음을 통해 공유


Azure AI 파운트리 모델 REST API 미리 보기 참조의 Azure OpenAI

이 문서에서는 Azure OpenAI에 대한 유추 REST API 엔드포인트에 대한 세부 정보를 제공합니다.

API 사양

Azure OpenAI 모델 및 리소스 관리 및 상호 작용은 다음 세 가지 기본 API 화면으로 나뉩니다.

  • 제어 평면
  • 데이터 평면 - 작성
  • 데이터 평면 - 유추

각 API 표면/사양은 다른 Azure OpenAI 기능 집합을 캡슐화합니다. 각 API에는 고유한 미리 보기 집합과 안정적인/일반 공급(GA) API 릴리스가 있습니다. 현재 미리 보기 릴리스는 월별 주기를 따르는 경향이 있습니다.

중요합니다

이제 새 미리 보기 유추 API가 있습니다. API 수명 주기 가이드에서 자세히 알아보세요.

응용 프로그램 인터페이스 (API) 최신 미리 보기 릴리스 최신 GA 릴리스 사양 설명
컨트롤 플레인 2024-06-01-preview 2024-10-01 사양 파일 Azure OpenAI는 다른 모든 서비스와 공통 컨트롤 플레인을 공유합니다. 컨트롤 플레인 API는 Azure OpenAI 리소스 만들기, 모델 배포 및 기타 상위 수준 리소스 관리 작업 등에 사용됩니다. 또한 컨트롤 플레인은 Azure Resource Manager, Bicep, Terraform 및 Azure CLI와 같은 기능으로 수행할 수 있는 작업을 제어합니다.
데이터 평면 - 작성 2025-04-01-preview 2024-10-21 사양 파일 데이터 평면 작성 API는 미세 조정, 파일 업로드, 수집 작업, 일괄 처리, 특정 모델 수준 쿼리를 제어합니다.
데이터 평면 - 유추 2025-04-01-preview 2024-10-21 사양 파일 데이터 평면 추론 API는 컴플리션, 채팅 컴플리션, 임베딩, 오디오, 사용자의 데이터, Dall-e, 어시스턴트 등의 기능에 대한 추론 기능/엔드포인트를 제공합니다.

인증

Azure OpenAI는 두 가지 인증 방법을 제공합니다. API 키 또는 Microsoft Entra ID를 사용할 수 있습니다.

  • API 키 인증: 이 인증 형식의 경우 모든 API 요청은 api-key HTTP 헤더에 API 키를 포함해야 합니다. 빠른 시작은 이러한 형식의 인증으로 전화를 거는 방법에 대한 지침을 제공합니다.

  • Microsoft Entra ID 인증: Microsoft Entra 토큰을 사용하여 API 호출을 인증할 수 있습니다. 인증 토큰은 요청에 Authorization 헤더로 포함됩니다. 제공된 토큰은 Bearer가 앞에 와야 합니다(예: Bearer YOUR_AUTH_TOKEN). Microsoft Entra ID로 인증하는 방법 가이드를 읽을 수 있습니다.

REST API 버전 관리

서비스 API는 api-version 쿼리 매개 변수를 사용하여 버전이 지정됩니다. 모든 버전은 YYYY-MM-DD 날짜 구조를 따릅니다. 다음은 그 예입니다.

POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01

데이터 평면 유추

이 문서의 남은 부분에서는 Azure OpenAI 데이터 평면 유추 사양의 미리 보기 릴리스를 다룹니다.

최신 GA API 릴리스에 대한 설명서를 찾는 경우 최신 GA 데이터 평면 유추 API를 참조하세요.

완성 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
best_of integer 서버 쪽에서 best_of 완료를 생성하고 "최상"(토큰당 로그 확률이 가장 높은 것)을 반환합니다. 결과를 스트리밍할 수 없습니다.

n와 함께 사용 시, best_of는 후보 완료 횟수를 제어하며, 반환할 n의 수는 best_of보다 커야 합니다.

참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokensstop에 대한 설정이 적절한지 확인합니다.
아니오 1
echo boolean 완성을 제공하는 것 외에 프롬프트를 다시 표시합니다. 아니오 거짓
frequency_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. 아니오 0
logit_bias 객체 지정된 토큰이 완성에 나타날 가능성을 수정합니다.

토큰(GPT 토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다.

예를 들어, {"50256": -100}을 전달하면 <|endoftext|> 토큰이 생성되지 않습니다.
아니오 없음
logprobs integer 가장 가능성이 높은 logprobs 출력 토큰과 선택한 토큰에 대한 로그 확률을 포함합니다. 예를 들어, logprobs가 5이면 API는 가장 가능성 있는 5개의 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 logprob를 반환하므로 응답에 최대 logprobs+1개의 요소가 있을 수 있습니다.

logprobs의 최댓값은 5입니다.
아니오 없음
최대 토큰 수 integer 완료 시 최대 토큰 수를 생성할 수 있습니다.

프롬프트의 토큰 수에 max_tokens를 더한 값은 모델의 컨텍스트 길이를 초과할 수 없습니다.
아니오 16
n integer 각 프롬프트에 대해 생성할 완성 수입니다.

참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokensstop에 대한 설정이 적절한지 확인합니다.
아니오 1
presence_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. 아니오 0
프롬프트 문자열 또는 배열 문자열, 문자열 배열, 토큰 배열 또는 토큰 배열의 배열로 인코딩된 완성을 생성하라는 프롬프트입니다.

<|endoftext|>는 학습 중에 모델이 보는 문서 구분 기호이므로 프롬프트가 지정되지 않은 경우 모델은 새 문서의 시작 부분에서 생성되는 것처럼 생성됩니다.
씨앗 integer 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.

결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다.
아니오
멈춰! 문자열 또는 배열 API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다. 아니오
스트림 boolean 부분 진행률을 다시 스트리밍할지 여부를 나타냅니다. 설정된 경우 토큰은 데이터 전용 서버 전송 이벤트로 전송되며 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제
아니오 거짓
suffix 문자열 삽입된 텍스트 완성 뒤에 오는 접미사입니다.

이 매개 변수는 gpt-3.5-turbo-instruct에만 지원됩니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.

일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다.
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json createCompletionResponse

상태 코드: 기본값

설명: 서비스를 사용할 수 없음

콘텐츠-타입 유형 설명
application/json errorResponse

예시

예시

제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview

{
 "prompt": [
  "tell me a joke about mango"
 ],
 "max_tokens": 32,
 "temperature": 1.0,
 "n": 1
}

응답: 상태 코드: 200

{
  "body": {
    "id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
    "created": 1686617332,
    "choices": [
      {
        "text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
        "index": 0,
        "finish_reason": "stop",
        "logprobs": null
      }
    ],
    "usage": {
      "completion_tokens": 20,
      "prompt_tokens": 6,
      "total_tokens": 26
    }
  }
}

포함 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

기계 학습 모델 및 알고리즘에서 쉽게 사용할 수 있는 지정된 입력의 벡터 표현을 가져옵니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열 배포된 모델의 배포 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
dimensions integer 결과 출력 포함에 있어야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. 아니오
인코딩 형식 문자열 반환할 포함의 형식입니다. float 또는 base64일 수 있습니다. 기본값은 float입니다. 아니오
입력 문자열 또는 배열 문자열 또는 토큰 배열로 인코딩된 포함할 텍스트를 입력합니다. 단일 요청에 여러 입력을 포함하려면 문자열 배열 또는 토큰 배열 배열을 전달합니다. 입력은 모델의 최대 입력 토큰(8192 토큰의 경우 text-embedding-ada-002)을 초과해서는 안 되며, 빈 문자열일 수 없으며 배열은 2048차원 이하여야 합니다.
input_type (입력 유형) 문자열 사용할 포함 검색의 입력 형식 아니오
사용자 문자열 최종 사용자를 나타내는 고유 식별자로, 남용을 모니터링하고 감지하는 데 도움이 됩니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 객체

예시

예시

지정된 프롬프트에 대한 포함을 반환합니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview

{
 "input": [
  "this is a test"
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "data": [
      {
        "index": 0,
        "embedding": [
          -0.012838088,
          -0.007421397,
          -0.017617522,
          -0.028278312,
          -0.018666342,
          0.01737855,
          -0.01821495,
          -0.006950092,
          -0.009937238,
          -0.038580645,
          0.010674067,
          0.02412286,
          -0.013647936,
          0.013189907,
          0.0021125758,
          0.012406612,
          0.020790534,
          0.00074595667,
          0.008397198,
          -0.00535031,
          0.008968075,
          0.014351576,
          -0.014086051,
          0.015055214,
          -0.022211088,
          -0.025198232,
          0.0065186154,
          -0.036350243,
          0.009180495,
          -0.009698266,
          0.009446018,
          -0.008463579,
          -0.0020113448
        ]
      }
    ],
    "usage": {
      "prompt_tokens": 4,
      "total_tokens": 4
    }
  }
}

채팅 완성 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

채팅 메시지에 대한 완성을 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
audio 객체 오디오 출력에 대한 매개 변수입니다. 을 modalities: ["audio"]사용하여 오디오 출력을 요청할 때 필요합니다. 아니오
└─ 형식 enum 출력 오디오 형식을 지정합니다. wav, mp3, flac, opus, 또는 pcm16 중 하나여야 합니다.

가능한 값: wav, mp3, flac, opuspcm16
아니오
└─ 음성 enum 음성 유형을 지정합니다. 지원되는 음성은 alloy,echo, fable, onyxnovashimmer.

가능한 값: alloy, echo, fableonyx, novashimmer
아니오
데이터_소스 array 이를 사용하는 Azure OpenAI 채팅 확장에 대한 구성 항목입니다.
이 추가 사양은 Azure OpenAI와만 호환됩니다.
아니오
frequency_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다.
아니오 0
함수 호출 문자열 또는 chatCompletionFunctionCallOption tool_choice에는 더 이상 사용되지 않습니다.

모델에서 호출되는 함수(해당하는 경우)를 제어합니다.
none은 모델이 함수를 호출하지 않고 대신 메시지를 생성함을 의미합니다.
auto는 모델이 메시지 생성 또는 함수 호출 중에서 선택할 수 있음을 의미합니다.
{"name": "my_function"}을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.

함수가 없을 경우 none이 기본값입니다. 함수가 있는 경우 auto가 기본값입니다.
아니오
기능 array tools에는 더 이상 사용되지 않습니다.

모델이 JSON 입력을 생성할 수 있는 함수 목록입니다.
아니오
logit_bias 객체 지정된 토큰이 완성에 나타날 가능성을 수정합니다.

토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다.
아니오 없음
logprobs boolean 출력 토큰의 로그 확률을 반환할지 여부를 나타냅니다. true인 경우 contentmessage에 반환된 각 출력 토큰의 로그 확률을 반환합니다. 아니오 거짓
최대_완료_토큰 integer 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. 아니오
최대 토큰 수 integer 채팅 완성 시 생성할 수 있는 최대 토큰 수입니다.

입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 따라 제한됩니다.
아니오
메시지 array 지금까지의 대화를 구성하는 메시지 목록입니다. Python 코드 예제
메타데이터 객체 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. 아니오
형식 ChatCompletionModalities 이 요청에 대해 모델이 생성할 출력 형식입니다.
대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.

["text"]

gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.

["text", "audio"]
아니오
n integer 각 입력 메시지에 대해 생성할 채팅 완성 선택 항목 수입니다. 모든 선택 항목에 걸쳐 생성된 토큰 수에 따라 요금이 부과됩니다. 비용을 최소화하려면 n1로 유지합니다. 아니오 1
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
prediction PredictionContent 예측 출력에 대한 구성으로, 모델 응답의 많은 부분이 미리 알려진 경우 응답 시간을 크게 향상시킬 수 있습니다. 대부분의 콘텐츠가 약간만 변경된 파일을 다시 생성할 때 가장 일반적입니다. 아니오
presence_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다.
아니오 0
추론 노력 enum o1 모델만

추론 모델에서 추론 작업을 제한합니다.

현재 지원되는 값은 low, mediumhigh입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.
가능한 값: low, mediumhigh
아니오
응답_형식 ResponseFormatText, ResponseFormatJsonObject 또는 ResponseFormatJsonSchema 모델이 출력해야 하는 형식을 지정하는 개체입니다. GPT-4o, GPT-4o mini, GPT-4 Turbo보다 최신인 모든 gpt-3.5-turbo-1106 Turbo 모델과 호환됩니다.

{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조적 출력을 사용하도록 설정합니다.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
씨앗 integer 이 기능은 베타 버전으로 제공됩니다.
지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.
결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다.
아니오
멈춰! 문자열 또는 배열 API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다.
아니오
store boolean 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. 아니오
스트림 boolean 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제
아니오 거짓
스트림 옵션 채팅완료스트림옵션 스트리밍 응답에 대한 옵션입니다. stream: true를 설정할 때만 설정합니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.

일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
도구_선택 chatCompletionToolChoiceOption 모델이 호출하는 도구(있는 경우)를 제어합니다. none은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다. auto는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}}을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none은 도구가 없는 경우 기본값입니다. auto는 도구가 있는 경우 기본값입니다. 아니오
도구들 array 모델이 호출할 수 있는 도구 목록입니다. 현재 함수만 도구로 지원됩니다. 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하려면 이를 사용합니다. 최대 128개의 함수가 지원됩니다.
아니오
top_logprobs integer 각 토큰 위치에서 반환될 가능성이 가장 높은 토큰 수를 지정하는 0에서 20 사이의 정수로, 각 토큰에는 관련 로그 가능성이 있습니다. 이 매개 변수를 사용하는 경우 logprobstrue로 설정해야 합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다.
아니오
사용자 보안 컨텍스트 userSecurityContext 사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 객체

상태 코드: 기본값

설명: 서비스를 사용할 수 없음

콘텐츠-타입 유형 설명
application/json errorResponse

예시

예시

제공된 프롬프트, 매개 변수 및 선택한 모델에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "system",
   "content": "you are a helpful assistant that talks like a pirate"
  },
  {
   "role": "user",
   "content": "can you tell me how to care for a parrot?"
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

Azure Search 데이터 및 시스템 할당 관리 ID를 기준으로 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "authentication": {
     "type": "system_assigned_managed_identity"
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

Azure Search 이미지 벡터 데이터를 기준으로 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "index_name": "{index name}",
    "query_type": "vector",
    "fields_mapping": {
     "image_vector_fields": [
      "image_vector"
     ]
    },
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion."
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

Azure Search 벡터 데이터, 이전 도우미 메시지 및 사용자 할당 관리 ID를 기준으로 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a cat?"
  },
  {
   "role": "assistant",
   "content": "Content of the completion [doc1].",
   "context": {
    "intent": "cat care"
   }
  },
  {
   "role": "user",
   "content": "how about dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_search",
   "parameters": {
    "endpoint": "https://your-search-endpoint.search.windows.net/",
    "authentication": {
     "type": "user_assigned_managed_identity",
     "managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
    },
    "index_name": "{index name}",
    "query_type": "vector",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "in_scope": true,
    "top_n_documents": 5,
    "strictness": 3,
    "role_information": "You are an AI assistant that helps people find information.",
    "fields_mapping": {
     "content_fields_separator": "\\n",
     "content_fields": [
      "content"
     ],
     "filepath_field": "filepath",
     "title_field": "title",
     "url_field": "url",
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content 2.",
                "title": "Citation Title 2",
                "filepath": "contoso2.txt",
                "url": "https://contoso.blob.windows.net/container/contoso2.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

제공된 Azure Cosmos DB에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "azure_cosmos_db",
   "parameters": {
    "authentication": {
     "type": "connection_string",
     "connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
    },
    "database_name": "vectordb",
    "container_name": "azuredocs",
    "index_name": "azuredocindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

제공된 Mongo DB에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "mongo_db",
   "parameters": {
    "authentication": {
     "type": "username_and_password",
     "username": "<username>",
     "password": "<password>"
    },
    "endpoint": "<endpoint_name>",
    "app_name": "<application name>",
    "database_name": "sampledb",
    "collection_name": "samplecollection",
    "index_name": "sampleindex",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "content_fields": [
      "content"
     ],
     "vector_fields": [
      "contentvector"
     ]
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

제공된 Elasticsearch에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "elasticsearch",
   "parameters": {
    "endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
    "index_name": "{index name}",
    "authentication": {
     "type": "key_and_key_id",
     "key": "{key}",
     "key_id": "{key id}"
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

예시

제공된 Pinecone 리소스에 대한 완성을 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview

{
 "messages": [
  {
   "role": "user",
   "content": "can you tell me how to care for a dog?"
  }
 ],
 "data_sources": [
  {
   "type": "pinecone",
   "parameters": {
    "authentication": {
     "type": "api_key",
     "key": "{api key}"
    },
    "environment": "{environment name}",
    "index_name": "{index name}",
    "embedding_dependency": {
     "type": "deployment_name",
     "deployment_name": "{embedding deployment name}"
    },
    "fields_mapping": {
     "title_field": "title",
     "url_field": "url",
     "filepath_field": "filepath",
     "content_fields": [
      "content"
     ],
     "content_fields_separator": "\n"
    }
   }
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
    "created": 1686676106,
    "choices": [
      {
        "index": 0,
        "finish_reason": "stop",
        "message": {
          "role": "assistant",
          "content": "Content of the completion [doc1].",
          "context": {
            "citations": [
              {
                "content": "Citation content.",
                "title": "Citation Title",
                "filepath": "contoso.txt",
                "url": "https://contoso.blob.windows.net/container/contoso.txt",
                "chunk_id": "0"
              }
            ],
            "intent": "dog care"
          }
        }
      }
    ],
    "usage": {
      "completion_tokens": 557,
      "prompt_tokens": 33,
      "total_tokens": 590
    }
  }
}

전사 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

오디오를 입력 언어로 전사합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

콘텐츠 형식: multipart/form-data

이름 유형 설명 필수 기본값
파일 문자열 전사할 오디오 파일 개체입니다.
언어 문자열 입력 오디오의 언어입니다. ISO-639-1 형식으로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. 아니오
프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다. 아니오
응답_형식 audioResponseFormat 출력의 형식을 정의합니다. 아니오
온도 숫자 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. 아니오 0
timestamp_granularities[] array 이 전사를 위해 채울 타임스탬프 세분성입니다. 타임스탬프 세분성을 사용하려면 response_formatverbose_json으로 설정해야 합니다. word 또는 segment 옵션 중 하나 또는 둘 다 지원됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다. 아니오 ['segment']

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 객체
텍스트/일반 문자열 출력 형식으로 텍스트를 전사했습니다(response_format이 text, vtt 또는 srt 중 하나인 경우).

예시

예시

제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

예시

제공된 음성 오디오 데이터에서 전사된 텍스트 및 관련 메타데이터를 가져옵니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

응답: 상태 코드: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

번역 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

입력 오디오를 영어 텍스트로 전사하고 번역합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

콘텐츠 형식: multipart/form-data

이름 유형 설명 필수 기본값
파일 문자열 번역할 오디오 파일입니다.
프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다. 아니오
응답_형식 audioResponseFormat 출력의 형식을 정의합니다. 아니오
온도 숫자 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. 아니오 0

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 객체
텍스트/일반 문자열 출력 형식으로 텍스트를 전사했습니다(response_format이 text, vtt 또는 srt 중 하나인 경우).

예시

예시

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

응답: 상태 코드: 200

{
  "body": {
    "text": "A structured object when requesting json or verbose_json"
  }
}

예시

제공된 음성 오디오 데이터에서 영어 전사 텍스트 및 관련 메타데이터를 가져옵니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview

"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"

응답: 상태 코드: 200

{
  "type": "string",
  "example": "plain text when requesting text, srt, or vtt"
}

음성 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

입력 텍스트에서 오디오를 생성합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

콘텐츠 형식: multipart/form-data

이름 유형 설명 필수 기본값
입력 문자열 오디오를 합성할 텍스트입니다. 최대 길이는 4096자입니다.
응답_형식 enum 오디오를 합성할 형식입니다.
가능한 값: mp3, opus, aacflac, wavpcm
아니오
속도 숫자 합성된 오디오의 속도입니다. 0.25~4.0의 값을 선택합니다. 1.0 기본값입니다. 아니오 1.0
목소리 enum 음성 합성에 사용할 음성입니다.
가능한 값: alloy, echo, fableonyx, novashimmer

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
어플리케이션/옥텟 스트림 (application/octet-stream) 문자열

예시

예시

제공된 텍스트에서 오디오를 합성합니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview

{
 "input": "Hi! What are you going to make?",
 "voice": "fable",
 "response_format": "mp3"
}

응답: 상태 코드: 200

{
  "body": "101010101"
}

이미지 생성 - 만들기

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

주어진 DALLE 또는 gpt-image-1 모델 배포에서 텍스트 캡션으로부터 일괄 이미지를 생성합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
background imageBackground 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다. 아니오 auto
n integer 생성할 이미지 수입니다. dall-e-3의 경우 n=1만 지원됩니다. 아니오 1
출력 압축 integer 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 jpeg 출력 형식의 gpt-image-1에 대해서만 지원됩니다. 아니오 100
출력 형식 imagesOutputFormat 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다. 아니오 png
프롬프트 문자열 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 gpt-image-1의 경우 32000자, dall-e-3의 경우 4,000자입니다.
imageQuality 생성될 이미지의 품질입니다. 아니오 auto
응답_형식 imagesResponseFormat 생성된 이미지가 반환되는 형식입니다. 아니오 url
크기 imageSize 생성된 이미지의 크기입니다. 아니오 auto
style imageStyle 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다. 아니오 vivid
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json generateImagesResponse

상태 코드: 기본값

설명: 오류가 발생했습니다.

콘텐츠-타입 유형 설명
application/json dalleErrorResponse

예시

예시

프롬프트가 지정된 이미지를 만듭니다.

POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview

{
 "prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
 "n": 1,
 "style": "natural",
 "quality": "standard"
}

응답: 상태 코드: 200

{
  "body": {
    "created": 1698342300,
    "data": [
      {
        "revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
        "prompt_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          },
          "profanity": {
            "detected": false,
            "filtered": false
          },
          "custom_blocklists": {
            "filtered": false,
            "details": []
          }
        },
        "url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
        "content_filter_results": {
          "sexual": {
            "severity": "safe",
            "filtered": false
          },
          "violence": {
            "severity": "safe",
            "filtered": false
          },
          "hate": {
            "severity": "safe",
            "filtered": false
          },
          "self_harm": {
            "severity": "safe",
            "filtered": false
          }
        }
      }
    ]
  }
}

이미지 생성 - 편집

POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview

지정된 gpt-image-1 모델 배포의 텍스트 캡션에서 이미지를 편집합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
deployment-id 문자열
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

콘텐츠 형식: multipart/form-data

이름 유형 설명 필수 기본값
이미지 문자열 또는 배열 편집할 이미지입니다. 지원되는 이미지 파일 또는 이미지 배열이어야 합니다. 각 이미지는 png 또는 jpg 파일이 25MB 미만이어야 합니다.
마스크 문자열 완전히 투명한 영역(예: 알파가 0인 경우)이 있는 추가 이미지는 이미지를 편집해야 하는 위치를 나타냅니다. 여러 이미지가 제공되면 마스크가 첫 번째 이미지에 적용됩니다. 유효한 PNG 파일(4MB 미만)이어야 하며 이미지와 크기가 같아야 합니다. 아니오
n integer 생성할 이미지 수입니다. 아니오 1
프롬프트 문자열 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 32000자입니다.
imageQuality 생성될 이미지의 품질입니다. 아니오 auto
응답_형식 imagesResponseFormat 생성된 이미지가 반환되는 형식입니다. 아니오 url
크기 imageSize 생성된 이미지의 크기입니다. 아니오 auto
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json generateImagesResponse

상태 코드: 기본값

설명: 오류가 발생했습니다.

콘텐츠-타입 유형 설명
application/json dalleErrorResponse

나열 - 도우미

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

도우미 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json listAssistantsResponse

예시

예시

도우미 목록을 반환합니다.

GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "asst_abc123",
        "object": "assistant",
        "created_at": 1707257477,
        "name": "Stock Analyst",
        "description": null,
        "model": "gpt-4-1106-preview",
        "instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc456",
        "object": "assistant",
        "created_at": 1698982718,
        "name": "My Assistant",
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": "You are a helpful assistant designed to make me better at coding!",
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      },
      {
        "id": "asst_abc789",
        "object": "assistant",
        "created_at": 1698982643,
        "name": null,
        "description": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "tools": [],
        "tool_resources": {},
        "metadata": {},
        "top_p": 1.0,
        "temperature": 1.0,
        "response_format": "auto"
      }
    ],
    "first_id": "asst_abc123",
    "last_id": "asst_abc789",
    "has_more": false
  }
}

만들기 - 도우미

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

모델과 지침이 포함된 도우미를 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
설명 문자열 도우미에 대한 설명입니다. 최대 길이는 512자입니다.
아니오
지침 문자열 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열
이름 문자열 도우미의 이름입니다. 최대 길이는 256자입니다.
아니오
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
└─ 벡터_스토어 array file_ids를 사용하여 벡터 저장소를 만들고 이 도우미에 연결하기 위한 도우미입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter, retrieval 또는 function 형식일 수 있습니다.
아니오 []
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json assistantObject

예시

예시

모델과 지침이 포함된 도우미를 만듭니다.

POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview

{
 "name": "Math Tutor",
 "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
 "tools": [
  {
   "type": "code_interpreter"
  }
 ],
 "model": "gpt-4-1106-preview"
}

응답: 상태 코드: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant",
    "created_at": 1707295707,
    "name": "Math Tutor",
    "description": null,
    "model": "gpt-4-1106-preview",
    "instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

가져오기 - 도우미

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

도우미를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
어시스턴트_아이디 문자열 검색할 도우미의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json assistantObject

예시

예시

도우미를 검색합니다.

GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "asst_abc123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

수정 - 도우미

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

도우미를 수정합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
어시스턴트_아이디 문자열 수정할 도우미의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
설명 문자열 도우미에 대한 설명입니다. 최대 길이는 512자입니다.
아니오
지침 문자열 도우미가 사용하는 시스템 지침입니다. 최대 길이는 32768자입니다.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 아니오
이름 문자열 도우미의 이름입니다. 최대 길이는 256자입니다.
아니오
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록을 재정의합니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소를 재정의합니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter, retrieval 또는 function 형식일 수 있습니다.
아니오 []
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json assistantObject

예시

예시

도우미를 수정합니다.

POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

{
 "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
 "tools": [
  {
   "type": "file_search"
  }
 ],
 "model": "gpt-4-turbo"
}

응답: 상태 코드: 200

{
  "body": {
    "id": "asst_123",
    "object": "assistant",
    "created_at": 1699009709,
    "name": "HR Helper",
    "description": null,
    "model": "gpt-4-turbo",
    "instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": []
      }
    },
    "metadata": {},
    "top_p": 1.0,
    "temperature": 1.0,
    "response_format": "auto"
  }
}

삭제 - 도우미

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

도우미를 삭제합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
어시스턴트_아이디 문자열 삭제할 도우미의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json deleteAssistantResponse

예시

예시

도우미를 삭제합니다.

DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
    "object": "assistant.deleted",
    "deleted": true
  }
}

만들기 - 스레드

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

스레드를 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
메시지 array 스레드를 시작하는 메시지 목록입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
도구_자원 객체 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오
└─ 벡터_스토어 array file_ids를 사용하여 벡터 저장소를 만들고 이 스레드에 연결하기 위한 도우미입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json threadObject

예시

예시

스레드를 만듭니다.

POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {}
  }
}

가져오기 - 스레드

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

스레드를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 검색할 스레드의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json threadObject

예시

예시

스레드를 검색합니다.

GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {},
    "tool_resources": {
      "code_interpreter": {
        "file_ids": []
      }
    }
  }
}

수정 - 스레드

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

스레드를 수정합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 수정할 스레드의 ID입니다. metadata만 수정할 수 있습니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
도구_자원 객체 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json threadObject

예시

예시

스레드를 수정합니다.

POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

응답: 상태 코드: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread",
    "created_at": 1707297136,
    "metadata": {
      "modified": "true",
      "user": "abc123"
    },
    "tool_resources": {}
  }
}

삭제 - 스레드

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

스레드를 삭제합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 삭제할 스레드의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json deleteThreadResponse

예시

예시

스레드를 삭제합니다.

DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "object": "thread.deleted",
    "deleted": true
  }
}

나열 - 메시지

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

지정된 스레드에 대한 메시지 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 메시지가 속한 스레드의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
run_id 문의 아니오 문자열 메시지를 생성한 실행 ID로 필터링합니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json listMessagesResponse

예시

예시

메시지 나열

GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "msg_abc123",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "How does AI work? Explain it in simple terms.",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      },
      {
        "id": "msg_abc456",
        "object": "thread.message",
        "created_at": 1699016383,
        "assistant_id": null,
        "thread_id": "thread_abc123",
        "run_id": null,
        "role": "user",
        "content": [
          {
            "type": "text",
            "text": {
              "value": "Hello, what is AI?",
              "annotations": []
            }
          }
        ],
        "attachments": [],
        "metadata": {}
      }
    ],
    "first_id": "msg_abc123",
    "last_id": "msg_abc456",
    "has_more": false
  }
}

만들기 - 메시지

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

메시지를 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 메시지를 만들 스레드의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
attachments array 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다. 아니오
내용 문자열 메시지의 내용입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
역할 문자열 메시지를 만드는 엔터티의 역할입니다. 허용되는 값은 다음과 같습니다.
- user: 메시지가 실제 사용자에 의해 전송되었으며 대부분의 경우 사용자 생성 메시지를 나타내는 데 사용되어야 함을 나타냅니다.
- assistant: 메시지가 도우미에 의해 생성되었음을 나타냅니다. 도우미의 메시지를 대화에 삽입하려면 이 값을 사용합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json messageObject

예시

예시

메시지를 만듭니다.

POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview

{
 "role": "user",
 "content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}

응답: 상태 코드: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "assistant_id": null,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "attachments": [],
    "metadata": {}
  }
}

가져오기 - 메시지

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

메시지를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 이 메시지가 속한 스레드의 ID입니다.
메시지_아이디 문자열 검색할 메시지의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json messageObject

예시

예시

메시지를 검색합니다.

GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
    "object": "thread.message",
    "created_at": 1707298421,
    "thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "assistant_id": null,
    "run_id": null,
    "metadata": {}
  }
}

수정 - 메시지

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

메시지를 수정합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 이 메시지가 속한 스레드의 ID입니다.
메시지_아이디 문자열 수정할 메시지의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json messageObject

예시

예시

메시지를 수정합니다.

POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "modified": "true",
  "user": "abc123"
 }
}

응답: 상태 코드: 200

{
  "body": {
    "id": "msg_abc123",
    "object": "thread.message",
    "created_at": 1699017614,
    "assistant_id": null,
    "thread_id": "thread_abc123",
    "run_id": null,
    "role": "user",
    "content": [
      {
        "type": "text",
        "text": {
          "value": "How does AI work? Explain it in simple terms.",
          "annotations": []
        }
      }
    ],
    "file_ids": [],
    "metadata": {
      "modified": "true",
      "user": "abc123"
    }
  }
}

만들기 - 스레드 및 실행

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

하나의 요청으로 스레드를 만들고 실행합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
어시스턴트_아이디 문자열 이 실행을 수행하는 데 사용할 도우미의 ID입니다.
지침 문자열 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
최대_완료_토큰 integer 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
최대_프롬프트_토큰 integer 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 이 실행을 실행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. 아니오
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
스트림 옵션 채팅완료스트림옵션 스트리밍 응답에 대한 옵션입니다. stream: true를 설정할 때만 설정합니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
스레드(thread) createThreadRequest 아니오
도구_선택 보조자 API 도구 선택 옵션 모델이 호출하는 도구(있는 경우)를 제어합니다.
none은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다.
auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
아니오
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1
truncation_strategy truncationObject 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

하나의 요청으로 스레드를 만들고 실행합니다.

POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123",
 "thread": {
  "messages": [
   {
    "role": "user",
    "content": "Explain deep learning to a 5 year old."
   }
  ]
 }
}

응답: 상태 코드: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076792,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": null,
    "expires_at": 1699077392,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "required_action": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You are a helpful assistant.",
    "tools": [],
    "tool_resources": {},
    "metadata": {},
    "temperature": 1.0,
    "top_p": 1.0,
    "max_completion_tokens": null,
    "max_prompt_tokens": null,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "incomplete_details": null,
    "usage": null,
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

나열 - 실행

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

스레드에 속하는 실행 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행이 속한 스레드의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json listRunsResponse

예시

예시

스레드에 속하는 실행 목록을 반환합니다.

GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "run_abc123",
        "object": "thread.run",
        "created_at": 1699075072,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699075072,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699075073,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      },
      {
        "id": "run_abc456",
        "object": "thread.run",
        "created_at": 1699063290,
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "status": "completed",
        "started_at": 1699063290,
        "expires_at": null,
        "cancelled_at": null,
        "failed_at": null,
        "completed_at": 1699063291,
        "last_error": null,
        "model": "gpt-4-turbo",
        "instructions": null,
        "incomplete_details": null,
        "tools": [
          {
            "type": "code_interpreter"
          }
        ],
        "tool_resources": {
          "code_interpreter": {
            "file_ids": [
              "file-abc123",
              "file-abc456"
            ]
          }
        },
        "metadata": {},
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        },
        "temperature": 1.0,
        "top_p": 1.0,
        "max_prompt_tokens": 1000,
        "max_completion_tokens": 1000,
        "truncation_strategy": {
          "type": "auto",
          "last_messages": null
        },
        "response_format": "auto",
        "tool_choice": "auto"
      }
    ],
    "first_id": "run_abc123",
    "last_id": "run_abc456",
    "has_more": false
  }
}

만들기 - 실행

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

실행을 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행할 스레드의 ID입니다.
include[] 문의 아니오 array 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
추가 지침 문자열 실행 지침 끝에 추가 지침을 추가합니다. 이는 다른 지침을 재정의하지 않고 실행별로 동작을 수정하는 데 유용합니다. 아니오
추가 메시지 array 실행을 만들기 전에 스레드에 추가 메시지를 추가합니다. 아니오
어시스턴트_아이디 문자열 이 실행을 수행하는 데 사용할 도우미의 ID입니다.
지침 문자열 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
최대_완료_토큰 integer 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
최대_프롬프트_토큰 integer 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 이 실행을 수행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. 아니오
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_선택 보조자 API 도구 선택 옵션 모델이 호출하는 도구(있는 경우)를 제어합니다.
none은 모델이 도구를 호출하지 않고 대신 메시지를 생성함을 의미합니다.
auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
아니오
도구들 array 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1
truncation_strategy truncationObject 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

실행을 만듭니다.

POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview

{
 "assistant_id": "asst_abc123"
}

응답: 상태 코드: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699063290,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "queued",
    "started_at": 1699063290,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699063291,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

가져오기 - 실행

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

실행을 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행된 스레드의 ID입니다.
run_id 문자열 검색할 실행의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

실행을 가져옵니다.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
    "object": "thread.run",
    "created_at": 1707303196,
    "assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
    "thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
    "status": "completed",
    "started_at": 1707303197,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1707303201,
    "last_error": null,
    "model": "gpt-4-1106-preview",
    "instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
    "tools": [],
    "file_ids": [],
    "metadata": {}
  }
}

수정 - 실행

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

실행을 수정합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행된 스레드의 ID입니다.
run_id 문자열 수정할 실행의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

실행을 수정합니다.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview

{
 "metadata": {
  "user_id": "user_abc123"
 }
}

응답: 상태 코드: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699075072,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "completed",
    "started_at": 1699075072,
    "expires_at": null,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": 1699075073,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "incomplete_details": null,
    "tools": [
      {
        "type": "code_interpreter"
      }
    ],
    "tool_resources": {
      "code_interpreter": {
        "file_ids": [
          "file-abc123",
          "file-abc456"
        ]
      }
    },
    "metadata": {
      "user_id": "user_abc123"
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    },
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

제출 - 실행할 도구 출력

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

실행에 status: "requires_action"이 있고 required_action.typesubmit_tool_outputs인 경우 모두 완료되면 이 엔드포인트를 사용하여 도구 호출의 출력을 제출할 수 있습니다. 모든 출력은 단일 요청으로 제출되어야 합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 이 실행이 속한 스레드의 ID입니다.
run_id 문자열 도구 출력 제출이 필요한 실행의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
도구 결과 array 출력이 제출되는 도구 목록입니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

실행에 status: "requires_action"이 있고 required_action.typesubmit_tool_outputs인 경우 모두 완료되면 이 엔드포인트를 사용하여 도구 호출의 출력을 제출할 수 있습니다. 모든 출력은 단일 요청으로 제출되어야 합니다.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview

{
 "tool_outputs": [
  {
   "tool_call_id": "call_001",
   "output": "70 degrees and sunny."
  }
 ]
}

응답: 상태 코드: 200

{
  "body": {
    "id": "run_123",
    "object": "thread.run",
    "created_at": 1699075592,
    "assistant_id": "asst_123",
    "thread_id": "thread_123",
    "status": "queued",
    "started_at": 1699075592,
    "expires_at": 1699076192,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": null,
    "tools": [
      {
        "type": "function",
        "function": {
          "name": "get_current_weather",
          "description": "Get the current weather in a given ___location",
          "parameters": {
            "type": "object",
            "properties": {
              "___location": {
                "type": "string",
                "description": "The city and state, e.g. San Francisco, CA"
              },
              "unit": {
                "type": "string",
                "enum": [
                  "celsius",
                  "fahrenheit"
                ]
              }
            },
            "required": [
              "___location"
            ]
          }
        }
      }
    ],
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "max_prompt_tokens": 1000,
    "max_completion_tokens": 1000,
    "truncation_strategy": {
      "type": "auto",
      "last_messages": null
    },
    "response_format": "auto",
    "tool_choice": "auto"
  }
}

취소 - 실행

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

in_progress인 실행을 취소합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 이 실행이 속한 스레드의 ID입니다.
run_id 문자열 취소할 실행의 ID입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runObject

예시

예시

in_progress인 실행을 취소합니다.

POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "run_abc123",
    "object": "thread.run",
    "created_at": 1699076126,
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "status": "cancelling",
    "started_at": 1699076126,
    "expires_at": 1699076726,
    "cancelled_at": null,
    "failed_at": null,
    "completed_at": null,
    "last_error": null,
    "model": "gpt-4-turbo",
    "instructions": "You summarize books.",
    "tools": [
      {
        "type": "file_search"
      }
    ],
    "tool_resources": {
      "file_search": {
        "vector_store_ids": [
          "vs_123"
        ]
      }
    },
    "metadata": {},
    "usage": null,
    "temperature": 1.0,
    "top_p": 1.0,
    "response_format": "auto"
  }
}

나열 - 실행 단계

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

실행에 속하는 실행 단계 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행 및 실행 단계가 속한 스레드의 ID입니다.
run_id 문자열 실행 단계가 속한 실행의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
API 버전 문의 문자열
include[] 문의 아니오 array 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json listRunStepsResponse

예시

예시

실행에 속하는 실행 단계 목록을 반환합니다.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "step_abc123",
        "object": "thread.run.step",
        "created_at": 1699063291,
        "run_id": "run_abc123",
        "assistant_id": "asst_abc123",
        "thread_id": "thread_abc123",
        "type": "message_creation",
        "status": "completed",
        "cancelled_at": null,
        "completed_at": 1699063291,
        "expired_at": null,
        "failed_at": null,
        "last_error": null,
        "step_details": {
          "type": "message_creation",
          "message_creation": {
            "message_id": "msg_abc123"
          }
        },
        "usage": {
          "prompt_tokens": 123,
          "completion_tokens": 456,
          "total_tokens": 579
        }
      }
    ],
    "first_id": "step_abc123",
    "last_id": "step_abc456",
    "has_more": false
  }
}

가져오기 - 실행 단계

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

실행 단계를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
스레드 ID 문자열 실행 및 실행 단계가 속한 스레드의 ID입니다.
run_id 문자열 실행 단계가 속한 실행의 ID입니다.
단계_아이디 문자열 검색할 실행 단계의 ID입니다.
include[] 문의 아니오 array 응답에 포함할 추가 필드 목록입니다. 현재 유일하게 지원되는 값은 step_details.tool_calls[*].file_search.results[*].content 파일 검색 결과 콘텐츠를 가져오는 것입니다.
API 버전 문의 문자열

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json runStepObject

예시

예시

실행 단계를 검색합니다.

GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "step_abc123",
    "object": "thread.run.step",
    "created_at": 1699063291,
    "run_id": "run_abc123",
    "assistant_id": "asst_abc123",
    "thread_id": "thread_abc123",
    "type": "message_creation",
    "status": "completed",
    "cancelled_at": null,
    "completed_at": 1699063291,
    "expired_at": null,
    "failed_at": null,
    "last_error": null,
    "step_details": {
      "type": "message_creation",
      "message_creation": {
        "message_id": "msg_abc123"
      }
    },
    "usage": {
      "prompt_tokens": 123,
      "completion_tokens": 456,
      "total_tokens": 579
    }
  }
}

나열 - 벡터 저장소

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

벡터 저장소 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json listVectorStoresResponse

예시

예시

벡터 저장소 목록을 반환합니다.

GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "vs_abc123",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      },
      {
        "id": "vs_abc456",
        "object": "vector_store",
        "created_at": 1699061776,
        "name": "Support FAQ v2",
        "bytes": 139920,
        "file_counts": {
          "in_progress": 0,
          "completed": 3,
          "failed": 0,
          "cancelled": 0,
          "total": 3
        }
      }
    ],
    "first_id": "vs_abc123",
    "last_id": "vs_abc456",
    "has_more": false
  }
}

만들기 - 벡터 저장소

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

벡터 저장소를 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
chunking_strategy autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. 아니오
expires_after 벡터 저장 만료 후 벡터 저장소에 대한 만료 정책입니다. 아니오
파일_아이디 array 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
이름 문자열 벡터 저장소의 이름입니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreObject

예시

예시

벡터 저장소를 만듭니다.

POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

가져오기 - 벡터 저장소

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

벡터 저장소를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 검색할 벡터 저장소의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreObject

예시

예시

벡터 저장소를 검색합니다.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776
  }
}

수정 - 벡터 저장소

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

벡터 저장소를 수정합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 수정할 벡터 저장소의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
expires_after 벡터 저장 만료 후 벡터 저장소에 대한 만료 정책입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
이름 문자열 벡터 저장소의 이름입니다. 아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreObject

예시

예시

벡터 저장소를 수정합니다.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

{
 "name": "Support FAQ"
}

응답: 상태 코드: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store",
    "created_at": 1699061776,
    "name": "Support FAQ",
    "bytes": 139920,
    "file_counts": {
      "in_progress": 0,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 3
    }
  }
}

삭제 - 벡터 저장소

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

벡터 저장소를 삭제합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 삭제할 벡터 저장소의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json deleteVectorStoreResponse

예시

예시

벡터 저장소를 삭제합니다.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "vs_abc123",
    "object": "vector_store.deleted",
    "deleted": true
  }
}

나열 - 벡터 저장소 파일

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

벡터 저장소 파일 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일이 속한 벡터 저장소의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
필터 문의 아니오 문자열
가능한 값: in_progress, completed, failedcancelled
파일 상태를 필터링합니다. in_progress, completed, failed, cancelled 중에 하나.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 벡터 저장소 파일 목록 응답

예시

예시

벡터 저장소 파일 목록을 반환합니다.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

만들기 - 벡터 저장소 파일

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

벡터 저장소에 파일을 연결하여 벡터 저장소 파일을 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일을 만들 벡터 저장소의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
chunking_strategy 청킹 전략 요청 매개변수 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 아니오
file_id 문자열 벡터 저장소에서 사용해야 하는 파일 ID입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileObject

예시

예시

벡터 저장소에 파일을 연결하여 벡터 저장소 파일을 만듭니다.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview

{
 "file_id": "file-abc123"
}

응답: 상태 코드: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "usage_bytes": 1234,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

가져오기 - 벡터 저장소 파일

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

벡터 저장소 파일을 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일이 속한 벡터 저장소의 ID입니다.
file_id 문자열 검색할 파일의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileObject

예시

예시

벡터 저장소 파일을 검색합니다.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "file-abc123",
    "object": "vector_store.file",
    "created_at": 1699061776,
    "vector_store_id": "vs_abcd",
    "status": "completed",
    "last_error": null
  }
}

삭제 - 벡터 저장소 파일

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

벡터 저장소 파일을 삭제합니다. 이렇게 하면 벡터 저장소에서 파일이 제거되지만 파일 자체가 삭제되지는 않습니다. 파일을 삭제하려면 파일 삭제 엔드포인트를 사용합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일이 속한 벡터 저장소의 ID입니다.
file_id 문자열 삭제할 파일의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json deleteVectorStoreFileResponse

예시

예시

벡터 저장소 파일을 삭제합니다. 이렇게 하면 벡터 저장소에서 파일이 제거되지만 파일 자체가 삭제되지는 않습니다. 파일을 삭제하려면 파일 삭제 엔드포인트를 사용합니다.

DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "file_abc123",
    "object": "vector_store.file.deleted",
    "deleted": true
  }
}

Updatevectorstorefileattributes

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview

벡터 저장소 파일의 특성을 업데이트합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일이 속한 벡터 저장소의 ID입니다.
file_id 문자열 특성을 업데이트할 파일의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
특성 VectorStoreFileAttributes 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileObject

벡터 저장소 파일 콘텐츠 검색

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview

벡터 저장소 파일의 구문 분석된 내용을 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 벡터 저장소의 ID입니다.
file_id 문자열 벡터 저장소 내의 파일 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json VectorStoreFileContentResponse

검색 벡터 저장소

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview

쿼리 및 파일 특성 필터를 기반으로 벡터 저장소에서 관련 청크를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 검색할 벡터 저장소의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
filters ComparisonFilter 또는 CompoundFilter 파일 특성에 따라 적용할 필터입니다. 아니오
결과_최대수량 (max_num_results) integer 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다. 아니오 10
문의 문자열 또는 배열 검색에 대한 쿼리 문자열
랭킹 옵션 객체 검색에 대한 순위 옵션입니다. 아니오
└─ ranker enum
가능한 값: autodefault-2024-11-15
아니오
└점수 임계값 숫자 아니오 0
쿼리 재작성 boolean 벡터 검색을 위해 자연어 쿼리를 다시 작성할지 여부입니다. 아니오 거짓

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json VectorStoreSearchResultsPage

만들기 - 벡터 저장소 파일 일괄 처리

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

벡터 저장소 파일 일괄 처리를 만듭니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일 일괄 처리를 만들 벡터 저장소의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
chunking_strategy 청킹 전략 요청 매개변수 (chunkingStrategyRequestParam) 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 아니오
파일_아이디 array 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileBatchObject

예시

예시

벡터 저장소 파일 일괄 처리를 만듭니다.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview

{
 "file_ids": [
  "file-abc123",
  "file-abc456"
 ]
}

응답: 상태 코드: 200

{
  "id": "vsfb_abc123",
  "object": "vector_store.file_batch",
  "created_at": 1699061776,
  "vector_store_id": "vs_abc123",
  "status": "in_progress",
  "file_counts": {
    "in_progress": 1,
    "completed": 1,
    "failed": 0,
    "cancelled": 0,
    "total": 0
  }
}

가져오기 - 벡터 저장소 파일 일괄 처리

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

벡터 저장소 파일 일괄 처리를 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일 일괄 처리가 속한 벡터 저장소의 ID입니다.
batch_id 문자열 검색 중인 파일 일괄 처리의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileBatchObject

예시

예시

벡터 저장소 파일 일괄 처리를 검색합니다.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "in_progress",
    "file_counts": {
      "in_progress": 1,
      "completed": 1,
      "failed": 0,
      "cancelled": 0,
      "total": 0
    }
  }
}

취소 - 벡터 저장소 파일 일괄 처리

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

벡터 저장소 파일 일괄 처리를 취소합니다. 이렇게 하면 가능한 빨리 이 일괄 처리의 파일 처리를 취소하려고 시도합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일 일괄 처리가 속한 벡터 저장소의 ID입니다.
batch_id 문자열 취소할 파일 일괄 처리의 ID입니다.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json vectorStoreFileBatchObject

예시

예시

벡터 저장소 파일 일괄 처리를 취소합니다. 이렇게 하면 가능한 빨리 이 일괄 처리의 파일 처리를 취소하려고 시도합니다.

POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "id": "vsfb_abc123",
    "object": "vector_store.file_batch",
    "created_at": 1699061776,
    "vector_store_id": "vs_abc123",
    "status": "cancelling",
    "file_counts": {
      "in_progress": 12,
      "completed": 3,
      "failed": 0,
      "cancelled": 0,
      "total": 15
    }
  }
}

나열 - 벡터 저장소 파일 일괄 처리 파일

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

벡터 저장소 파일 목록을 일괄 처리로 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
벡터 저장소 ID 문자열 파일이 속한 벡터 저장소의 ID입니다.
batch_id 문자열 파일이 속한 파일 일괄 처리의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
개체의 created_at 타임스탬프를 기준으로 순서를 정렬합니다. asc 오름차순 및 desc 내림차순의 경우
after 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. after는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어, 목록 요청을 하고 obj_foo로 끝나는 100개의 개체를 받은 경우 목록의 다음 페이지를 페치하기 위해 후속 호출에 after=obj_foo가 포함될 수 있습니다.
before 문의 아니오 문자열 페이지 매김에 사용되는 커서입니다. before는 목록에서의 위치를 정의하는 개체 ID입니다. 예를 들어 목록 요청을 수행하고 obj_foo 시작하여 100개의 개체를 수신하는 경우 후속 호출에는 목록의 이전 페이지를 가져오기 위해 before=obj_foo 포함할 수 있습니다.
필터 문의 아니오 문자열
가능한 값: in_progress, completed, failedcancelled
파일 상태를 필터링합니다. in_progress, completed, failed, cancelled 중에 하나.
API 버전 문의 문자열 api 버전

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 벡터 저장소 파일 목록 응답

예시

예시

벡터 저장소 파일 목록을 반환합니다.

GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview

응답: 상태 코드: 200

{
  "body": {
    "object": "list",
    "data": [
      {
        "id": "file-abc123",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      },
      {
        "id": "file-abc456",
        "object": "vector_store.file",
        "created_at": 1699061776,
        "vector_store_id": "vs_abc123"
      }
    ],
    "first_id": "file-abc123",
    "last_id": "file-abc456",
    "has_more": false
  }
}

만들기 - 실시간 세션

POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview

실시간 API를 사용하여 클라이언트 쪽 애플리케이션에서 사용할 임시 API 토큰을 만듭니다. 클라이언트 이벤트와 동일한 세션 매개 변수를 사용하여 session.update 구성할 수 있습니다. 세션 개체 client_secret 와 실시간 API에 대한 브라우저 클라이언트를 인증하는 데 사용할 수 있는 사용 가능한 임시 API 토큰이 포함된 키로 응답합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
입력 오디오 형식 enum 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
pcm16의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
input_audio_noise_reduction 객체 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.
노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다.
오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다.
아니오
└─ 형식 enum 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.

가능한 값: near_fieldfar_field
아니오
input_audio_transcription 객체 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 전사 엔드포인트를 통해 비동기적으로 실행되며 모델이 들은 정확한 내용이라기보다 입력 오디오 콘텐츠의 지침으로 취급해야 합니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다.
아니오
└) 언어 문자열 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.
아니오
└─ model 문자열 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1입니다.
아니오
└) 프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.
whisper-1은 프롬프트가 키워드 목록입니다.
모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대").
아니오
지침 문자열 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친숙한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다.

서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다.
아니오
최대 응답 출력 토큰 정수 또는 문자열 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf입니다.
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
model 문자열 이 세션에 사용되는 배포의 이름입니다.
아니오
출력_오디오_포맷 enum 출력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
출력 pcm16오디오는 24kHz 속도로 샘플링됩니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
온도 숫자 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 오디오 모델의 경우 최상의 성능을 위해 0.8의 온도를 사용하는 것이 좋습니다.
아니오 0.8
도구_선택 문자열 모델이 도구를 선택하는 방법입니다. 옵션은 auto, none, required 또는 함수를 지정하십시오.
아니오 auto
도구들 array 모델에서 사용할 수 있는 도구(함수)입니다. 아니오
회전 감지 객체 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.
서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다.
아니오
└ 생성_응답 boolean VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다.
아니오 진실
└) 열망 enum semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.

가능한 값: low, medium, highauto
아니오
└interrupt_response 부울 VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto)으로 진행 중인 응답을 자동으로 중단할지 여부입니다.
아니오 진실
└prefix_padding_ms integer server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 enum 턴 감지 유형입니다.

가능한 값: server_vadsemantic_vad
아니오
목소리 VoiceIdsShared 아니오

응답

상태 코드: 200

설명: 세션이 성공적으로 생성되었습니다.

콘텐츠-타입 유형 설명
application/json RealtimeSessionCreateResponse

만들기 - Transcriptionrealtimesession

POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview

특히 실시간 전사를 위한 실시간 API를 사용하여 클라이언트 쪽 애플리케이션에서 사용할 임시 API 토큰을 만듭니다. 클라이언트 이벤트와 동일한 세션 매개 변수를 사용하여 transcription_session.update 구성할 수 있습니다. 세션 개체 client_secret 와 실시간 API에 대한 브라우저 클라이언트를 인증하는 데 사용할 수 있는 사용 가능한 임시 API 토큰이 포함된 키로 응답합니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
include 배열 전사에 포함할 항목 집합입니다. 현재 사용 가능한 항목은 다음과 같습니다.
- item.input_audio_transcription.logprobs
아니오
입력 오디오 형식 enum 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
pcm16의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
input_audio_noise_reduction 객체 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.
노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다.
오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다.
아니오
└─ 형식 enum 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.

가능한 값: near_fieldfar_field
아니오
input_audio_transcription 객체 입력 오디오 전사에 대한 구성입니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다.
아니오
└) 언어 문자열 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.
아니오
└─ model 열거형 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1입니다.

가능한 값: gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1
아니오
└) 프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.
whisper-1은 프롬프트가 키워드 목록입니다.
모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대").
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
회전 감지 객체 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.
서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다.
아니오
└ 생성_응답 boolean VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. 전사 세션에는 사용할 수 없습니다.
아니오 진실
└) 열망 enum semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.

가능한 값: low, medium, highauto
아니오
└interrupt_response 부울 VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto)으로 진행 중인 응답을 자동으로 중단할지 여부입니다. 전사 세션에는 사용할 수 없습니다.
아니오 진실
└prefix_padding_ms integer server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 enum 턴 감지 유형입니다.

가능한 값: server_vadsemantic_vad
아니오

응답

상태 코드: 200

설명: 세션이 성공적으로 생성되었습니다.

콘텐츠-타입 유형 설명
application/json RealtimeTranscriptionSessionCreateResponse

응답

POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview

모델 응답을 만듭니다.

요청 본문

Content-Type: application/json

이름 유형 설명 필수 기본값
include array 아니오
입력 문자열 또는 배열 모델 입력
지침 문자열 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다.

함께 previous_response_id사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다.
아니오
최대 출력 토큰 integer 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다.
아니오
병렬 도구 호출 boolean 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다.
아니오 진실
이전_응답_아이디 문자열 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. 대화 상태에 대해 자세히 알아봅니다.
아니오
추리 이성적 사고 o 시리즈 모델만

추론 모델에 대한 구성 옵션입니다.
아니오
store boolean API를 통해 나중에 검색할 수 있도록 생성된 모델 응답을 저장할지 여부입니다.
아니오 진실
스트림 boolean true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다.
자세한 내용은 아래 스트리밍 섹션을 참조하세요.
아니오 거짓
문자 메시지 객체 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요:
- 텍스트 입력 및 출력
- 구조적 출력
아니오
└─ 형식 TextResponseFormatConfiguration 모델이 출력해야 하는 형식을 지정하는 개체입니다.

구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다.

기본 형식은 { "type": "text" } 추가 옵션이 없습니다.

gpt-4o 및 최신 모델에는 권장되지 않습니다.

{ "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다.
아니오
도구_선택 ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다.
아니오
도구들 array 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.

모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다.

- 기본 제공 도구: OpenAI에서 제공하며 기능을 확장하는 도구로,
모델의 기능
아니오
truncation 열거형 모델 응답에 사용할 잘림 전략입니다.
- auto: 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다.
- disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.

가능한 값: autodisabled
아니오

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 응답
텍스트/이벤트-스트림 응답스트림이벤트

상태 코드: 기본값

설명: 서비스를 사용할 수 없음

콘텐츠-타입 유형 설명
application/json errorResponse

응답 API - 입력 항목

GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

지정된 ID를 사용하여 모델 응답을 검색합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
응답_아이디 문자열 검색할 응답의 ID입니다.
include 문의 아니오 array 응답에 포함할 추가 필드입니다. include 자세한 내용은 위의 응답 생성 매개 변수를 참조하세요.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json 응답

상태 코드: 기본값

설명: 서비스를 사용할 수 없음

콘텐츠-타입 유형 설명
application/json errorResponse

응답 삭제

DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview

지정된 ID를 사용하여 모델 응답을 삭제합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
응답_아이디 문자열 삭제할 응답의 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

상태 코드: 404

설명: 찾을 수 없음

콘텐츠-타입 유형 설명
application/json 오류

상태 코드: 기본값

설명: 서비스를 사용할 수 없음

콘텐츠-타입 유형 설명
application/json errorResponse

응답 API - 응답 항목 목록

GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview

지정된 응답에 대한 입력 항목 목록을 반환합니다.

URI 매개 변수

이름 그런 다음 필수 유형 설명
끝점 문자열 url 지원되는 Azure OpenAI 엔드포인트(프로토콜 및 호스트 이름(예: https://aoairesource.openai.azure.com). "aoairesource"를 Azure OpenAI 리소스 이름으로 대체). https://{your-resource-name}.openai.azure.com
응답_아이디 문자열 입력 항목을 검색할 응답의 ID입니다.
한계 문의 아니오 integer 반환할 개체 수에 대한 제한입니다. 제한 범위는 1~100이며 기본값은 20입니다.
주문 문의 아니오 문자열
가능한 값: ascdesc
입력 항목을 반환하는 순서입니다. 기본값은 asc입니다.
- asc: 입력 항목을 오름차순으로 반환합니다.
- desc: 입력 항목을 내림차순으로 반환합니다.
after 문의 아니오 문자열 페이징에서 특정 항목 이후의 항목들을 나열하기 위해 사용되는 항목 ID입니다.
before 문의 아니오 문자열 페이지네이션에 사용되는 앞에 나열할 항목들의 아이템 ID입니다.

요청 헤더

토큰 기반 인증 또는 API 키를 사용합니다. 토큰 기반 인증을 사용하여 인증하는 것이 좋습니다.

이름 필수 유형 설명
승인 진실 문자열 예제Authorization: Bearer {Azure_OpenAI_Auth_Token}:

Azure CLI를 사용하여 인증 토큰을 생성하려면 다음을 수행합니다. az account get-access-token --resource https://cognitiveservices.azure.com

형식: oauth2
권한 부여 URL: https://login.microsoftonline.com/common/oauth2/v2.0/authorize
범위: https://cognitiveservices.azure.com/.default
API 키 진실 문자열 여기에서 Azure OpenAI API 키를 제공합니다.

응답

상태 코드: 200

설명: 정상

콘텐츠-타입 유형 설명
application/json responseItemList

구성 요소

errorResponse

이름 유형 설명 필수 기본값
오류 오류 아니오

오류베이스

이름 유형 설명 필수 기본값
코드 문자열 아니오
메시지 문자열 아니오

오류

이름 유형 설명 필수 기본값
내부_오류 innerError 추가 세부 정보가 포함된 내부 오류입니다. 아니오
param 문자열 아니오
유형 문자열 아니오

내부 오류

추가 세부 정보가 포함된 내부 오류입니다.

이름 유형 설명 필수 기본값
코드 innerErrorCode 내부 오류 개체에 대한 오류 코드입니다. 아니오
콘텐츠 필터 결과 contentFilterPromptResults 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. 아니오

내부 오류 코드

내부 오류 개체에 대한 오류 코드입니다.

재산 가치
설명 내부 오류 개체에 대한 오류 코드입니다.
유형 문자열
ResponsibleAIPolicyViolation

dalleErrorResponse

이름 유형 설명 필수 기본값
오류 dalleError 아니오

dalleError

이름 유형 설명 필수 기본값
내부_오류 dalleInnerError 추가 세부 정보가 포함된 내부 오류입니다. 아니오
param 문자열 아니오
유형 문자열 아니오

dalleInnerError

추가 세부 정보가 포함된 내부 오류입니다.

이름 유형 설명 필수 기본값
코드 innerErrorCode 내부 오류 개체에 대한 오류 코드입니다. 아니오
콘텐츠 필터 결과 dalleFilterResults 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. 아니오
수정된_프롬프트 문자열 프롬프트에 수정 버전이 있는 경우 이미지를 생성하는 데 사용된 프롬프트입니다. 아니오

contentFilterCompletionTextSpan

생성된 완성 텍스트 내의 범위를 설명합니다. 오프셋 0은 완성 텍스트의 첫 번째 UTF32 코드 포인트입니다.

이름 유형 설명 필수 기본값
completion_end_offset integer 범위에서 제외되는 첫 번째 UTF32 코드 포인트의 오프셋입니다. 이 필드는 빈 범위에 대해 항상 completion_start_offset과 같습니다. 이 필드는 비어있지 않은 범위에 대해 항상 completion_start_offset보다 큽니다.
completion_start_offset integer 범위를 시작하는 UTF32 코드 포인트의 오프셋입니다.

contentFilterResultBase

이름 유형 설명 필수 기본값
filtered boolean

contentFilterSeverityResult

이름 유형 설명 필수 기본값
filtered boolean
심각성 문자열 아니오

콘텐츠 필터 감지 결과

이름 유형 설명 필수 기본값
탐지됨 boolean 아니오
filtered boolean

콘텐츠 필터가 인용 결과와 함께 감지됨

이름 유형 설명 필수 기본값
인용 객체 아니오
└─ URL 문자열 아니오
└) 라이선스 문자열 아니오

contentFilterDetectedWithCompletionTextSpansResult

이름 유형 설명 필수 기본값
세부 정보 array 아니오

contentFilterIdResult

이름 유형 설명 필수 기본값
filtered boolean
아이디 문자열 아니오

contentFilterResultsBase

콘텐츠 필터링 결과에 대한 정보입니다.

이름 유형 설명 필수 기본값
사용자 지정 차단 목록 콘텐츠 필터 상세 결과 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. 아니오
오류 errorBase 아니오
hate 내용필터심각도결과 아니오
모독 컨텐츠 필터 감지 결과 아니오
자해 내용필터심각도결과 아니오
성적인 내용필터심각도결과 아니오
폭력 내용필터심각도결과 아니오

contentFilterPromptResults

콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.

이름 유형 설명 필수 기본값
사용자 정의 차단 목록 콘텐츠 필터 상세 결과 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. 아니오
오류 errorBase 아니오
hate 내용필터심각도결과 아니오
간접 공격 컨텐츠 필터 감지 결과 아니오
탈옥 컨텐츠 필터 감지 결과 아니오
모독 컨텐츠 필터 감지 결과 아니오
자해 내용필터심각도결과 아니오
성적인 내용필터심각도결과 아니오
폭력 내용필터심각도결과 아니오

콘텐츠 필터 선택 결과

콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 타사 텍스트 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.

이름 유형 설명 필수 기본값
사용자 지정 차단 목록 콘텐츠 필터 상세 결과 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. 아니오
오류 errorBase 아니오
hate 내용필터심각도결과 아니오
모독 컨텐츠 필터 감지 결과 아니오
보호된_자료_코드 콘텐츠 필터가 인용 결과로 감지됨 아니오
보호된_자료_텍스트 컨텐츠 필터 감지 결과 아니오
자해 내용필터심각도결과 아니오
성적인 내용필터심각도결과 아니오
ungrounded_material contentFilterDetectedWithCompletionTextSpansResult 아니오
폭력 내용필터심각도결과 아니오

콘텐츠 필터 상세 결과

필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다.

이름 유형 설명 필수 기본값
세부 정보 array 아니오
filtered boolean

promptFilterResult

요청의 단일 프롬프트에 대한 콘텐츠 필터링 결과입니다.

이름 유형 설명 필수 기본값
콘텐츠 필터 결과 contentFilterPromptResults 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. 아니오
프롬프트_인덱스 integer 아니오

promptFilterResults

요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

달레 콘텐츠 필터 결과

콘텐츠 필터링 결과에 대한 정보입니다.

이름 유형 설명 필수 기본값
hate 내용필터심각도결과 아니오
자해 내용필터심각도결과 아니오
성적인 내용필터심각도결과 아니오
폭력 내용필터심각도결과 아니오

dalleFilterResults

콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다.

이름 유형 설명 필수 기본값
사용자 지정 차단 목록 콘텐츠 필터 상세 결과 필터링된 세그먼트에 대한 콘텐츠 필터 ID의 세부 정보가 포함된 콘텐츠 필터링 결과입니다. 아니오
hate 내용필터심각도결과 아니오
탈옥 컨텐츠 필터 감지 결과 아니오
모독 컨텐츠 필터 감지 결과 아니오
자해 내용필터심각도결과 아니오
성적인 내용필터심각도결과 아니오
폭력 내용필터심각도결과 아니오

chatCompletionsRequestCommon

이름 유형 설명 필수 기본값
frequency_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다. 아니오 0
logit_bias 객체 지정된 토큰이 완성에 나타날 가능성을 수정합니다. 토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 json 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다. 아니오
최대_완료_토큰 integer 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. 아니오
최대 토큰 수 integer 생성된 답변에 허용되는 최대 토큰 수입니다. 기본적으로 모델이 반환할 수 있는 토큰 수는 (4096 - 프롬프트 토큰)입니다. o1 시리즈 모델과 호환되지 않습니다. 아니오 4096
메타데이터 객체 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. 아니오
presence_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다. 아니오 0
멈춰! 문자열 또는 배열 API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 아니오
store boolean 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. 아니오
스트림 boolean 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. 아니오 거짓
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.
일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 Azure OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. 아니오

완료요청생성

이름 유형 설명 필수 기본값
best_of integer 서버 쪽에서 best_of 완료를 생성하고 "최상"(토큰당 로그 확률이 가장 높은 것)을 반환합니다. 결과를 스트리밍할 수 없습니다.

사용할 nbest_of 경우 후보 완료 횟수를 제어하고 n 반환할 수를 지정합니다. best_ofn보다 커야 합니다.

참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokensstop에 대한 설정이 적절한지 확인합니다.
아니오 1
echo boolean 완성을 제공하는 것 외에 프롬프트를 다시 표시합니다.
아니오 거짓
frequency_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다.
아니오 0
logit_bias 객체 지정된 토큰이 완성에 나타날 가능성을 수정합니다.

토큰(GPT 토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다.

예를 들어, {"50256": -100}을 전달하면 <|endoftext|> 토큰이 생성되지 않습니다.
아니오 없음
logprobs integer 가장 가능성이 높은 logprobs 출력 토큰과 선택한 토큰에 대한 로그 확률을 포함합니다. 예를 들어, logprobs가 5이면 API는 가장 가능성 있는 5개의 토큰 목록을 반환합니다. API는 항상 샘플링된 토큰의 logprob를 반환하므로 응답에 최대 logprobs+1개의 요소가 있을 수 있습니다.

logprobs의 최댓값은 5입니다.
아니오 없음
최대 토큰 수 integer 완료 시 최대 토큰 수를 생성할 수 있습니다.

프롬프트의 토큰 수에 max_tokens를 더한 값은 모델의 컨텍스트 길이를 초과할 수 없습니다.
아니오 16
n integer 각 프롬프트에 대해 생성할 완성 수입니다.

참고: 이 매개 변수는 많은 완료를 생성하므로 토큰 할당량을 빠르게 소모할 수 있습니다. 신중하게 사용하고 max_tokensstop에 대한 설정이 적절한지 확인합니다.
아니오 1
presence_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다.
아니오 0
프롬프트 문자열 또는 배열 문자열, 문자열 배열, 토큰 배열 또는 토큰 배열의 배열로 인코딩된 완성을 생성하라는 프롬프트입니다.

<|endoftext|>는 학습 중에 모델이 보는 문서 구분 기호이므로 프롬프트가 지정되지 않은 경우 모델은 새 문서의 시작 부분에서 생성되는 것처럼 생성됩니다.
씨앗 integer 지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.

결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다.
아니오
멈춰! 문자열 또는 배열 API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다.
아니오
스트림 boolean 부분 진행률을 다시 스트리밍할지 여부를 나타냅니다. 설정된 경우 토큰은 데이터 전용 서버 전송 이벤트로 전송되며 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제
아니오 거짓
suffix 문자열 삽입된 텍스트 완성 뒤에 오는 접미사입니다.

이 매개 변수는 gpt-3.5-turbo-instruct에만 지원됩니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.

일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다.
아니오

완성 응답 생성

API의 완성 응답을 나타냅니다. 참고: 스트리밍된 응답 개체와 비스트림 응답 개체는 채팅 엔드포인트와 달리 동일한 셰이프를 공유합니다.

이름 유형 설명 필수 기본값
선택 array 입력 프롬프트에 대해 생성된 모델의 완료 선택 목록입니다.
created integer 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 완성의 고유 식별자입니다.
model 문자열 완성에 사용되는 모델입니다.
객체 enum 항상 “text_completion”인 개체 형식입니다.
가능한 값: text_completion
prompt_filter_results promptFilterResults 요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다. 아니오
system_fingerprint 문자열 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다.

결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다.
아니오
사용량 completionUsage 완성 요청의 사용 통계입니다. 아니오

채팅 완료 요청 생성

이름 유형 설명 필수 기본값
audio 객체 오디오 출력에 대한 매개 변수입니다. 을 modalities: ["audio"]사용하여 오디오 출력을 요청할 때 필요합니다. 아니오
└─ 형식 enum 출력 오디오 형식을 지정합니다. wav, mp3, flac, opus, 또는 pcm16 중 하나여야 합니다.

가능한 값: wav, mp3, flac, opuspcm16
아니오
└─ 음성 enum 음성 유형을 지정합니다. 지원되는 음성은 alloy,echo, fable, onyxnovashimmer.

가능한 값: alloy, echo, fableonyx, novashimmer
아니오
데이터_소스 array 이를 사용하는 Azure OpenAI 채팅 확장에 대한 구성 항목입니다.
이 추가 사양은 Azure OpenAI와만 호환됩니다.
아니오
frequency_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트의 기존 빈도를 기준으로 새 토큰에 불이익을 주어 모델이 동일한 줄을 그대로 반복할 가능성을 줄입니다.
아니오 0
함수 호출 문자열 또는 chatCompletionFunctionCallOption tool_choice에는 더 이상 사용되지 않습니다.

모델에서 호출되는 함수(해당하는 경우)를 제어합니다.
none은 모델이 함수를 호출하지 않고 대신 메시지를 생성함을 의미합니다.
auto는 모델이 메시지 생성 또는 함수 호출 중에서 선택할 수 있음을 의미합니다.
{"name": "my_function"}을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.

함수가 없을 경우 none이 기본값입니다. 함수가 있는 경우 auto가 기본값입니다.
아니오
기능 array tools에는 더 이상 사용되지 않습니다.

모델이 JSON 입력을 생성할 수 있는 함수 목록입니다.
아니오
logit_bias 객체 지정된 토큰이 완성에 나타날 가능성을 수정합니다.

토큰(토크나이저에서 토큰 ID로 지정)을 -100에서 100 사이의 관련 바이어스 값에 매핑하는 JSON 개체를 허용합니다. 수학적으로, 바이어스는 샘플링 전에 모델에 의해 생성된 로짓에 추가됩니다. 정확한 효과는 모델마다 다르지만 -1과 1 사이의 값은 선택 가능성을 줄이거나 높입니다. -100 또는 100과 같은 값은 관련 토큰을 금지하거나 독점적으로 선택하게 합니다.
아니오 없음
logprobs boolean 출력 토큰의 로그 확률을 반환할지 여부를 나타냅니다. true인 경우 contentmessage에 반환된 각 출력 토큰의 로그 확률을 반환합니다. 아니오 거짓
최대_완료_토큰 integer 표시되는 출력 토큰 및 추론 토큰을 포함하여 완성을 위해 생성할 수 있는 토큰 수의 상한입니다. o1 시리즈 모델에서만 지원됩니다. 향후 API 릴리스에서 다른 모델로 지원을 확장할 예정입니다. 아니오
최대 토큰 수 integer 채팅 완성 시 생성할 수 있는 최대 토큰 수입니다.

입력 토큰과 생성된 토큰의 총 길이는 모델의 컨텍스트 길이에 따라 제한됩니다.
아니오
메시지 array 지금까지의 대화를 구성하는 메시지 목록입니다. Python 코드 예제
메타데이터 객체 저장된 완성 대시보드에서 완성을 필터링하는 데 사용되는 개발자 정의 태그 및 값입니다. 아니오
형식 ChatCompletionModalities 이 요청에 대해 모델이 생성할 출력 형식입니다.
대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.

["text"]

gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.

["text", "audio"]
아니오
n integer 각 입력 메시지에 대해 생성할 채팅 완성 선택 항목 수입니다. 모든 선택 항목에 걸쳐 생성된 토큰 수에 따라 요금이 부과됩니다. 비용을 최소화하려면 n1로 유지합니다. 아니오 1
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
prediction PredictionContent 예측 출력에 대한 구성으로, 모델 응답의 많은 부분이 미리 알려진 경우 응답 시간을 크게 향상시킬 수 있습니다. 대부분의 콘텐츠가 약간만 변경된 파일을 다시 생성할 때 가장 일반적입니다. 아니오
presence_penalty 숫자 -2.0~2.0 사이의 숫자 양수 값은 지금까지 텍스트에 나타나는지 여부에 따라 새 토큰에 페널티를 부여하여 모델이 새 항목에 대해 이야기할 가능성을 높입니다.
아니오 0
추론 노력 enum o1 모델만

추론 모델에서 추론 작업을 제한합니다.

현재 지원되는 값은 low, mediumhigh입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.
가능한 값: low, mediumhigh
아니오
응답_형식 ResponseFormatText, ResponseFormatJsonObject 또는 ResponseFormatJsonSchema 모델이 출력해야 하는 형식을 지정하는 개체입니다. GPT-4o, GPT-4o mini, GPT-4 Turbo보다 최신인 모든 gpt-3.5-turbo-1106 Turbo 모델과 호환됩니다.

{ "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 보장하는 구조적 출력을 사용하도록 설정합니다.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
씨앗 integer 이 기능은 베타 버전으로 제공됩니다.
지정된 경우 시스템은 결정론적으로 샘플링하기 위해 최선을 다하므로 동일한 seed 및 매개 변수를 사용하는 반복 요청이 동일한 결과를 반환해야 합니다.
결정성은 보장되지 않으며 백 엔드의 변경 내용을 모니터링하려면 system_fingerprint 응답 매개 변수를 참조해야 합니다.
아니오
멈춰! 문자열 또는 배열 API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다.
아니오
store boolean 모델 증류 또는 평가 제품에 사용하기 위해 이 채팅 완성 요청의 출력을 저장할지 여부입니다. 아니오
스트림 boolean 설정되면 ChatGPT의 경우처럼 부분 메시지 델타가 전송됩니다. 토큰은 사용할 수 있게 되면 데이터 전용 서버 전송 이벤트로 전송되고 스트림은 data: [DONE] 메시지로 종료됩니다. Python 코드 예제
아니오 거짓
스트림 옵션 채팅완료스트림옵션 스트리밍 응답에 대한 옵션입니다. stream: true를 설정할 때만 설정합니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.

일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
도구_선택 chatCompletionToolChoiceOption 모델이 호출하는 도구(있는 경우)를 제어합니다. none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다. auto는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}}을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none은 도구가 없는 경우 기본값입니다. auto는 도구가 있는 경우 기본값입니다. 아니오
도구들 array 모델이 호출할 수 있는 도구 목록입니다. 현재 함수만 도구로 지원됩니다. 모델이 JSON 입력을 생성할 수 있는 함수 목록을 제공하려면 이를 사용합니다. 최대 128개의 함수가 지원됩니다.
아니오
top_logprobs integer 각 토큰 위치에서 반환될 가능성이 가장 높은 토큰 수를 지정하는 0에서 20 사이의 정수로, 각 토큰에는 관련 로그 가능성이 있습니다. 이 매개 변수를 사용하는 경우 logprobstrue로 설정해야 합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다.
아니오
사용자 보안 컨텍스트 userSecurityContext 사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다. 아니오

사용자보안컨텍스트

사용자 보안 컨텍스트에는 AI 애플리케이션 자체와 AI 애플리케이션과 상호 작용하는 최종 사용자를 설명하는 몇 가지 매개 변수가 포함되어 있습니다. 이러한 필드는 AI 애플리케이션을 보호하는 포괄적인 접근 방식을 제공하여 보안 운영 팀이 보안 인시던트를 조사하고 완화할 수 있도록 지원합니다. 클라우드용 Microsoft Defender를 사용하여 AI 애플리케이션을 보호하는 방법에 대해 자세히 알아봅니다.

이름 유형 설명 필수 기본값
애플리케이션 이름 문자열 애플리케이션의 이름입니다. 중요한 개인 정보는 이 필드에 포함하지 않아야 합니다. 아니오
end_user_id 문자열 이 식별자는 생성형 AI 애플리케이션 내에서 최종 사용자를 인증하는 데 사용되는 Microsoft Entra ID(이전의 Azure Active Directory) 사용자 개체 ID입니다. 중요한 개인 정보는 이 필드에 포함하지 않아야 합니다. 아니오
최종 사용자 테넌트 ID 문자열 최종 사용자가 속한 Microsoft 365 테넌트 ID입니다. 생성형 AI 애플리케이션이 다중 테넌트인 경우 필요합니다. 아니오
출처 아이피 문자열 IPv4 및 IPv6 형식을 모두 수락하여 원래 클라이언트의 IP 주소를 캡처합니다. 아니오

채팅완료기능

이름 유형 설명 필수 기본값
설명 문자열 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. 아니오
이름 문자열 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다.
매개 변수 FunctionParameters 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.

parameters를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다.
아니오

chatCompletionFunctionCallOption

{"name": "my_function"}을 통해 특정 함수를 지정하면 모델이 해당 함수를 호출하게 됩니다.

이름 유형 설명 필수 기본값
이름 문자열 호출할 함수의 이름입니다.

채팅 완성 기능 매개변수 (chatCompletionFunctionParameters)

함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드/를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.

이 구성 요소에 대해 정의된 속성이 없습니다.

채팅 완료 요청 메시지

이 구성 요소는 다음 중 하나일 수 있습니다.

대화완성요청개발자메시지

사용자가 보낸 메시지에 관계없이 모델이 따라야 하는 개발자 제공 지침입니다. o1 모델 이상에서는 developer 메시지가 이전 system 메시지를 대체합니다.

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 개발자 메시지의 콘텐츠입니다.
이름 문자열 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. 아니오
역할 enum 메시지 작성자의 역할(이 경우 developer)입니다.
가능한 값: developer

채팅 완료 요청 시스템 메시지

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 시스템 메시지의 콘텐츠입니다.
이름 문자열 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. 아니오
역할 enum 메시지 작성자의 역할(이 경우 system)입니다.
가능한 값: system

채팅완료요청사용자메시지

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 사용자 메시지의 콘텐츠입니다.
이름 문자열 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. 아니오
역할 enum 메시지 작성자의 역할(이 경우 user)입니다.
가능한 값: user

chatCompletionRequestAssistantMessage

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 보조 메시지의 콘텐츠입니다. tool_calls 또는 function_call이 지정되지 않은 경우 필수입니다.
아니오
함수 호출 객체 더 이상 사용되지 않으며 tool_calls로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. 아니오
└─ 인수 문자열 JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. 아니오
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
이름 문자열 참가자의 선택적 이름입니다. 동일한 역할의 참가자를 구별하기 위한 모델 정보를 제공합니다. 아니오
거절 문자열 도우미가 보낸 거절 메시지입니다. 아니오
역할 enum 메시지 작성자의 역할(이 경우 assistant)입니다.
가능한 값: assistant
도구 호출 chatCompletionMessageToolCalls 함수 호출과 같이 모델에서 생성된 도구 호출입니다. 아니오

chatCompletionRequestToolMessage

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 도구 메시지의 콘텐츠입니다.
역할 enum 메시지 작성자의 역할(이 경우 tool)입니다.
가능한 값: tool
도구_호출_아이디 문자열 이 메시지가 응답하는 도구 호출입니다.

채팅완성요청기능메시지

이름 유형 설명 필수 기본값
내용 문자열 함수 메시지의 콘텐츠입니다.
이름 문자열 호출할 함수의 이름입니다.
역할 enum 메시지 작성자의 역할(이 경우 function)입니다.
가능한 값: function

채팅 완료 요청 개발자 메시지 콘텐츠 부분

이 구성 요소는 다음 중 하나일 수 있습니다.

채팅 완성 요청 시스템 메시지 콘텐츠 부분

이 구성 요소는 다음 중 하나일 수 있습니다.

채팅완료요청사용자메시지내용부분

이 구성 요소는 다음 중 하나일 수 있습니다.

채팅 완료 요청 어시스턴트 메시지 콘텐츠 부분

이 구성 요소는 다음 중 하나일 수 있습니다.

chatCompletionRequestToolMessageContentPart

이 구성 요소는 다음 중 하나일 수 있습니다.

chatCompletionRequestMessageContentPartText

이름 유형 설명 필수 기본값
문자 메시지 문자열 텍스트 콘텐츠입니다.
유형 enum 콘텐츠 부분의 형식입니다.
가능한 값: text

chatCompletionRequestMessageContentPartAudio

이름 유형 설명 필수 기본값
오디오 입력 객체
└) 데이터 문자열 Base64로 인코딩된 오디오 데이터입니다. 아니오
└─ 형식 enum 인코딩된 오디오 데이터의 형식입니다. 현재 "wav" 및 "mp3"를 지원합니다.

가능한 값: wavmp3
아니오
유형 enum 콘텐츠 부분의 형식입니다. 항상 input_audio입니다.
가능한 값: input_audio

chatCompletionRequestMessageContentPartImage

이름 유형 설명 필수 기본값
image_url 객체
└) 세부 정보 enum 이미지의 세부 수준을 지정합니다. 자세한 내용은 비전 가이드에서 확인합니다.
가능한 값: auto, lowhigh
아니오
└─ url 문자열 이미지의 URL 또는 base64로 인코딩된 이미지 데이터입니다. 아니오
유형 enum 콘텐츠 부분의 형식입니다.
가능한 값: image_url

chatCompletionRequestMessageContentPartRefusal

이름 유형 설명 필수 기본값
거절 문자열 모델이 생성한 거부 메시지입니다.
유형 enum 콘텐츠 부분의 형식입니다.
가능한 값: refusal

Azure 채팅 확장 구성

단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.

###azureChatExtensionConfiguration의 판별자

이 구성 요소는 속성을 type 사용하여 서로 다른 형식을 구분합니다.

형식 값 스키마
azure_search azureSearchChatExtensionConfiguration
azure_cosmos_db azureCosmosDBChatExtensionConfiguration
elasticsearch elasticsearchChatExtensionConfiguration
mongo_db mongoDBChatExtensionConfiguration
pinecone pineconeChatExtensionConfiguration
이름 유형 설명 필수 기본값
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

azureChatExtensionType

단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다. 이 구성의 사용은 Azure OpenAI와만 호환됩니다.

재산 가치
설명 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.
유형 문자열
azure_search
azure_cosmos_db
elasticsearch
mongo_db
pinecone

azureSearchChatExtensionConfiguration

Azure OpenAI 채팅 확장으로 사용할 때 Azure Search에 대한 구성 가능한 옵션의 특정 표현입니다.

이름 유형 설명 필수 기본값
매개 변수 Azure 검색 채팅 확장 매개변수 Azure OpenAI 채팅 확장으로 사용되는 경우 Azure Search에 대한 매개 변수입니다. 아니오
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

Azure 검색 채팅 확장 매개변수

Azure OpenAI 채팅 확장으로 사용되는 경우 Azure Search에 대한 매개 변수입니다.

이름 유형 설명 필수 기본값
부분 결과 허용 boolean true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. 아니오 거짓
인증 onYourDataApiKeyAuthenticationOptions or onYourDataSystemAssignedManagedIdentityAuthenticationOptions, onYourDataUserAssignedManagedIdentityAuthenticationOptions 또는 onYourDataAccessTokenAuthenticationOptions
embedding_dependency onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource 또는 onYourDataIntegratedVectorizationSource 아니오
끝점 문자열 사용할 Azure Search 리소스의 절대 엔드포인트 경로입니다.
fields_mapping Azure 검색 인덱스 필드 매핑 옵션 구성된 Azure Search 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. 아니오
필터 문자열 검색 필터입니다. 아니오
in_scope boolean 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. 아니오
include_contexts array 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citationsintent입니다. 아니오
인덱스_이름 문자열 참조된 Azure Search 리소스에서 사용할 수 있는 인덱스의 이름입니다.
최대 검색 쿼리 수 integer 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. 아니오
쿼리_유형 azureSearchQueryType Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다. 아니오
의미적 구성 문자열 쿼리에 대한 추가 의미 체계 구성입니다. 아니오
엄격성 integer 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. 아니오
top_n_documents integer 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. 아니오

Azure 검색 인덱스 필드 매핑 옵션

구성된 Azure Search 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.

이름 유형 설명 필수 기본값
content_fields array 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. 아니오
콘텐츠_필드_구분자 문자열 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. 아니오
filepath_field 문자열 파일 경로로 사용할 인덱스 필드의 이름입니다. 아니오
이미지_벡터_필드 array 이미지 벡터 데이터를 나타내는 필드의 이름입니다. 아니오
제목_필드 문자열 제목으로 사용할 인덱스 필드의 이름입니다. 아니오
url_field 문자열 URL로 사용할 인덱스 필드의 이름입니다. 아니오
벡터 필드 array 벡터 데이터를 나타내는 필드의 이름입니다. 아니오

Azure 검색 쿼리 유형

Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다.

재산 가치
설명 Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Azure Search 검색 쿼리의 유형입니다.
유형 문자열
simple
semantic
vector
vector_simple_hybrid
vector_semantic_hybrid

Azure Cosmos DB 채팅 확장 구성

Azure OpenAI 채팅 확장으로 사용할 때 Azure Cosmos DB에 대한 구성 가능한 옵션의 특정 표현입니다.

이름 유형 설명 필수 기본값
매개 변수 azureCosmosDBChatExtensionParameters Azure Cosmos DB for MongoDB vCore를 사용할 때 데이터 채팅 확장에서 Azure OpenAI를 구성할 때 사용할 매개 변수입니다. 아니오
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

애저코스모스DB챗익스텐션파라미터

Azure Cosmos DB for MongoDB vCore를 사용할 때 데이터 채팅 확장에서 Azure OpenAI를 구성할 때 사용할 매개 변수입니다.

이름 유형 설명 필수 기본값
부분 결과 허용 boolean true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. 아니오 거짓
인증 onYourDataConnectionStringAuthenticationOptions 연결 문자열을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
컨테이너_이름 문자열 Azure Cosmos DB 리소스 컨테이너의 이름입니다.
데이터베이스_이름 문자열 Azure Cosmos DB와 함께 사용할 MongoDB vCore 데이터베이스 이름입니다.
embedding_dependency onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource
fields_mapping azureCosmosDBFieldMappingOptions 구성된 Azure Cosmos DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
in_scope boolean 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. 아니오
include_contexts array 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citationsintent입니다. 아니오
인덱스_이름 문자열 Azure Cosmos DB와 함께 사용할 MongoDB vCore 인덱스 이름입니다.
최대 검색 쿼리 수 integer 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. 아니오
엄격성 integer 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. 아니오
top_n_documents integer 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. 아니오

azureCosmosDB필드매핑옵션

구성된 Azure Cosmos DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.

이름 유형 설명 필수 기본값
content_fields array 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다.
콘텐츠_필드_구분자 문자열 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. 아니오
filepath_field 문자열 파일 경로로 사용할 인덱스 필드의 이름입니다. 아니오
제목_필드 문자열 제목으로 사용할 인덱스 필드의 이름입니다. 아니오
url_field 문자열 URL로 사용할 인덱스 필드의 이름입니다. 아니오
벡터 필드 array 벡터 데이터를 나타내는 필드의 이름입니다.

엘라스틱서치채팅확장구성(ElasticsearchChatExtensionConfiguration)

Azure OpenAI 채팅 확장으로 사용할 때 Elasticsearch에 대한 구성 가능한 옵션의 특정 표현입니다.

이름 유형 설명 필수 기본값
매개 변수 elasticsearchChatExtensionParameters Elasticsearch®를 Azure OpenAI 채팅 확장으로 구성할 때 사용할 매개 변수입니다. 아니오
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

엘라스틱서치채팅확장매개변수

Elasticsearch®를 Azure OpenAI 채팅 확장으로 구성할 때 사용할 매개 변수입니다.

이름 유형 설명 필수 기본값
부분 결과 허용 boolean true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. 아니오 거짓
인증 onYourDataKeyAndKeyIdAuthenticationOptions 또는 onYourDataEncodedApiKeyAuthenticationOptions
embedding_dependency onYourDataEndpointVectorizationSource, onYourDataDeploymentNameVectorizationSource 또는 onYourDataModelIdVectorizationSource 아니오
끝점 문자열 Elasticsearch®의 엔드포인트입니다.
fields_mapping elasticsearchIndexFieldMappingOptions 구성된 Elasticsearch® 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다. 아니오
in_scope boolean 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. 아니오
include_contexts array 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citationsintent입니다. 아니오
인덱스_이름 문자열 Elasticsearch®의 인덱스 이름입니다.
최대 검색 쿼리 수 integer 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. 아니오
쿼리_유형 elasticsearchQueryType Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다. 아니오
엄격성 integer 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. 아니오
top_n_documents integer 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. 아니오

엘라스틱서치 인덱스 필드 매핑 옵션

구성된 Elasticsearch® 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.

이름 유형 설명 필수 기본값
content_fields array 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다. 아니오
콘텐츠_필드_구분자 문자열 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. 아니오
filepath_field 문자열 파일 경로로 사용할 인덱스 필드의 이름입니다. 아니오
제목_필드 문자열 제목으로 사용할 인덱스 필드의 이름입니다. 아니오
url_field 문자열 URL로 사용할 인덱스 필드의 이름입니다. 아니오
벡터 필드 array 벡터 데이터를 나타내는 필드의 이름입니다. 아니오

엘라스틱서치쿼리유형

Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다.

재산 가치
설명 Azure OpenAI 채팅 확장으로 사용할 때 실행해야 하는 Elasticsearch® 검색 쿼리의 유형입니다.
유형 문자열
simple
vector

몽고DB채팅확장설정

Azure OpenAI 채팅 확장 기능으로 Mongo DB를 사용할 때 구성 가능한 옵션에 대한 구체적인 표현입니다.

이름 유형 설명 필수 기본값
매개 변수 mongoDBChatExtensionParameters Mongo DB를 사용하여 Azure OpenAI On Your Data 채팅 확장을 구성할 때 사용할 매개 변수입니다. 아니오
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

mongoDB채팅확장매개변수

Mongo DB를 사용하여 Azure OpenAI On Your Data 채팅 확장을 구성할 때 사용할 매개 변수입니다.

이름 유형 설명 필수 기본값
부분 결과 허용 boolean true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. 아니오 거짓
앱_이름 문자열 Mongo DB 애플리케이션의 이름입니다.
인증 onYourDataUsernameAndPasswordAuthenticationOptions 사용자 이름과 암호를 사용할 때 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
컬렉션 이름 문자열 Mongo DB 컬렉션의 이름입니다.
데이터베이스_이름 문자열 MongoDB 데이터베이스의 이름입니다.
embedding_dependency onYourDataEndpointVectorizationSource 또는 onYourDataDeploymentNameVectorizationSource
끝점 문자열 Mongo DB 클러스터 엔드포인트의 이름입니다.
fields_mapping mongoDBFieldMappingOptions 구성된 Mongo DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하기 위한 선택적 설정입니다.
in_scope boolean 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. 아니오
include_contexts array 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citationsintent입니다. 아니오
인덱스_이름 문자열 MongoDB 인덱스의 이름입니다.
최대 검색 쿼리 수 integer 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. 아니오
엄격성 integer 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. 아니오
top_n_documents integer 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. 아니오

mongoDB필드매핑옵션

구성된 Mongo DB 리소스를 사용할 때 필드가 처리되는 방식을 제어하기 위한 선택적 설정입니다.

이름 유형 설명 필수 기본값
content_fields array 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다.
콘텐츠_필드_구분자 문자열 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. 아니오
filepath_field 문자열 파일 경로로 사용할 인덱스 필드의 이름입니다. 아니오
제목_필드 문자열 제목으로 사용할 인덱스 필드의 이름입니다. 아니오
url_field 문자열 URL로 사용할 인덱스 필드의 이름입니다. 아니오
벡터 필드 array 벡터 데이터를 나타내는 필드의 이름입니다.

pineconeChatExtensionConfiguration

Azure OpenAI 채팅 확장으로 사용할 때 Pinecone에 대한 구성 가능한 옵션의 특정 표현입니다.

이름 유형 설명 필수 기본값
매개 변수 pineconeChatExtensionParameters Azure OpenAI Pinecone 채팅 확장을 구성하기 위한 매개 변수입니다. 아니오
유형 azureChatExtensionType 단일 Azure OpenAI 채팅 확장에 대한 구성 데이터의 표현입니다. Azure OpenAI 채팅 확장을 사용하여 응답 동작을 보강해야 하는 채팅 완성 요청에 사용됩니다.
이 구성의 사용은 Azure OpenAI와만 호환됩니다.

pineconeChatExtensionParameters

Azure OpenAI Pinecone 채팅 확장을 구성하기 위한 매개 변수입니다.

이름 유형 설명 필수 기본값
부분 결과 허용 boolean true로 지정하면 시스템에서 부분 검색 결과를 사용할 수 있으며 모든 쿼리가 실패하면 요청이 실패합니다. 지정하지 않거나 false로 지정하면 검색 쿼리가 실패할 경우 요청이 실패합니다. 아니오 거짓
인증 onYourDataApiKeyAuthenticationOptions API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.
embedding_dependency onYourDataDeploymentNameVectorizationSource 벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 동일한 Azure OpenAI 리소스의 내부 포함 모델 배포 이름을 기준으로 하는 벡터화 원본의 세부 정보입니다.
환경 문자열 Pinecone의 환경 이름입니다.
fields_mapping 파인콘 필드 매핑 옵션 구성된 Pinecone 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.
in_scope boolean 쿼리를 인덱싱된 데이터 사용으로 제한해야 하는지 여부입니다. 아니오
include_contexts array 출력 컨텍스트의 포함된 속성입니다. 지정하지 않은 경우 기본값은 citationsintent입니다. 아니오
인덱스_이름 문자열 Pinecone 데이터베이스 인덱스의 이름입니다.
최대 검색 쿼리 수 integer 다시 작성된 쿼리의 최대 수는 검색 공급자에게 하나의 사용자 메시지를 보내야 합니다. 지정하지 않으면 시스템에서 보낼 쿼리 수를 결정합니다. 아니오
엄격성 integer 검색 관련성 필터링의 구성된 엄격성입니다. 엄격성이 높을수록 정밀도가 높지만 대답의 재현율이 낮습니다. 아니오
top_n_documents integer 구성된 쿼리에 대해 기능할 구성된 상위 문서 수입니다. 아니오

pineconeFieldMappingOptions

구성된 Pinecone 리소스를 사용할 때 필드가 처리되는 방식을 제어하는 선택적 설정입니다.

이름 유형 설명 필수 기본값
content_fields array 콘텐츠로 처리해야 하는 인덱스 필드의 이름입니다.
콘텐츠_필드_구분자 문자열 콘텐츠 필드에서 사용해야 하는 구분 기호 패턴입니다. 아니오
filepath_field 문자열 파일 경로로 사용할 인덱스 필드의 이름입니다. 아니오
제목_필드 문자열 제목으로 사용할 인덱스 필드의 이름입니다. 아니오
url_field 문자열 URL로 사용할 인덱스 필드의 이름입니다. 아니오

onYourDataAuthenticationOptions

Azure OpenAI On Your Data에 대한 인증 옵션입니다.

onYourDataAuthenticationOptions에 대한 판별자

이 구성 요소는 속성을 type 사용하여 서로 다른 형식을 구분합니다.

형식 값 스키마
api_key onYourDataApiKeyAuthenticationOptions
connection_string onYourDataConnectionStringAuthenticationOptions
key_and_key_id 귀하의 데이터 키 및 키 ID 인증 옵션에서
encoded_api_key onYourDataEncodedApiKeyAuthenticationOptions
access_token onYourDataAccessTokenAuthenticationOptions
system_assigned_managed_identity onYourDataSystemAssignedManagedIdentityAuthenticationOptions
user_assigned_managed_identity onYourDataUserAssignedManagedIdentityAuthenticationOptions
username_and_password onYourDataUsernameAndPasswordAuthenticationOptions
이름 유형 설명 필수 기본값
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataContextProperty

컨텍스트 속성입니다.

재산 가치
설명 컨텍스트 속성입니다.
유형 문자열
citations
intent
all_retrieved_documents

onYourDataAuthenticationType

Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

재산 가치
설명 Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.
유형 문자열
api_key
connection_string
key_and_key_id
encoded_api_key
access_token
system_assigned_managed_identity
user_assigned_managed_identity
username_and_password

onYourDataApiKeyAuthenticationOptions

API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
열쇠 문자열 인증에 사용할 API 키입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataConnectionStringAuthenticationOptions

연결 문자열을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
연결 문자열 문자열 인증에 사용할 연결 문자열입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataKeyAndKeyIdAuthenticationOptions

Elasticsearch 키 및 키 ID 쌍을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
열쇠 문자열 인증에 사용할 Elasticsearch 키입니다. 아니오
키_아이디 문자열 인증에 사용할 Elasticsearch 키 ID입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataEncodedApiKeyAuthenticationOptions

Elasticsearch 인코딩된 API 키를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
인코딩된_API_키 문자열 인증에 사용할 Elasticsearch로 인코딩된 API 키입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataAccessTokenAuthenticationOptions

액세스 토큰을 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
액세스 토큰 (access_token) 문자열 인증에 사용할 액세스 토큰입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataSystemAssignedManagedIdentityAuthenticationOptions

시스템 할당 관리 ID를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataUserAssignedManagedIdentityAuthenticationOptions

사용자 할당 관리 ID를 사용하는 경우 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
managed_identity_resource_id 문자열 인증에 사용할 사용자 할당 관리 ID의 리소스 ID입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.

onYourDataUsernameAndPasswordAuthenticationOptions

사용자 이름과 암호를 사용할 때 Azure OpenAI On Your Data에 대한 인증 옵션입니다.

이름 유형 설명 필수 기본값
암호 문자열 암호입니다. 암호입니다. 아니오
유형 onYourDataAuthenticationType Azure OpenAI On Your Data에서 지원되는 인증 유형입니다.
사용자 이름 문자열 인증에 사용할 사용자 이름입니다. 아니오

onYourDataVectorizationSource

벡터 검색을 사용하여 Azure OpenAI On Your Data에 대한 벡터화 원본의 추상 표현입니다.

이 구성 요소는 속성을 type 사용하여 서로 다른 형식을 구분합니다.

형식 값 스키마
endpoint onYourDataEndpointVectorizationSource
deployment_name onYourDataDeploymentNameVectorizationSource
integrated onYourDataIntegratedVectorizationSource
model_id onYourDataModelIdVectorizationSource
이름 유형 설명 필수 기본값
유형 onYourDataVectorizationSourceType Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

onYourDataVectorizationSourceType

Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

재산 가치
설명 Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.
유형 문자열
endpoint
deployment_name
integrated
model_id

onYourDataEndpointVectorizationSource

벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 포함에 대한 공용 Azure OpenAI 엔드포인트 호출을 기준으로 하는 벡터화 원본의 세부 정보입니다.

이름 유형 설명 필수 기본값
인증 onYourDataApiKeyAuthenticationOptions 또는 onYourDataAccessTokenAuthenticationOptions 아니오
dimensions integer 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. 아니오
끝점 문자열 포함을 검색할 리소스 엔드포인트 URL을 지정합니다. https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings 형식이어야 합니다. api-version 쿼리 매개 변수는 허용되지 않습니다. 아니오
유형 onYourDataVectorizationSourceType Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

onYourDataDeploymentNameVectorizationSource

벡터 검색을 적용할 때 Azure OpenAI On Your Data에서 사용하며 동일한 Azure OpenAI 리소스의 내부 포함 모델 배포 이름을 기준으로 하는 벡터화 원본의 세부 정보입니다.

이름 유형 설명 필수 기본값
배포_이름 (deployment_name) 문자열 벡터화에 사용할 모델 배포의 이름을 지정합니다. 이 모델 배포는 동일한 Azure OpenAI 리소스에 있어야 하지만 On Your Data는 퍼블릭 호출이 아닌 내부 호출을 통해 이 모델 배포를 사용하므로 프라이빗 네트워크에서도 벡터를 검색할 수 있습니다. 아니오
dimensions integer 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. 아니오
유형 onYourDataVectorizationSourceType Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

onYourDataIntegratedVectorizationSource

검색 리소스 내에 정의된 통합 벡터라이저를 나타냅니다.

이름 유형 설명 필수 기본값
유형 onYourDataVectorizationSourceType Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

귀하의 데이터 모델 ID 벡터화 소스에 따라

벡터 검색을 적용하는 경우 Azure OpenAI On Your Data에서 사용하며 검색 서비스 모델 ID를 기준으로 하는 벡터화 원본의 세부 정보입니다. 현재 Elasticsearch®에서만 지원됩니다.

이름 유형 설명 필수 기본값
모델_아이디 문자열 벡터화에 사용할 모델 ID를 지정합니다. 이 모델 ID는 검색 서비스에서 정의해야 합니다. 아니오
유형 onYourDataVectorizationSourceType Azure OpenAI On Your Data가 벡터 검색에 사용할 데이터의 벡터화를 구성하는 데 사용할 수 있는 원본을 나타냅니다.

Azure 채팅 확장 메시지 컨텍스트

Azure OpenAI 채팅 확장 프로그램이 해당 채팅 완성 응답 생성에 관련될 때 사용할 수 있는 추가 컨텍스트 정보의 표현입니다. 이 컨텍스트 정보는 일치하는 확장을 사용하도록 구성된 Azure OpenAI 요청을 사용하는 경우에만 채워집니다.

이름 유형 설명 필수 기본값
모든_검색된_문서들 array 검색된 모든 문서입니다. 아니오
인용 array 응답에서 도우미 메시지를 생성하는 데 사용되는 데이터 원본 검색 결과입니다. 아니오
intent 문자열 채팅 기록에서 검색된 의도로, 컨텍스트를 진행하기 위해 다음 발화 턴으로 넘어가는 데 사용됩니다. 아니오

인용

채팅 완성 응답 메시지에 대한 인용 정보입니다.

이름 유형 설명 필수 기본값
chunk_id 문자열 인용의 청크 ID입니다. 아니오
내용 문자열 인용의 콘텐츠입니다.
파일 경로 문자열 인용의 파일 경로입니다. 아니오
rerank_score 숫자 검색된 문서의 순위 다시 매김 점수입니다. 아니오
제목 문자열 인용의 제목입니다. 아니오
url 문자열 인용의 URL입니다. 아니오

검색된 문서

검색된 문서입니다.

이름 유형 설명 필수 기본값
chunk_id 문자열 인용의 청크 ID입니다. 아니오
내용 문자열 인용의 콘텐츠입니다.
데이터_소스_인덱스 integer 데이터 원본의 인덱스입니다. 아니오
파일 경로 문자열 인용의 파일 경로입니다. 아니오
필터 이유 filterReason 검색된 문서의 필터링 이유입니다. 아니오
원본_검색_점수 숫자 검색된 문서의 원래 검색 점수입니다. 아니오
rerank_score 숫자 검색된 문서의 순위 다시 매김 점수입니다. 아니오
검색 쿼리 array 문서를 검색하는 데 사용되는 검색 쿼리입니다. 아니오
제목 문자열 인용의 제목입니다. 아니오
url 문자열 인용의 URL입니다. 아니오

필터 이유

검색된 문서의 필터링 이유입니다.

재산 가치
설명 검색된 문서의 필터링 이유입니다.
유형 문자열
score
rerank

chatCompletionMessageToolCall

이름 유형 설명 필수 기본값
기능 객체 모델이 호출한 함수입니다.
└─ 인수 문자열 JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. 아니오
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
아이디 문자열 도구 호출의 ID입니다.
유형 도구호출유형 도구 호출의 형식(이 경우 function)입니다.

툴 호출 유형

도구 호출의 형식(이 경우 function)입니다.

재산 가치
설명 도구 호출의 형식(이 경우 function)입니다.
유형 문자열
function

채팅완료요청메시지도구

이름 유형 설명 필수 기본값
내용 문자열 메시지의 콘텐츠입니다. 아니오
도구_호출_아이디 문자열 이 메시지가 응답하는 도구 호출입니다. 아니오

채팅완료요청메시지함수

이름 유형 설명 필수 기본값
내용 문자열 메시지의 콘텐츠입니다. 아니오
이름 문자열 메시지의 콘텐츠입니다. 아니오
역할 enum 메시지 작성자의 역할(이 경우 function)입니다.
가능한 값: function
아니오

createChatCompletionResponse

제공된 입력을 기준으로 모델이 반환한 채팅 완성 응답을 나타냅니다.

이름 유형 설명 필수 기본값
선택 array 채팅 완성 선택 항목 목록입니다. n이 1보다 큰 경우 2개 이상이 될 수 있습니다.
created integer 채팅 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 채팅 완성의 고유 식별자입니다.
model 문자열 채팅 완성에 사용되는 모델입니다.
객체 enum 항상 chat.completion인 개체 형식입니다.
가능한 값: chat.completion
prompt_filter_results promptFilterResults 요청에서 0개 이상의 프롬프트에 대한 콘텐츠 필터링 결과입니다. 스트리밍 요청에서 다른 프롬프트에 대한 결과는 서로 다른 시간 또는 다른 순서로 도착할 수 있습니다. 아니오
system_fingerprint 문자열 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다.

결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다.
아니오
사용량 completionUsage 완성 요청의 사용 통계입니다. 아니오

createChatCompletionStreamResponse

제공된 입력을 기준으로 모델이 반환한 채팅 완성 응답의 스트리밍된 청크를 나타냅니다.

이름 유형 설명 필수 기본값
선택 array 채팅 완성 선택 항목 목록입니다. n이 1보다 큰 경우 두 개 이상의 요소를 포함할 수 있습니다.
created integer 채팅 완성이 만들어진 시점의 Unix 타임스탬프(초)입니다. 각 청크에는 동일한 타임스탬프가 있습니다.
아이디 문자열 채팅 완성의 고유 식별자입니다. 각 청크는 동일한 ID를 갖습니다.
model 문자열 완성을 생성할 모델입니다.
객체 enum 항상 chat.completion.chunk인 개체 형식입니다.
가능한 값: chat.completion.chunk
system_fingerprint 문자열 이 지문은 모델이 실행되는 백 엔드 구성을 나타냅니다.
결정론에 영향을 미칠 수 있는 백 엔드 변경이 이루어진 시기를 이해하기 위해 seed 요청 매개 변수와 함께 사용할 수 있습니다.
아니오

chatCompletionStreamResponseDelta

스트리밍된 모델 응답을 통해 생성된 채팅 완성 델타입니다.

이름 유형 설명 필수 기본값
내용 문자열 청크 메시지의 콘텐츠입니다. 아니오
함수 호출 객체 더 이상 사용되지 않으며 tool_calls로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. 아니오
└─ 인수 문자열 JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. 아니오
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
거절 문자열 모델이 생성한 거부 메시지입니다. 아니오
역할 enum 이 메시지 작성자의 역할입니다.
가능한 값: system, user, assistanttool
아니오
도구 호출 array 아니오

chatCompletionMessageToolCallChunk

이름 유형 설명 필수 기본값
기능 객체 아니오
└─ 인수 문자열 JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요. 아니오
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
아이디 문자열 도구 호출의 ID입니다. 아니오
인덱스 integer
유형 enum 도구의 종류입니다. 현재는 function만 지원됩니다.
가능한 값: function
아니오

chatCompletionStreamOptions

스트리밍 응답에 대한 옵션입니다. stream: true를 설정할 때만 설정합니다.

이름 유형 설명 필수 기본값
include_usage boolean 설정된 경우 data: [DONE] 메시지 전에 추가 청크가 스트리밍됩니다. 이 청크의 usage 필드는 전체 요청에 대한 토큰 사용 통계를 표시하며 choices 필드는 항상 빈 배열입니다. 다른 모든 청크에도 usage 필드가 포함되지만 null 값이 포함됩니다.
아니오

chatCompletionChoiceLogProbs

선택 항목에 대한 로그 확률 정보입니다.

이름 유형 설명 필수 기본값
내용 array 로그 확률 정보가 포함된 메시지 콘텐츠 토큰 목록입니다.
거절 array 로그 가능성 정보가 포함된 메시지 거부 토큰 목록입니다. 아니오

chatCompletionTokenLogprob

이름 유형 설명 필수 기본값
바이트 array 토큰의 UTF-8 바이트 표현을 나타내는 정수 목록입니다. 문자가 여러 토큰으로 표현되고 해당 바이트 표현이 결합되어 올바른 텍스트 표현을 생성해야 하는 경우에 유용합니다. 토큰에 대한 바이트 표현이 없는 경우 null일 수 있습니다.
logprob 숫자 이 토큰의 로그 확률입니다.
토큰 문자열 토큰입니다.
top_logprobs array 이 토큰 위치에서 가장 가능성이 높은 토큰 및 해당 로그 확률의 목록입니다. 드문 경우지만 반환된 요청 top_logprobs의 수보다 적을 수 있습니다.

채팅 완료 응답 메시지

모델에서 생성된 채팅 완성 메시지입니다.

이름 유형 설명 필수 기본값
audio 객체 오디오 출력 형식이 요청되면 이 개체는 모델의 오디오 응답에 대한 데이터를 포함합니다. 아니오
└) 데이터 문자열 모델에 의해 생성된 Base64로 인코딩된 오디오 바이트(요청에 지정된 형식)입니다.
아니오
└─ 만료_시간 integer 다중 턴 대화에 사용하기 위해 서버에서 이 오디오 응답에 더 이상 액세스할 수 없는 경우의 Unix 타임스탬프(초)입니다.
아니오
└─ id 문자열 이 오디오 응답의 고유 식별자입니다. 아니오
└) 대본 문자열 모델에서 생성한 오디오의 음성 텍스트입니다. 아니오
내용 문자열 메시지의 콘텐츠입니다.
문맥 azureChatExtensionsMessageContext Azure OpenAI 채팅 확장 프로그램이 해당 채팅 완성 응답 생성에 관련될 때 사용할 수 있는 추가 컨텍스트 정보의 표현입니다. 이 컨텍스트 정보는 일치하는 확장을 사용하도록 구성된 Azure OpenAI 요청을 사용하는 경우에만 채워집니다. 아니오
함수 호출 채팅완료기능호출 더 이상 사용되지 않으며 tool_calls로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다. 아니오
거절 문자열 모델이 생성한 거부 메시지입니다.
역할 채팅 완성 응답 메시지 역할 응답 메시지 작성자의 역할입니다.
도구 호출 array 함수 호출과 같이 모델에서 생성된 도구 호출입니다. 아니오

chatCompletionResponseMessageRole

응답 메시지 작성자의 역할입니다.

재산 가치
설명 응답 메시지 작성자의 역할입니다.
유형 문자열
assistant

chatCompletionToolChoiceOption

모델이 호출하는 도구(있는 경우)를 제어합니다. none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다. auto는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다. required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다. {"type": "function", "function": {"name": "my_function"}}을 사용하여 특정 도구를 지정하면 모델이 해당 도구를 강제 호출하게 됩니다. none은 도구가 없는 경우 기본값입니다. auto는 도구가 있는 경우 기본값입니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

chatCompletionNamedToolChoice

모델에서 사용해야 하는 도구를 지정합니다. 강제로 모델이 특정 함수를 호출하도록 하는 데 사용합니다.

이름 유형 설명 필수 기본값
기능 객체
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
유형 enum 도구의 종류입니다. 현재는 function만 지원됩니다.
가능한 값: function

ParallelToolCalls

도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

예측 내용

다시 생성되는 텍스트 파일의 콘텐츠와 같은 정적 예측 출력 콘텐츠입니다.

이름 유형 설명 필수 기본값
내용 문자열 또는 배열 모델 응답을 생성할 때 일치해야 하는 콘텐츠입니다. 생성된 토큰이 이 콘텐츠와 일치하면 전체 모델 응답을 훨씬 더 빠르게 반환할 수 있습니다.
유형 enum 제공하려는 예측 콘텐츠의 형식입니다. 이 형식은 현재 항상 content입니다.
가능한 값: content

chatCompletionMessageToolCalls

함수 호출과 같이 모델에서 생성된 도구 호출입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

채팅완성방식

이 요청에 대해 모델이 생성할 출력 형식입니다. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.

["text"]

gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.

["text", "audio"]

이 구성 요소에 대해 정의된 속성이 없습니다.

chatCompletionFunctionCall

더 이상 사용되지 않으며 tool_calls로 대체되었습니다. 모델에 의해 생성된 대로 호출되어야 하는 함수의 이름과 인수입니다.

이름 유형 설명 필수 기본값
논쟁들 문자열 JSON 형식의 모델에 의해 생성된 함수 호출에 사용할 인수입니다. 모델은 항상 유효한 JSON을 생성하지 않으며 함수 스키마에서 정의되지 않은 매개 변수를 허위로 제공할 수 있습니다. 함수를 호출하기 전에 코드에서 인수의 유효성을 검사하세요.
이름 문자열 호출할 함수의 이름입니다.

completionUsage

완성 요청의 사용 통계입니다.

이름 유형 설명 필수 기본값
완료 토큰 integer 생성된 완성의 토큰 수입니다.
completion_tokens_details 객체 완성에 사용되는 토큰 분석입니다. 아니오
└─ 수락된 예측 토큰 integer 예측 출력을 사용하는 경우 완성에 나타난 예측의 토큰 수입니다. 아니오
└─ audio_tokens integer 모델에서 생성된 오디오 입력 토큰입니다. 아니오
└─ 추론_토큰 integer 추론을 위해 모델에서 생성한 토큰입니다. 아니오
└─ 거부된_예측_토큰 integer 예측 출력을 사용하는 경우 완성에 나타나지 않은 예측의 토큰 수입니다. 그러나 추론 토큰과 마찬가지로 이러한 토큰은 청구, 출력 및 컨텍스트 창 제한을 위해 총 완성 토큰에서 계속 계산됩니다. 아니오
프롬프트 토큰 integer 프롬프트에 있는 토큰 수입니다.
프롬프트_토큰_세부 사항 객체 프롬프트 토큰의 세부 정보입니다. 아니오
└─ audio_tokens integer 프롬프트에 있는 오디오 입력 토큰입니다. 아니오
└─ 캐시된_토큰 (cached_tokens) integer 캐시된 프롬프트 토큰의 수입니다. 아니오
총_토큰 integer 요청에 사용된 총 토큰 수입니다(프롬프트 + 완성).

chatCompletionTool

이름 유형 설명 필수 기본값
기능 FunctionObject
유형 enum 도구의 종류입니다. 현재는 function만 지원됩니다.
가능한 값: function

함수 매개변수

함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.

parameters를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

FunctionObject

이름 유형 설명 필수 기본값
설명 문자열 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. 아니오
이름 문자열 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다.
매개 변수 FunctionParameters 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요.

parameters를 생략하면 빈 매개 변수 목록이 있는 함수가 정의됩니다.
아니오
엄격한 boolean 함수 호출을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다. true로 설정하면 모델은 parameters 필드에 정의된 정확한 스키마를 따릅니다. stricttrue인 경우 JSON 스키마의 하위 집합만 지원됩니다. 아니오 거짓

응답형식텍스트

이름 유형 설명 필수 기본값
유형 enum 정의되는 응답 형식의 형식: text
가능한 값: text

ResponseFormatJsonObject (응답 형식 JSON 객체)

이름 유형 설명 필수 기본값
유형 enum 정의되는 응답 형식의 형식: json_object
가능한 값: json_object

ResponseFormatJsonSchemaSchema

JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

응답 형식 JSON 스키마

이름 유형 설명 필수 기본값
json_schema 객체
└) 설명 문자열 응답 형식의 용도에 대한 설명이며, 모델에서 형식으로 응답하는 방법을 결정하는 데 사용됩니다. 아니오
└) 이름 문자열 응답 형식의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. 아니오
└─ 스키마 응답형식JsonSchemaSchema JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다. 아니오
└─ 엄격한 boolean 출력을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다. true로 설정하면 모델은 항상 schema 필드에 정의된 정확한 스키마를 따릅니다. stricttrue인 경우 JSON 스키마의 하위 집합만 지원됩니다. 아니오 거짓
유형 enum 정의되는 응답 형식의 형식: json_schema
가능한 값: json_schema

chatCompletionChoiceCommon

이름 유형 설명 필수 기본값
완료_이유 문자열 아니오
인덱스 integer 아니오

번역요청생성

번역 요청입니다.

이름 유형 설명 필수 기본값
파일 문자열 번역할 오디오 파일입니다.
프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 영어로 되어 있어야 합니다. 아니오
응답_형식 audioResponseFormat 출력의 형식을 정의합니다. 아니오
온도 숫자 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. 아니오 0

audioResponse

response_format이 json일 때 번역 또는 전사 응답입니다.

이름 유형 설명 필수 기본값
문자 메시지 문자열 번역되거나 전사된 텍스트입니다.

audioVerboseResponse

response_format이 verbose_json일 때 번역 또는 전사 응답입니다.

이름 유형 설명 필수 기본값
기간 숫자 기간. 아니오
언어 문자열 언어. 아니오
세그먼트 array 아니오
task 문자열 오디오 작업의 형식입니다. 아니오
문자 메시지 문자열 번역되거나 전사된 텍스트입니다.
단어 array 아니오

오디오응답형식

출력의 형식을 정의합니다.

재산 가치
설명 출력의 형식을 정의합니다.
유형 문자열
json
text
srt
verbose_json
vtt

createTranscriptionRequest

전사 요청입니다.

이름 유형 설명 필수 기본값
파일 문자열 전사할 오디오 파일 개체입니다.
언어 문자열 입력 오디오의 언어입니다. ISO-639-1 형식으로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다. 아니오
프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다. 아니오
응답_형식 audioResponseFormat 출력의 형식을 정의합니다. 아니오
온도 숫자 샘플링 온도(0에서 1 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다. 0으로 설정하면 모델은 로그 확률을 사용하여 특정 임계값에 도달할 때까지 온도를 자동으로 높입니다. 아니오 0
timestamp_granularities[] array 이 전사를 위해 채울 타임스탬프 세분성입니다. 타임스탬프 세분성을 사용하려면 response_formatverbose_json으로 설정해야 합니다. word 또는 segment 옵션 중 하나 또는 둘 다 지원됩니다. 참고: 세그먼트 타임스탬프에 대한 추가 대기 시간은 없지만 단어 타임스탬프를 생성하면 추가 대기 시간이 발생합니다. 아니오 ['segment']

audioSegment

전사 또는 번역 세그먼트입니다.

이름 유형 설명 필수 기본값
avg_logprob 숫자 평균 로그 확률입니다. 아니오
압축비 숫자 압축 비율입니다. 아니오
숫자 세그먼트 끝 오프셋입니다. 아니오
아이디 integer 세그먼트 식별자입니다. 아니오
no_speech_prob 숫자 '음성 없음'의 확률입니다. 아니오
seek 숫자 세그먼트의 오프셋입니다. 아니오
시작하다 숫자 세그먼트 시작 오프셋입니다. 아니오
온도 숫자 온도. 아니오
문자 메시지 문자열 세그먼트 텍스트입니다. 아니오
토큰 array 텍스트의 토큰입니다. 아니오

audioWord

전사 또는 번역 단어입니다.

이름 유형 설명 필수 기본값
숫자 단어 끝 오프셋입니다. 아니오
시작하다 숫자 단어 시작 오프셋입니다. 아니오
단어 문자열 Word 아니오

음성요청생성 (createSpeechRequest)

음성 요청입니다.

이름 유형 설명 필수 기본값
입력 문자열 오디오를 합성할 텍스트입니다. 최대 길이는 4096자입니다.
응답_형식 enum 오디오를 합성할 형식입니다.
가능한 값: mp3, opus, aacflac, wavpcm
아니오
속도 숫자 합성된 오디오의 속도입니다. 0.25~4.0의 값을 선택합니다. 1.0 기본값입니다. 아니오 1.0
목소리 enum 음성 합성에 사용할 음성입니다.
가능한 값: alloy, echo, fableonyx, novashimmer

이미지 품질

생성될 이미지의 품질입니다.

재산 가치
설명 생성될 이미지의 품질입니다.
유형 문자열
기본값 auto
auto
high
medium
low
hd
standard

이미지응답형식

생성된 이미지가 반환되는 형식입니다.

재산 가치
설명 생성된 이미지가 반환되는 형식입니다.
유형 문자열
기본값 url
url
b64_json

이미지 출력 형식

생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다.

재산 가치
설명 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다.
유형 문자열
기본값 png
png
jpeg

이미지 크기

생성된 이미지의 크기입니다.

재산 가치
설명 생성된 이미지의 크기입니다.
유형 문자열
기본값 auto
auto
1792x1024
1024x1792
1024x1024
1024x1536
1536x1024

imageStyle

생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다.

재산 가치
설명 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다.
유형 문자열
기본값 vivid
vivid
natural

이미지 배경

생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다.

재산 가치
설명 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다.
유형 문자열
기본값 auto
transparent
opaque
auto

이미지 생성 요청

이름 유형 설명 필수 기본값
background imageBackground 생성된 이미지의 배경에 대한 투명도를 설정할 수 있습니다. 이 매개 변수는 gpt-image-1에 대해서만 지원됩니다. 아니오 auto
n integer 생성할 이미지 수입니다. dall-e-3의 경우 n=1만 지원됩니다. 아니오 1
출력 압축 integer 생성된 이미지의 압축 수준(0-100%)입니다. 이 매개 변수는 jpeg 출력 형식의 gpt-image-1에 대해서만 지원됩니다. 아니오 100
출력 형식 imagesOutputFormat 생성된 이미지가 반환되는 파일 형식입니다. gpt-image-1에 대해서만 지원합니다. 아니오 png
프롬프트 문자열 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 gpt-image-1의 경우 32000자, dall-e-3의 경우 4,000자입니다.
imageQuality 생성될 이미지의 품질입니다. 아니오 auto
응답_형식 imagesResponseFormat 생성된 이미지가 반환되는 형식입니다. 아니오 url
크기 imageSize 생성된 이미지의 크기입니다. 아니오 auto
style imageStyle 생성된 이미지의 스타일입니다. dall-e-3에 대해서만 지원됩니다. 아니오 vivid
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. 아니오

이미지 편집 요청

이름 유형 설명 필수 기본값
이미지 문자열 또는 배열 편집할 이미지입니다. 지원되는 이미지 파일 또는 이미지 배열이어야 합니다. 각 이미지는 png 또는 jpg 파일이 25MB 미만이어야 합니다.
마스크 문자열 완전히 투명한 영역(예: 알파가 0인 경우)이 있는 추가 이미지는 이미지를 편집해야 하는 위치를 나타냅니다. 여러 이미지가 제공되면 마스크가 첫 번째 이미지에 적용됩니다. 유효한 PNG 파일(4MB 미만)이어야 하며 이미지와 크기가 같아야 합니다. 아니오
n integer 생성할 이미지 수입니다. 아니오 1
프롬프트 문자열 원하는 이미지에 대한 텍스트 설명입니다. 최대 길이는 32000자입니다.
imageQuality 생성될 이미지의 품질입니다. 아니오 auto
응답_형식 imagesResponseFormat 생성된 이미지가 반환되는 형식입니다. 아니오 url
크기 imageSize 생성된 이미지의 크기입니다. 아니오 auto
사용자 문자열 남용을 모니터링하고 감지하는 데 도움이 될 수 있는 최종 사용자를 나타내는 고유 식별자입니다. 아니오

generateImagesResponse

이름 유형 설명 필수 기본값
created integer 작업을 만들 때의 unix 타임스탬프입니다.
데이터 array 성공한 경우 작업의 결과 데이터입니다.
사용량 imageGenerationsUsage 이미지 생성 요청에 대한 토큰 사용 세부 정보를 나타냅니다. gpt-image-1에만 해당합니다. 아니오

이미지 결과

성공하면 이미지 URL 또는 인코딩된 이미지이고, 그렇지 않으면 오류가 발생합니다.

이름 유형 설명 필수 기본값
b64_json 문자열 base64로 인코딩된 이미지 아니오
콘텐츠 필터 결과 dalle 콘텐츠 필터 결과 콘텐츠 필터링 결과에 대한 정보입니다. 아니오
prompt_filter_results dalleFilterResults 콘텐츠 필터링 범주(증오, 성 관련, 폭력, 자해) 및 심각도 수준(유해한 콘텐츠의 강도 및 위험 수준을 결정하는 매우 낮음, 낮음, 중간, 높음)과 필터링되었는지 여부에 대한 정보입니다. 탈옥 콘텐츠 및 욕설, 감지되었는지 여부 및 필터링되었는지 여부에 대한 정보입니다. 또한 고객 차단 목록, 필터링되었는지 여부 및 해당 ID에 대한 정보입니다. 아니오
수정된_프롬프트 문자열 프롬프트에 수정 버전이 있는 경우 이미지를 생성하는 데 사용된 프롬프트입니다. 아니오
url 문자열 이미지 URL입니다. 아니오

이미지 생성 사용량

이미지 생성 요청에 대한 토큰 사용 세부 정보를 나타냅니다. gpt-image-1에만 해당합니다.

이름 유형 설명 필수 기본값
입력_토큰 integer 입력 토큰의 수입니다. 아니오
input_tokens_details 객체 입력 토큰에 대한 자세한 분석입니다. 아니오
└─ image_tokens integer 이미지 토큰의 수입니다. 아니오
└─ text_tokens integer 텍스트 토큰의 수입니다. 아니오
출력_토큰 integer 출력 토큰의 수입니다. 아니오
총_토큰 integer 사용된 총 토큰 수입니다. 아니오

line

단어 및 선택 표시와 같은 인접한 콘텐츠 요소 시퀀스로 구성된 콘텐츠 줄 개체입니다.

이름 유형 설명 필수 기본값
spans array 검색된 개체와 해당 경계 상자 정보를 나타내는 범위의 배열입니다.
문자 메시지 문자열

span

검색된 개체와 해당 경계 상자 정보를 나타내는 범위 개체입니다.

이름 유형 설명 필수 기본값
length integer 유니코드 코드 포인트로 측정되는 문자의 범위 길이입니다.
상쇄 integer 범위가 시작되는 텍스트 내의 문자 오프셋입니다. 이 오프셋은 범위의 첫 번째 문자 위치로 정의되며, 텍스트 시작부터 유니코드 코드포인트로 계산합니다.
polygon array 검색된 개체를 묶는 다각형의 점을 나타내는 개체의 배열입니다.
문자 메시지 문자열 검색된 개체를 나타내는 범위의 텍스트 콘텐츠입니다.

runCompletionUsage

실행과 관련된 사용 통계입니다. 실행이 종료 상태가 아닌 경우(예: null, in_progress 등) 이 값은 queued이 됩니다.

이름 유형 설명 필수 기본값
완료 토큰 integer 실행 과정에서 사용된 완성 토큰 수입니다.
프롬프트 토큰 integer 실행 과정에서 사용된 프롬프트 토큰 수입니다.
총_토큰 integer 사용된 총 토큰 수입니다(프롬프트 + 완성).

runStepCompletionUsage

실행 단계와 관련된 사용 통계입니다. 이 값은 실행 단계의 상태가 null인 동안 in_progress이 됩니다.

이름 유형 설명 필수 기본값
완료 토큰 integer 실행 단계 과정에서 사용된 완성 토큰 수입니다.
프롬프트 토큰 integer 실행 단계 과정에서 사용된 프롬프트 토큰 수입니다.
총_토큰 integer 사용된 총 토큰 수입니다(프롬프트 + 완성).

assistantsApiResponseFormatOption

모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

assistantsApiResponseFormat

모델의 예상 출력을 설명하는 개체입니다. json_object인 경우 function 형식 tools만 실행에 전달할 수 있습니다. text인 경우 모델은 텍스트 또는 필요한 값을 반환할 수 있습니다.

이름 유형 설명 필수 기본값
유형 문자열 text 또는 json_object 중 하나여야 합니다. 아니오 문자 메시지

type 열거형: AssistantsApiResponseFormat

가치 설명
문자 메시지
json 객체

assistantObject

모델을 호출하고 도구를 사용할 수 있는 assistant를 나타냅니다.

이름 유형 설명 필수 기본값
created_at integer 도우미가 만들어진 시점의 Unix 타임스탬프(초)입니다.
설명 문자열 도우미에 대한 설명입니다. 최대 길이는 512자입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
지침 문자열 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
model 문자열 사용할 모델의 ID입니다.
이름 문자열 도우미의 이름입니다. 최대 길이는 256자입니다.
객체 문자열 항상 assistant인 개체 형식입니다.
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter, file_search 또는 function 형식일 수 있습니다.
[]
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1

object 열거형: AssistantObjectType

가치 설명
assistant 개체 형식으로, 항상 assistant입니다.

비서요청생성

이름 유형 설명 필수 기본값
설명 문자열 도우미에 대한 설명입니다. 최대 길이는 512자입니다.
아니오
지침 문자열 도우미가 사용하는 시스템 지침입니다. 최대 길이는 256,000자입니다.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열
이름 문자열 도우미의 이름입니다. 최대 길이는 256자입니다.
아니오
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
└─ 벡터_스토어 array file_ids를 사용하여 벡터 저장소를 만들고 이 도우미에 연결하기 위한 도우미입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter, retrieval 또는 function 형식일 수 있습니다.
아니오 []
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1

조수 요청 수정

이름 유형 설명 필수 기본값
설명 문자열 도우미에 대한 설명입니다. 최대 길이는 512자입니다.
아니오
지침 문자열 도우미가 사용하는 시스템 지침입니다. 최대 길이는 32768자입니다.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 아니오
이름 문자열 도우미의 이름입니다. 최대 길이는 256자입니다.
아니오
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록을 재정의합니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소를 재정의합니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미에서 사용하도록 설정된 도구 목록입니다. 도우미당 최대 128개의 도구가 있을 수 있습니다. 도구는 code_interpreter, retrieval 또는 function 형식일 수 있습니다.
아니오 []
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1

보조 응답 삭제

이름 유형 설명 필수 기본값
삭제됨 boolean
아이디 문자열
객체 문자열

object 열거형: DeleteAssistantResponseState

가치 설명
도우미가 삭제됨

listAssistantsResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

보조자 도구 코드

이름 유형 설명 필수 기본값
유형 문자열 정의되는 도구의 형식: code_interpreter

type 열거형: assistantToolsCodeType

가치 설명
코드 인터프리터

assistantToolsFileSearch

이름 유형 설명 필수 기본값
파일 검색 객체 파일 검색 도구에 대한 재정의입니다. 아니오
└─ max_num_results integer 파일 검색 도구에서 출력해야 하는 최대 결과 수입니다. 기본값은 gpt-4* 모델의 경우 20이고 gpt-3.5-turbo의 경우 5입니다. 이 숫자는 1에서 50 사이여야 합니다.

파일 검색 도구는 max_num_results개 결과보다 적게 출력할 수 있습니다.
아니오
유형 문자열 정의되는 도구의 형식: file_search

type 열거형: assistantToolsFileSearchType

가치 설명
파일 검색

assistantToolsFileSearchTypeOnly

이름 유형 설명 필수 기본값
유형 문자열 정의되는 도구의 형식: file_search

type 열거형: assistantToolsFileSearchType

가치 설명
파일 검색

assistantToolsFunction

이름 유형 설명 필수 기본값
기능 객체 함수 정의입니다.
└) 설명 문자열 함수를 호출하는 시기와 방법을 선택하기 위해 모델에서 사용하는 함수의 기능에 대한 설명입니다. 아니오
└) 이름 문자열 호출할 함수의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다. 아니오
└) 매개 변수 채팅완료함수매개변수 함수가 허용하는 매개 변수로, JSON 스키마 개체로 설명됩니다. 예를 보려면 가이드/를 참조하고, 형식에 대한 설명서는 JSON 스키마 참조를 참조하세요. 아니오
유형 문자열 정의되는 도구의 형식: function

type 열거형: assistantToolsFunction

가치 설명
기능

절단객체

실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다.

이름 유형 설명 필수 기본값
마지막 메시지들 integer 실행에 대한 컨텍스트를 생성할 때 스레드의 가장 최근 메시지 수입니다. 아니오
유형 문자열 스레드에 사용할 잘림 전략입니다. 기본값은 auto입니다. last_messages로 설정하면 스레드가 스레드에서 가장 최근의 n개의 메시지로 잘립니다. auto로 설정하면 스레드 중간에 있는 메시지가 모델의 컨텍스트 길이인 max_prompt_tokens에 맞게 삭제됩니다.

type 열거형: TruncationType

가치 설명
auto
마지막 메시지들

assistantsApiToolChoiceOption

모델이 호출하는 도구(있는 경우)를 제어합니다. none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다. auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다. {"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

assistantsNamedToolChoice

모델에서 사용해야 하는 도구를 지정합니다. 모델이 강제로 특정 도구를 호출하도록 하는 데 사용합니다.

이름 유형 설명 필수 기본값
기능 객체 아니오
└) 이름 문자열 호출할 함수의 이름입니다. 아니오
유형 문자열 도구의 종류입니다. 형식이 function인 경우 함수 이름을 설정해야 합니다.

type 열거형: AssistantsNamedToolChoiceType

가치 설명
기능
코드 인터프리터
파일 검색

runObject

스레드에서 실행되는 실행을 나타냅니다.

이름 유형 설명 필수 기본값
어시스턴트_아이디 문자열 이 실행을 실행하는 데 사용되는 도우미의 ID입니다.
cancelled_at integer 실행이 취소된 시점의 Unix 타임스탬프(초)입니다.
completed_at integer 실행이 완료된 시점의 Unix 타임스탬프(초)입니다.
created_at integer 실행이 만들어진 시점의 Unix 타임스탬프(초)입니다.
만료_일자 integer 실행이 만료된 시점의 Unix 타임스탬프(초)입니다.
failed_at integer 실행이 실패한 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
불완전한 세부사항 객체 실행이 완료되지 않은 이유에 대한 세부 정보입니다. 실행이 완료되지 않은 경우 null이 됩니다.
└) 이유 문자열 실행이 완료되지 않은 이유입니다. 실행 과정에서 도달한 특정 토큰 제한을 가리킵니다. 아니오
지침 문자열 도우미가 이 실행에 사용한 지침입니다.
마지막_오류 객체 이 실행과 관련된 마지막 오류입니다. 오류가 없으면 null이 됩니다.
└─ code 문자열 server_error 또는 rate_limit_exceeded중 하나입니다. 아니오
└) 메시지 문자열 사람이 읽을 수 있는 오류 설명입니다. 아니오
최대_완료_토큰 integer 실행 과정에서 사용되도록 지정된 완료 토큰의 최대 수입니다.
최대_프롬프트_토큰 integer 실행 과정에서 사용되도록 지정된 프롬프트 토큰의 최대 수입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
model 문자열 도우미가 이 실행에 사용한 모델입니다.
객체 문자열 항상 thread.run인 개체 형식입니다.
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
필요한_조치 객체 실행을 계속하는 데 필요한 작업에 대한 세부 정보입니다. 작업이 필요하지 않으면 null이 됩니다.
└─ submit_tool_outputs 객체 이 실행을 계속하는 데 필요한 도구 출력에 대한 세부 정보입니다. 아니오
└─ tool_calls array 관련 도구 호출 목록입니다. 아니오
└─ 형식 enum 지금은 항상 submit_tool_outputs입니다.
가능한 값: submit_tool_outputs
아니오
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
시작_시간 integer 실행이 시작된 시점의 Unix 타임스탬프(초)입니다.
상태 문자열 실행 상태는 queued, in_progress, requires_action, cancelling, cancelled, failed, completed 또는 expired일 수 있습니다.
온도 숫자 이 실행에 사용되는 샘플링 온도입니다. 설정하지 않으면 기본값은 1입니다. 아니오
스레드 ID 문자열 이 실행의 일부로 실행된 스레드의 ID입니다.
도구_선택 보조자 API 도구 선택 옵션 모델이 호출하는 도구(있는 경우)를 제어합니다.
none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.
auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
도구들 array 도우미가 이 실행에 사용한 도구 목록입니다. []
top_p 숫자 이 실행에 사용되는 핵 샘플링 값입니다. 설정하지 않으면 기본값은 1입니다. 아니오
truncation_strategy truncationObject 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다.
사용량 runCompletionUsage 실행과 관련된 사용 통계입니다. 실행이 종료 상태가 아닌 경우(예: null, in_progress 등) 이 값은 queued이 됩니다.

object 열거형: runObjectType

가치 설명
스레드 실행 실행 개체 형식으로, 항상 thread.run입니다.

status 열거형: RunObjectStatus

가치 설명
대기 중 queued 상태
진행 중 in_progress 상태
조치 필요 required_action 상태
취소 cancelling 상태
취소 cancelled 상태
실패 failed 상태
완료됨 completed 상태
expired expired 상태

실행 요청 생성

이름 유형 설명 필수 기본값
추가 지침 문자열 실행 지침 끝에 추가 지침을 추가합니다. 이는 다른 지침을 재정의하지 않고 실행별로 동작을 수정하는 데 유용합니다. 아니오
추가 메시지 array 실행을 만들기 전에 스레드에 추가 메시지를 추가합니다. 아니오
어시스턴트_아이디 문자열 이 실행을 수행하는 데 사용할 도우미의 ID입니다.
지침 문자열 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
최대_완료_토큰 integer 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
최대_프롬프트_토큰 integer 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 이 실행을 수행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. 아니오
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
도구_선택 보조자 API 도구 선택 옵션 모델이 호출하는 도구(있는 경우)를 제어합니다.
none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.
auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
아니오
도구들 array 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1
truncation_strategy truncationObject 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. 아니오

listRunsResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

실행 요청 수정

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오

submitToolOutputsRunRequest

이름 유형 설명 필수 기본값
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
도구 결과 array 출력이 제출되는 도구 목록입니다.

도구호출객체실행

도구 호출 개체

이름 유형 설명 필수 기본값
기능 객체 함수 정의입니다.
└─ 인수 문자열 모델이 함수에 전달할 것으로 예상하는 인수입니다. 아니오
└) 이름 문자열 함수의 이름입니다. 아니오
아이디 문자열 도구 호출의 ID입니다. 엔드포인트를 실행하기 위해 제출 도구 출력을 사용하여 도구 출력을 제출할 때 이 ID를 참조해야 합니다.
유형 문자열 출력이 필요한 도구 호출의 형식입니다. 지금은 항상 function입니다.

type 열거형: RunToolCallObjectType

가치 설명
기능

스레드를 생성하고 요청을 실행합니다

이름 유형 설명 필수 기본값
어시스턴트_아이디 문자열 이 실행을 수행하는 데 사용할 도우미의 ID입니다.
지침 문자열 도우미의 기본 시스템 메시지를 대체합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
최대_완료_토큰 integer 실행 과정에서 사용할 수 있는 완성 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 완성 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 완성 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
최대_프롬프트_토큰 integer 실행 과정에서 사용할 수 있는 프롬프트 토큰의 최대 수입니다. 이 실행은 여러 번의 실행 동안 지정된 수의 프롬프트 토큰만 사용하려고 최선의 노력을 기울입니다. 실행이 지정된 프롬프트 토큰 수를 초과하면 상태 incomplete로 종료됩니다. 자세한 내용은 incomplete_details를 참조하세요.
아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
model 문자열 이 실행을 실행하는 데 사용할 모델의 ID입니다. 여기에 값이 제공되면 도우미와 연결된 모델이 재정의됩니다. 그렇지 않은 경우 도우미와 연결된 모델이 사용됩니다. 아니오
병렬 도구 호출 ParallelToolCalls 도구를 사용하는 동안 병렬 함수 호출을 사용하도록 설정할지 여부입니다. 아니오 진실
응답_형식 assistantsApiResponseFormatOption 모델이 출력해야 하는 형식을 지정합니다. GPT-4o, GPT-4 Turbo 및 gpt-3.5-turbo-1106 이후의 모든 GPT-3.5 Turbo 모델과 호환됩니다.

구조적 출력을 사용하도록 설정하여 { "type": "json_schema", "json_schema": {...} } 모델이 제공된 JSON 스키마와 일치하도록 합니다. 구조적 출력 가이드에서 자세히 알아보세요.

{ "type": "json_object" }로 설정하면 모델이 생성하는 메시지가 유효한 JSON임을 보장하는 JSON 모드가 사용하도록 설정됩니다.

중요: JSON 모드를 사용하는 경우 시스템 또는 사용자 메시지를 통해 직접 JSON을 생성하도록 모델에 지시해야 합니다. 이렇게 설정하지 않으면 모델은 생성이 토큰 제한에 도달할 때까지 끝없는 공백 스트림을 생성할 수 있으며, 결과적으로 오래 실행되고 "중단"된 것처럼 보이는 요청이 발생할 수 있습니다. 또한 생성이 finish_reason="length"를 초과했거나 대화가 최대 컨텍스트 길이를 초과했음을 나타내는 max_tokens인 경우 메시지 콘텐츠가 부분적으로 잘릴 수 있습니다.
아니오
스트림 boolean true인 경우, 실행 서버에서 보낸 이벤트 중에 발생하는 이벤트 스트림을 반환하고, data: [DONE] 메시지를 표시하면서 실행이 터미널 상태가 될 때 종료됩니다.
아니오
스트림 옵션 채팅완료스트림옵션 스트리밍 응답에 대한 옵션입니다. stream: true를 설정할 때만 설정합니다.
아니오 없음
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
아니오 1
스레드(thread) createThreadRequest 아니오
도구_선택 보조자 API 도구 선택 옵션 모델이 호출하는 도구(있는 경우)를 제어합니다.
none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.
auto는 기본값이며 모델이 메시지 생성 또는 도구 호출 중에서 선택할 수 있음을 의미합니다.
{"type": "file_search"} 또는 {"type": "function", "function": {"name": "my_function"}}과 같은 특정 도구를 지정하면 모델이 해당 도구를 호출하게 됩니다.
아니오
도구_자원 객체 도우미 도구에서 사용하는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 도우미에 연결된 벡터 저장소의 ID입니다. 도우미에 연결된 최대 1벡터 저장소가 있을 수 있습니다.
아니오
도구들 array 도우미가 이 실행에 사용할 수 있는 도구를 재정의합니다. 이는 실행별로 동작을 수정하는 데 유용합니다. 아니오
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이를 변경하거나 온도를 변경하는 것이 좋지만 둘 다 변경하는 것은 권장하지 않습니다.
아니오 1
truncation_strategy truncationObject 실행 전에 스레드가 잘리는 방법에 대한 컨트롤입니다. 실행의 초기 컨텍스트 창을 제어하는 데 사용합니다. 아니오

threadObject

메시지를 포함하는 스레드를 나타냅니다.

이름 유형 설명 필수 기본값
created_at integer 스레드가 만들어진 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
객체 문자열 항상 thread인 개체 형식입니다.
도구_자원 객체 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오

object 열거형: ThreadObjectType

가치 설명
스레드(thread) 스레드 개체 형식으로, 항상 thread입니다.

스레드요청생성

이름 유형 설명 필수 기본값
메시지 array 스레드를 시작하는 메시지 목록입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
도구_자원 객체 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오
└─ 벡터_스토어 array file_ids를 사용하여 벡터 저장소를 만들고 이 스레드에 연결하기 위한 도우미입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오

스레드 요청 수정

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
도구_자원 객체 이 스레드의 도우미 도구에서 사용할 수 있는 리소스 집합입니다. 리소스는 도구 유형에 따라 다릅니다. 예를 들어 code_interpreter 도구에는 파일 ID 목록이 필요하지만 file_search 도구에는 벡터 저장소 ID 목록이 필요합니다.
아니오
└─ code_interpreter 객체 아니오
└─ file_ids array code_interpreter 도구에서 사용할 수 있는 파일 ID 목록입니다. 도구와 연결된 파일은 최대 20개일 수 있습니다.
아니오 []
└─ file_search 객체 아니오
└─ vector_store_ids array 이 스레드에 연결된 벡터 저장소입니다. 스레드에 연결된 벡터 저장소가 최대 1개 있을 수 있습니다.
아니오

deleteThreadResponse

이름 유형 설명 필수 기본값
삭제됨 boolean
아이디 문자열
객체 문자열

object 열거형: DeleteThreadResponseObjectState

가치 설명
스레드.삭제됨 삭제 스레드 응답 개체 상태는 thread.deleted입니다.

스레드 목록 응답

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

메시지 객체

스레드 내의 메시지를 나타냅니다.

이름 유형 설명 필수 기본값
어시스턴트_아이디 문자열 해당하는 경우 이 메시지를 작성한 도우미의 ID입니다.
attachments array 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다.
completed_at integer 메시지가 완료된 시점의 Unix 타임스탬프(초)입니다.
내용 array 텍스트 및/또는 이미지 배열에서 메시지의 콘텐츠입니다.
created_at integer 메시지가 만들어진 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
incomplete_at integer 메시지가 완료로 표시된 시점의 Unix 타임스탬프(초)입니다.
불완전한 세부사항 객체 불완전한 메시지에서 메시지가 불완전한 이유에 대한 세부 정보입니다.
└) 이유 문자열 메시지가 완료되지 않은 이유입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
객체 문자열 항상 thread.message인 개체 형식입니다.
역할 문자열 메시지를 생성한 엔터티입니다. user 또는 assistant중 하나입니다.
run_id 문자열 해당하는 경우 이 메시지의 작성과 연결된 실행의 ID입니다.
상태 문자열 메시지 상태로, in_progress, incomplete 또는 completed일 수 있습니다.
스레드 ID 문자열 이 메시지가 속한 스레드 ID입니다.

object 열거형: MessageObjectType

가치 설명
thread.message 메시지 개체 형식 thread.message입니다.

status 열거형: MessageObjectStatus

가치 설명
진행 중
불완전
완료됨

role 열거형: MessageObjectRole

가치 설명
사용자
assistant

messageDeltaObject

메시지 델타, 즉 스트리밍 중에 메시지의 변경된 필드를 나타냅니다.

이름 유형 설명 필수 기본값
델타 객체 메시지에서 변경된 필드가 포함된 델타입니다.
└─ 콘텐츠 array 텍스트 및/또는 이미지 배열에서 메시지의 콘텐츠입니다. 아니오
└─ 역할 문자열 메시지를 생성한 엔터티입니다. user 또는 assistant중 하나입니다. 아니오
아이디 문자열 API 엔드포인트에서 참조할 수 있는 메시지의 식별자입니다.
객체 문자열 항상 thread.message.delta인 개체 형식입니다.

object 열거형: MessageDeltaObjectType

가치 설명
thread.message.delta

메시지생성요청

이름 유형 설명 필수 기본값
attachments array 메시지에 첨부된 파일 목록 및 추가해야 하는 도구입니다. 아니오
내용 문자열 메시지의 내용입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
역할 문자열 메시지를 만드는 엔터티의 역할입니다. 허용되는 값은 다음과 같습니다.
- user: 메시지가 실제 사용자에 의해 전송되었으며 대부분의 경우 사용자 생성 메시지를 나타내는 데 사용되어야 함을 나타냅니다.
- assistant: 메시지가 도우미에 의해 생성되었음을 나타냅니다. 도우미의 메시지를 대화에 삽입하려면 이 값을 사용합니다.

role 열거형: CreateMessageRequestRole

가치 설명
사용자
assistant

메시지 수정 요청

이름 유형 설명 필수 기본값
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오

deleteMessageResponse

이름 유형 설명 필수 기본값
삭제됨 boolean
아이디 문자열
객체 문자열

object 열거형: DeleteMessageResponseObject

가치 설명
스레드 메시지 삭제됨 삭제 메시지 응답 개체 상태입니다.

listMessagesResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

messageContentImageFileObject

메시지 콘텐츠에서 이미지 파일을 참조합니다.

이름 유형 설명 필수 기본값
이미지 파일 객체
└─ file_id 문자열 메시지 콘텐츠에 있는 이미지의 파일 ID입니다. 아니오
유형 문자열 항상 image_file입니다.

type 열거형: MessageContentImageFileObjectType

가치 설명
이미지 파일 메시지 콘텐츠 이미지 파일 형식

메시지내용텍스트객체

메시지의 일부인 텍스트 콘텐츠입니다.

이름 유형 설명 필수 기본값
문자 메시지 객체
└) 주석 array 아니오
└─ value 문자열 텍스트를 구성하는 데이터입니다. 아니오
유형 문자열 항상 text입니다.

type 열거형: messageContentTextObjectType

가치 설명
문자 메시지 메시지 콘텐츠 텍스트 개체 형식

messageContentTextAnnotationsFileCitationObject

도우미 또는 메시지와 연결된 특정 파일의 특정 인용을 가리키는 메시지 내의 인용입니다. 도우미가 "retrieval" 도구를 사용하여 파일을 검색할 때 생성됩니다.

이름 유형 설명 필수 기본값
end_index integer
파일 인용 객체
└─ file_id 문자열 인용의 원본인 특정 파일의 ID입니다. 아니오
start_index (시작 인덱스) integer
문자 메시지 문자열 바꿔야 하는 메시지 콘텐츠의 텍스트입니다.
유형 문자열 항상 file_citation입니다.

type 열거형: FileCitationObjectType

가치 설명
파일 인용 파일 인용 개체 형식

messageContentTextAnnotationsFilePathObject

도우미가 code_interpreter 도구를 사용하여 파일을 생성할 때 생성되는 파일의 URL입니다.

이름 유형 설명 필수 기본값
end_index integer
파일 경로 객체
└─ file_id 문자열 생성된 파일의 ID입니다. 아니오
start_index integer
문자 메시지 문자열 바꿔야 하는 메시지 콘텐츠의 텍스트입니다.
유형 문자열 항상 file_path입니다.

type 열거형: FilePathObjectType

가치 설명
파일 경로 파일 경로 개체 형식

messageDeltaContentImageFileObject

메시지 콘텐츠에서 이미지 파일을 참조합니다.

이름 유형 설명 필수 기본값
이미지 파일 객체 아니오
└─ file_id 문자열 메시지 콘텐츠에 있는 이미지의 파일 ID입니다. 아니오
인덱스 integer 메시지의 콘텐츠 부분에 대한 인덱스입니다.
유형 문자열 항상 image_file입니다.

type 열거형: MessageDeltaContentImageFileObjectType

가치 설명
이미지 파일

메시지델타내용텍스트객체

메시지의 일부인 텍스트 콘텐츠입니다.

이름 유형 설명 필수 기본값
인덱스 integer 메시지의 콘텐츠 부분에 대한 인덱스입니다.
문자 메시지 객체 아니오
└) 주석 array 아니오
└─ value 문자열 텍스트를 구성하는 데이터입니다. 아니오
유형 문자열 항상 text입니다.

type 열거형: MessageDeltaContentTextObjectType

가치 설명
문자 메시지

messageDeltaContentTextAnnotationsFileCitationObject

도우미 또는 메시지와 연결된 특정 파일의 특정 인용을 가리키는 메시지 내의 인용입니다. 도우미가 "file_search" 도구를 사용하여 파일을 검색할 때 생성됩니다.

이름 유형 설명 필수 기본값
end_index integer 아니오
파일 인용 객체 아니오
└─ file_id 문자열 인용의 원본인 특정 파일의 ID입니다. 아니오
└─ quote 문자열 파일의 특정 인용입니다. 아니오
인덱스 integer 텍스트 콘텐츠 부분에 있는 주석의 인덱스입니다.
start_index integer 아니오
문자 메시지 문자열 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. 아니오
유형 문자열 항상 file_citation입니다.

type 열거형: MessageDeltaContentTextAnnotationsFileCitationObjectType

가치 설명
파일 인용

messageDeltaContentTextAnnotationsFilePathObject

도우미가 code_interpreter 도구를 사용하여 파일을 생성할 때 생성되는 파일의 URL입니다.

이름 유형 설명 필수 기본값
end_index integer 아니오
파일 경로 객체 아니오
└─ file_id 문자열 생성된 파일의 ID입니다. 아니오
인덱스 integer 텍스트 콘텐츠 부분에 있는 주석의 인덱스입니다.
start_index integer 아니오
문자 메시지 문자열 바꿔야 하는 메시지 콘텐츠의 텍스트입니다. 아니오
유형 문자열 항상 file_path입니다.

type 열거형: MessageDeltaContentTextAnnotationsFilePathObjectType

가치 설명
파일 경로

runStepObject

실행 수행의 단계를 나타냅니다.

이름 유형 설명 필수 기본값
어시스턴트_아이디 문자열 실행 단계와 연결된 도우미의 ID입니다.
cancelled_at integer 실행 단계가 취소된 시점의 Unix 타임스탬프(초)입니다.
completed_at integer 실행 단계가 완료된 시점의 Unix 타임스탬프(초)입니다.
created_at integer 실행 단계가 만들어진 시점의 Unix 타임스탬프(초)입니다.
만료 날짜 integer 실행 단계가 만료된 시점의 Unix 타임스탬프(초)입니다. 부모 실행이 만료되면 단계가 만료된 것으로 간주됩니다.
failed_at integer 실행 단계가 실패한 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 실행 단계의 식별자입니다.
마지막_오류 객체 이 실행 단계와 관련된 마지막 오류입니다. 오류가 없으면 null이 됩니다.
└─ code 문자열 server_error 또는 rate_limit_exceeded중 하나입니다. 아니오
└) 메시지 문자열 사람이 읽을 수 있는 오류 설명입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
객체 문자열 항상 assistant.run.step인 개체 형식입니다.
run_id 문자열 이 실행 단계가 포함된 실행의 ID입니다.
상태 문자열 실행 상태로, in_progress, cancelled, failed, completed 또는 expired일 수 있습니다.
step_details runStepDetailsMessageCreationObject 또는 runStepDetailsToolCallsObject 실행 단계의 세부 정보입니다.
스레드 ID 문자열 실행된 스레드의 ID입니다.
유형 문자열 실행 단계의 형식으로, message_creation 또는 tool_calls일 수 있습니다.

object 열거형: RunStepObjectType

가치 설명
assistant.run.step 항상 assistant.run.step인 개체 형식입니다.

type 열거형: RunStepObjectType

가치 설명
메시지 생성 message_creation 실행 단계
도구 호출 tool_calls 실행 단계

status 열거형: RunStepObjectStatus

가치 설명
진행 중 in_progress 실행 상태
취소 cancelled 실행 상태
실패 cancelled 실행 상태
완료됨 cancelled 실행 상태
expired cancelled 실행 상태

러닝스텝델타오브젝트

실행 단계 델타, 즉, 스트리밍 중에 실행 단계에서 변경된 필드를 나타냅니다.

이름 유형 설명 필수 기본값
델타 객체 실행 단계에서 변경된 필드가 포함된 델타입니다.
└─ step_details runStepDeltaStepDetailsMessageCreationObject 또는 runStepDeltaStepDetailsToolCallsObject 실행 단계의 세부 정보입니다. 아니오
아이디 문자열 API 엔드포인트에서 참조할 수 있는 실행 단계의 식별자입니다.
객체 문자열 항상 thread.run.step.delta인 개체 형식입니다.

object 열거형: RunStepDeltaObjectType

가치 설명
thread.run.step.delta

listRunStepsResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

runStepDetailsMessageCreationObject

실행 단계의 메시지 생성 세부 정보입니다.

이름 유형 설명 필수 기본값
메시지 생성 객체
└─ message_id 문자열 이 실행 단계에서 만든 메시지의 ID입니다. 아니오
유형 문자열 항상 message_creation입니다.

type 열거형: RunStepDetailsMessageCreationObjectType

가치 설명
메시지 생성

런스텝 델타 스텝 세부사항 메시지 생성 오브젝트

실행 단계의 메시지 생성 세부 정보입니다.

이름 유형 설명 필수 기본값
메시지 생성 객체 아니오
└─message_id 문자열 이 실행 단계에서 만든 메시지의 ID입니다. 아니오
유형 문자열 항상 message_creation입니다.

type 열거형: RunStepDeltaStepDetailsMessageCreationObjectType

가치 설명
메시지 생성

runStepDetailsToolCallsObject

도구 호출의 세부 정보입니다.

이름 유형 설명 필수 기본값
도구 호출 array 실행 단계가 관련된 도구 호출의 배열입니다. 세 가지 도구 형식 code_interpreter, retrieval 또는 function 중 하나와 연결될 수 있습니다.
유형 문자열 항상 tool_calls입니다.

type 열거형: RunStepDetailsToolCallsObjectType

가치 설명
도구 호출

runStepDeltaStepDetailsToolCallsObject

도구 호출의 세부 정보입니다.

이름 유형 설명 필수 기본값
도구 호출 array 실행 단계가 관련된 도구 호출의 배열입니다. 세 가지 도구 형식 code_interpreter, file_search 또는 function 중 하나와 연결될 수 있습니다.
아니오
유형 문자열 항상 tool_calls입니다.

type 열거형: RunStepDeltaStepDetailsToolCallsObjectType

가치 설명
도구 호출

runStepDetailsToolCallsCodeObject

실행 단계가 관련된 코드 인터프리터 도구 호출의 세부 정보입니다.

이름 유형 설명 필수 기본값
코드 인터프리터 객체 코드 인터프리터 도구 호출 정의입니다.
└─ 입력 문자열 코드 인터프리터 도구 호출에 대한 입력입니다. 아니오
└─ outputs array 코드 인터프리터 도구 호출의 출력입니다. 코드 인터프리터는 텍스트(logs) 또는 이미지(image)를 포함하는 하나 이상의 항목을 출력할 수 있습니다. 이러한 각 항목은 서로 다른 개체 형식으로 표시됩니다. 아니오
아이디 문자열 도구 호출의 ID입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 code_interpreter가 됩니다.

type 열거형: RunStepDetailsToolCallsCodeObjectType

가치 설명
코드 인터프리터

runStepDeltaStepDetailsToolCallsCodeObject

실행 단계가 관련된 코드 인터프리터 도구 호출의 세부 정보입니다.

이름 유형 설명 필수 기본값
코드 인터프리터 객체 코드 인터프리터 도구 호출 정의입니다. 아니오
└─ 입력 문자열 코드 인터프리터 도구 호출에 대한 입력입니다. 아니오
└─ outputs array 코드 인터프리터 도구 호출의 출력입니다. 코드 인터프리터는 텍스트(logs) 또는 이미지(image)를 포함하는 하나 이상의 항목을 출력할 수 있습니다. 이러한 각 항목은 서로 다른 개체 형식으로 표시됩니다. 아니오
아이디 문자열 도구 호출의 ID입니다. 아니오
인덱스 integer 도구 호출 배열의 도구 호출 인덱스입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 code_interpreter가 됩니다.

type 열거형: RunStepDeltaStepDetailsToolCallsCodeObjectType

가치 설명
코드 인터프리터

runStepDetailsToolCallsCodeOutputLogsObject

실행 단계의 일부인 코드 인터프리터 도구 호출의 텍스트 출력입니다.

이름 유형 설명 필수 기본값
로그 문자열 코드 인터프리터 도구 호출의 텍스트 출력입니다.
유형 문자열 항상 logs입니다.

type 열거형: RunStepDetailsToolCallsCodeOutputLogsObjectType

가치 설명
로그

runStepDeltaStepDetailsToolCallsCodeOutputLogsObject

실행 단계의 일부인 코드 인터프리터 도구 호출의 텍스트 출력입니다.

이름 유형 설명 필수 기본값
인덱스 integer 출력 배열의 출력 인덱스입니다.
로그 문자열 코드 인터프리터 도구 호출의 텍스트 출력입니다. 아니오
유형 문자열 항상 logs입니다.

type 열거형: RunStepDeltaStepDetailsToolCallsCodeOutputLogsObjectType

가치 설명
로그

runStepDetailsToolCallsCodeOutputImageObject

이름 유형 설명 필수 기본값
이미지 객체
└─ file_id 문자열 이미지의 파일 ID입니다. 아니오
유형 문자열 항상 image입니다.

type 열거형: RunStepDetailsToolCallsCodeOutputImageObjectType

가치 설명
이미지

runStepDeltaStepDetailsToolCallsCodeOutputImageObject

이름 유형 설명 필수 기본값
이미지 객체 아니오
└─ file_id 문자열 이미지의 파일 ID입니다. 아니오
인덱스 integer 출력 배열의 출력 인덱스입니다.
유형 문자열 항상 image입니다.

type 열거형: RunStepDeltaStepDetailsToolCallsCodeOutputImageObject

가치 설명
이미지

runStepDetailsToolCallsFileSearchObject

이름 유형 설명 필수 기본값
파일 검색 객체 지금은 항상 빈 개체가 됩니다.
└─ 결과 array 파일 검색의 결과입니다. 아니오
아이디 문자열 도구 호출 개체의 ID입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 file_search가 됩니다.

type 열거형: RunStepDetailsToolCallsFileSearchObjectType

가치 설명
파일 검색

runStepDetailsToolCallsFileSearchResultObject

파일 검색의 결과 인스턴스입니다.

이름 유형 설명 필수 기본값
내용 array 발견된 결과의 콘텐츠입니다. 이 콘텐츠는 include 쿼리 매개 변수를 통해 요청된 경우에만 포함됩니다. 아니오
file_id 문자열 결과를 찾은 파일의 ID입니다.
파일_이름 문자열 결과를 찾은 파일의 이름입니다.
score 숫자 결과의 점수입니다. 모든 값은 0에서 1 사이의 부동 소수점 숫자여야 합니다.

runStepDeltaStepDetailsToolCallsFileSearchObject

이름 유형 설명 필수 기본값
파일 검색 객체 지금은 항상 빈 개체가 됩니다.
아이디 문자열 도구 호출 개체의 ID입니다. 아니오
인덱스 integer 도구 호출 배열의 도구 호출 인덱스입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 retrieval가 됩니다.

type 열거형: RunStepDeltaStepDetailsToolCallsFileSearchObjectType

가치 설명
파일 검색

runStepDetailsToolCallsFunctionObject

이름 유형 설명 필수 기본값
기능 객체 호출된 함수의 정의입니다.
└─ 인수 문자열 함수에 전달된 인수입니다. 아니오
└) 이름 문자열 함수의 이름입니다. 아니오
└─ output 문자열 함수의 출력입니다. 출력이 아직 제출되지 않은 경우 null이 됩니다. 아니오
아이디 문자열 도구 호출 개체의 ID입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 function가 됩니다.

type 열거형: RunStepDetailsToolCallsFunctionObjectType

가치 설명
기능

runStepDeltaStepDetailsToolCallsFunctionObject

이름 유형 설명 필수 기본값
기능 객체 호출된 함수의 정의입니다. 아니오
└─ 인수 문자열 함수에 전달된 인수입니다. 아니오
└) 이름 문자열 함수의 이름입니다. 아니오
└─ output 문자열 함수의 출력입니다. 출력이 아직 제출되지 않은 경우 null이 됩니다. 아니오
아이디 문자열 도구 호출 개체의 ID입니다. 아니오
인덱스 integer 도구 호출 배열의 도구 호출 인덱스입니다.
유형 문자열 도구 호출의 형식입니다. 이러한 형식의 도구 호출에는 항상 function가 됩니다.

type 열거형: RunStepDetailsToolCallsFunctionObjectType

가치 설명
기능

vectorStoreExpirationAfter

벡터 저장소에 대한 만료 정책입니다.

이름 유형 설명 필수 기본값
문자열 만료 정책이 적용되는 앵커 타임스탬프입니다. 지원되는 앵커: last_active_at.
integer 벡터 저장소가 만료되는 앵커 시간 이후의 일 수입니다.

anchor 열거형: VectorStoreExpirationAfterAnchor

가치 설명
최근 활동 시간 만료 정책이 적용되는 앵커 타임스탬프입니다.

vectorStoreObject

벡터 저장소는 file_search 도구에서 사용할 수 있는 처리된 파일의 컬렉션입니다.

이름 유형 설명 필수 기본값
created_at integer 벡터 저장소가 만들어진 시점의 Unix 타임스탬프(초)입니다.
expires_after 벡터 저장 만료 후 벡터 저장소에 대한 만료 정책입니다. 아니오
만료_일자 integer 벡터 저장소가 만료될 시점의 Unix 타임스탬프(초)입니다. 아니오
파일_개수 객체
└' 취소됨 integer 취소된 파일 수입니다. 아니오
└> 완료됨 integer 성공적으로 처리된 파일 수입니다. 아니오
└> 실패 integer 처리하지 못한 파일 수입니다. 아니오
└진행 중 integer 현재 처리 중인 파일 수입니다. 아니오
└합계 integer 총 파일 수입니다. 아니오
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
최근 활동 시간 integer 벡터 저장소가 마지막으로 활성 상태였던 시점의 Unix 타임스탬프(초)입니다.
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
이름 문자열 벡터 저장소의 이름입니다.
객체 enum 항상 vector_store인 개체 형식입니다.
가능한 값: vector_store
상태 문자열 벡터 저장소의 상태로, expired, in_progress 또는 completed일 수 있습니다. completed의 상태는 벡터 저장소를 사용할 준비가 되었음을 나타냅니다.
usage_bytes integer 벡터 저장소의 파일에 사용되는 총 바이트 수입니다.

status 열거형: VectorStoreObjectStatus

가치 설명
expired
진행 중
완료됨

벡터저장소요청 생성

이름 유형 설명 필수 기본값
chunking_strategy autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. 아니오
expires_after 벡터 저장 만료 후 벡터 저장소에 대한 만료 정책입니다. 아니오
파일_아이디 array 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
이름 문자열 벡터 저장소의 이름입니다. 아니오

벡터 저장소 요청 업데이트

이름 유형 설명 필수 기본값
expires_after 벡터 저장 만료 후 벡터 저장소에 대한 만료 정책입니다. 아니오
메타데이터 객체 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 이는 구조화된 형식으로 개체에 대한 추가 정보를 저장하는 데 유용할 수 있습니다. 키의 길이는 최대 64자이고 값은 최대 512자까지 가능합니다.
아니오
이름 문자열 벡터 저장소의 이름입니다. 아니오

listVectorStoresResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

벡터 저장소 삭제 응답

이름 유형 설명 필수 기본값
삭제됨 boolean
아이디 문자열
객체 문자열

object 열거형: DeleteVectorStoreResponseObject

가치 설명
벡터_저장소.삭제됨 삭제 벡터 저장소 응답 개체 상태입니다.

vectorStoreFileObject

벡터 저장소에 연결된 파일 목록입니다.

이름 유형 설명 필수 기본값
chunking_strategy autoChunkingStrategyRequestParam 또는 staticChunkingStrategyRequestParam 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 비어있지 않은 경우에만 file_ids 적용됩니다. 아니오
created_at integer 벡터 저장소 파일이 만들어진 시점의 Unix 타임스탬프(초)입니다.
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
마지막_오류 객체 이 벡터 저장소 파일과 연결된 마지막 오류입니다. 오류가 없으면 null이 됩니다.
└─ code 문자열 server_error, invalid_file 또는 unsupported_file 중 하나입니다. 아니오
└) 메시지 문자열 사람이 읽을 수 있는 오류 설명입니다. 아니오
객체 문자열 항상 vector_store.file인 개체 형식입니다.
상태 문자열 벡터 저장소 파일의 상태로, in_progress, completed, cancelled 또는 failed일 수 있습니다. completed 상태는 벡터 저장소 파일을 사용할 준비가 되었음을 나타냅니다.
usage_bytes integer 총 벡터 저장소 사용량(바이트)입니다. 원래 파일 크기와 다를 수 있습니다.
벡터 저장소 ID 문자열 파일이 연결된 벡터 저장소의 ID입니다.

object 열거형: VectorStoreFileObjectType

가치 설명
벡터_스토어.파일

status 열거형: VectorStoreFileObjectStatus

가치 설명
진행 중
완료됨
취소
실패

otherChunkingStrategyResponseParam

청크 전략을 알 수 없는 경우 반환됩니다. 일반적으로 이는 chunking_strategy 개념이 API에 도입되기 전에 파일이 인덱싱되었기 때문입니다.

이름 유형 설명 필수 기본값
유형 문자열 항상 other입니다.

type 열거형: OtherChunkingStrategyResponseParamType

가치 설명
기타

staticChunkingStrategyResponseParam

이름 유형 설명 필수 기본값
정적 staticChunkingStrategy (정적 청킹 전략)
유형 문자열 항상 static입니다.

type 열거형: StaticChunkingStrategyResponseParamType

가치 설명
정적

staticChunkingStrategy

이름 유형 설명 필수 기본값
chunk_overlap_tokens integer 청크 간에 겹치는 토큰 수입니다. 기본값은 400입니다.

겹침은 max_chunk_size_tokens의 절반을 초과할 수 없습니다.
max_chunk_size_tokens integer 각 청크의 최대 토큰 수입니다. 기본값은 800입니다. 최솟값은 100이고 최댓값은 4096입니다.

autoChunkingStrategyRequestParam

기본 전략. 이 전략은 현재 max_chunk_size_tokens800chunk_overlap_tokens400을 사용합니다.

이름 유형 설명 필수 기본값
유형 enum 항상 auto입니다.
가능한 값: auto

staticChunkingStrategyRequestParam

이름 유형 설명 필수 기본값
정적 staticChunkingStrategy
유형 enum 항상 static입니다.
가능한 값: static

chunkingStrategyRequestParam

파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

벡터 저장소 파일 요청 생성

이름 유형 설명 필수 기본값
chunking_strategy 청킹 전략 요청 매개변수 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 아니오
file_id 문자열 벡터 저장소에서 사용해야 하는 파일 ID입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다.

listVectorStoreFilesResponse

이름 유형 설명 필수 기본값
데이터 array
첫번째_아이디 문자열
has_more boolean
마지막 아이디 문자열
객체 문자열

deleteVectorStoreFileResponse

이름 유형 설명 필수 기본값
삭제됨 boolean
아이디 문자열
객체 문자열

object 열거형: DeleteVectorStoreFileResponseObject

가치 설명
벡터_저장소.파일.삭제됨

vectorStoreFileBatchObject

벡터 저장소에 연결된 파일의 일괄 처리입니다.

이름 유형 설명 필수 기본값
created_at integer 벡터 저장소 파일 일괄 처리가 만들어진 시점의 Unix 타임스탬프(초)입니다.
파일_개수 객체
└' 취소됨 integer 취소된 파일 수입니다. 아니오
└> 완료됨 integer 처리된 파일 수입니다. 아니오
└> 실패 integer 처리하지 못한 파일 수입니다. 아니오
└진행 중 integer 현재 처리 중인 파일 수입니다. 아니오
└합계 integer 총 파일 수입니다. 아니오
아이디 문자열 API 엔드포인트에서 참조할 수 있는 식별자입니다.
객체 문자열 항상 vector_store.file_batch인 개체 형식입니다.
상태 문자열 벡터 저장소 파일 일괄 처리의 상태로, in_progress, completed, cancelled 또는 failed일 수 있습니다.
벡터 저장소 ID 문자열 파일이 연결된 벡터 저장소의 ID입니다.

object 열거형: VectorStoreFileBatchObjectType

가치 설명
vector_store.files_batch

status 열거형: VectorStoreFileBatchObjectStatus

가치 설명
진행 중
완료됨
취소
실패

createVectorStoreFileBatchRequest

이름 유형 설명 필수 기본값
chunking_strategy 청킹 전략 요청 매개변수 파일을 청크하는 데 사용되는 청크 전략입니다. 설정하지 않으면 auto 전략을 사용합니다. 아니오
파일_아이디 array 벡터 저장소에서 사용해야 하는 파일 ID 목록입니다. 파일에 액세스할 수 있는 file_search와 같은 도구에 유용합니다.

assistantStreamEvent

실행을 스트리밍할 때 발생하는 이벤트를 나타냅니다.

서버에서 보낸 이벤트 스트림의 각 이벤트에는 eventdata 속성이 있습니다.

event: thread.created
data: {"id": "thread_123", "object": "thread", ...}

새 개체가 만들어지거나, 새 상태로 전환되거나, 부분(델타)으로 스트리밍될 때마다 이벤트를 내보냅니다. 예를 들어, 새 실행이 만들어지면 thread.run.created를 내보내고, 실행이 완료되면 thread.run.completed를 내보냅니다. 도우미가 실행 중에 메시지 만들기를 선택하면 thread.message.created event 이벤트, thread.message.in_progress 이벤트, 많은 thread.message.delta 이벤트, 마지막으로 thread.message.completed 이벤트를 차례로 내보냅니다.

시간이 지남에 따라 이벤트를 더 추가할 수 있으므로 코드의 알 수 없는 이벤트를 정상적으로 처리하는 것이 좋습니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

threadStreamEvent

이 구성 요소는 다음 중 하나일 수 있습니다.

스레드 생성됨

새 스레드가 만들어질 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 threadObject 메시지를 포함하는 스레드를 나타냅니다.
이벤트 문자열

데이터: threadObject

Event 열거형: ThreadStreamEventEnum

가치 설명
스레드 생성됨 스레드 생성 이벤트입니다.

스트림 이벤트 실행

이 구성 요소는 다음 중 하나일 수 있습니다.

thread.run.created

새 실행이 만들어지면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventCreated

가치 설명
thread.run.created

thread.run.queued

실행이 queued 상태로 이동할 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventQueued

가치 설명
thread.run.queued

thread.run.in_progress

실행이 in_progress 상태로 이동할 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventInProgress

가치 설명
thread.run.in_progress

thread.run.requires_action

실행이 requires_action 상태로 이동할 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventRequiresAction

가치 설명
thread.run.requires_action

스레드 실행 완료

실행이 완료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventCompleted

가치 설명
스레드 실행 완료

스레드 실행 실패

실행이 실패하면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventFailed

가치 설명
스레드 실행 실패

thread.run.cancelling

실행이 cancelling 상태로 이동할 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventCancelling

가치 설명
thread.run.cancelling

스레드.실행.취소됨

실행이 취소되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventCancelled

가치 설명
스레드.실행.취소됨

스레드 실행 만료

실행이 만료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runObject 스레드에서 실행되는 실행을 나타냅니다.
이벤트 문자열

데이터: runObject

Event 열거형: RunStreamEventExpired

가치 설명
스레드 실행 만료

runStepStreamEvent

이 구성 요소는 다음 중 하나일 수 있습니다.

thread.run.step.created

실행 단계가 만들어지면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventCreated

가치 설명
thread.run.step.created

thread.run.step.in_progress

실행 단계가 in_progress 상태로 전환되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventInProgress

가치 설명
thread.run.step.in_progress

thread.run.step.delta

실행 단계의 일부가 스트리밍되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepDeltaObject 실행 단계 델타, 즉, 스트리밍 중에 실행 단계에서 변경된 필드를 나타냅니다.
이벤트 문자열

데이터: runStepDeltaObject

Event 열거형: RunStepStreamEventDelta

가치 설명
thread.run.step.delta

thread.run.step.completed

실행 단계가 완료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventCompleted

가치 설명
thread.run.step.completed

thread.run.step.failed

실행 단계가 실패하면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventFailed

가치 설명
thread.run.step.failed

스레드 실행 단계가 취소됨

실행 단계가 취소되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventCancelled

가치 설명
스레드 실행 단계가 취소됨

thread.run.step.expired

실행 단계가 만료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 runStepObject 실행 수행의 단계를 나타냅니다.
이벤트 문자열

데이터: runStepObject

Event 열거형: RunStepStreamEventExpired

가치 설명
thread.run.step.expired

메시지스트림이벤트

이 구성 요소는 다음 중 하나일 수 있습니다.

thread.message.created

메시지가 만들어질 때 발생합니다.

이름 유형 설명 필수 기본값
데이터 messageObject 스레드 내의 메시지를 나타냅니다.
이벤트 문자열

데이터: messageObject

Event 열거형: MessageStreamEventCreated

가치 설명
thread.message.created

thread.message.in_progress

메시지가 in_progress 상태로 전환하면 발생합니다.

이름 유형 설명 필수 기본값
데이터 messageObject 스레드 내의 메시지를 나타냅니다.
이벤트 문자열

데이터: messageObject

Event 열거형: MessageStreamEventInProgress

가치 설명
thread.message.in_progress

thread.message.delta

메시지의 일부가 스트리밍되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 messageDeltaObject 메시지 델타, 즉 스트리밍 중에 메시지의 변경된 필드를 나타냅니다.
이벤트 문자열

데이터: messageDeltaObject

Event 열거형: MessageStreamEventDelta

가치 설명
thread.message.delta

thread.message.completed

메시지가 완료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 messageObject 스레드 내의 메시지를 나타냅니다.
이벤트 문자열

데이터: messageObject

Event 열거형: MessageStreamEventCompleted

가치 설명
thread.message.completed

thread.message.incomplete

메시지가 완료되기 전에 종료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 messageObject 스레드 내의 메시지를 나타냅니다.
이벤트 문자열

데이터: messageObject

Event 열거형: MessageStreamEventIncomplete

가치 설명
thread.message.incomplete

주석

이 구성 요소는 다음 중 하나일 수 있습니다.

그런 다음

클릭 동작입니다.

이름 유형 설명 필수 기본값
단추 enum 클릭하는 동안 누른 마우스 단추를 나타냅니다. left, right, wheel, back, forward 중 하나입니다.

가능한 값: left, right, wheel, backforward
유형 enum 이벤트 유형을 지정합니다. 클릭 작업의 경우 이 속성은 항상 .로 설정됩니다 click.

가능한 값: click
x integer 클릭이 발생한 x 좌표입니다.
y integer 클릭이 발생한 y 좌표입니다.

코드 해석기 파일 출력

파일인 코드 인터프리터 도구 호출의 출력입니다.

이름 유형 설명 필수 기본값
파일 array
유형 enum 코드 인터프리터 파일 출력의 형식입니다. 항상 files입니다.

가능한 값: files

CodeInterpreterTextOutput

텍스트인 코드 인터프리터 도구 호출의 출력입니다.

이름 유형 설명 필수 기본값
로그 문자열 코드 인터프리터 도구 호출의 로그입니다.
유형 enum 코드 인터프리터 텍스트 출력의 형식입니다. 항상 logs입니다.

가능한 값: logs

CodeInterpreterTool

코드를 실행하는 도구입니다.

이름 유형 설명 필수 기본값
파일_아이디 array 코드를 실행할 파일의 ID입니다.
유형 enum 코드 인터프리터 도구의 형식입니다. 항상 code_interpreter입니다.

가능한 값: code_interpreter

코드 해석기 도구 호출

코드를 실행하는 도구 호출입니다.

이름 유형 설명 필수 기본값
코드 문자열 실행할 코드입니다.
아이디 문자열 코드 인터프리터 도구 호출의 고유 ID입니다.
결과 array 코드 인터프리터 도구 호출의 결과입니다.
상태 enum 코드 인터프리터 도구 호출의 상태입니다.

가능한 값: in_progress, interpretingcompleted
유형 enum 코드 인터프리터 도구 호출의 형식입니다. 항상 code_interpreter_call입니다.

가능한 값: code_interpreter_call

코드 인터프리터 도구 출력

이 구성 요소는 다음 중 하나일 수 있습니다.

비교 필터

정의된 비교 작업을 사용하여 지정된 특성 키를 지정된 값과 비교하는 데 사용되는 필터입니다.

이름 유형 설명 필수 기본값
열쇠 문자열 값과 비교할 키입니다.
유형 enum 비교 연산eqnegtgteltlte자를 지정합니다.
- eq:같음
- ne: 같지 않음
- gt: 보다 큼
- gte: 크거나 같음
- lt:미만
- lte: 작거나 같음

가능한 값: eq, ne, gtgte, ltlte
가치 문자열 또는 숫자 또는 불리언 특성 키와 비교할 값입니다. 문자열, 숫자 또는 부울 유형을 지원합니다.

복합 필터

and 또는 or를 사용하여 여러 필터를 결합합니다.

이름 유형 설명 필수 기본값
filters array 결합할 필터의 배열입니다. 항목은 ComparisonFilter 또는 CompoundFilter일 수 있습니다.
유형 enum 작업 유형: and 또는 or.
가능한 값: andor

ComputerAction

이 구성 요소는 다음 중 하나일 수 있습니다.

컴퓨터스크린샷이미지

컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다.

이름 유형 설명 필수 기본값
file_id 문자열 스크린샷을 포함하는 업로드된 파일의 식별자입니다. 아니오
image_url 문자열 스크린샷 이미지의 URL입니다. 아니오
유형 enum 이벤트 유형을 지정합니다. 컴퓨터 스크린샷의 경우 이 속성은 항상 .로 설정됩니다 computer_screenshot.

가능한 값: computer_screenshot

ComputerTool

가상 컴퓨터를 제어하는 도구입니다.

이름 유형 설명 필수 기본값
디스플레이 높이 숫자 컴퓨터 디스플레이의 높이입니다.
디스플레이 너비 숫자 컴퓨터 표시의 너비입니다.
환경 enum 제어할 컴퓨터 환경의 유형입니다.

가능한 값: mac, windows, ubuntubrowser
유형 enum 컴퓨터 사용 도구의 유형입니다. 항상 computer_use_preview입니다.

가능한 값: computer-use-preview

컴퓨터 도구 호출

컴퓨터 사용 도구에 대한 도구 호출입니다.

이름 유형 설명 필수 기본값
조치 ComputerAction
call_id 문자열 출력을 사용하여 도구 호출에 응답할 때 사용되는 식별자입니다.
아이디 문자열 컴퓨터 호출의 고유 ID입니다.
대기 중인 안전 검사 array 보류 중인 보안 검사에서 컴퓨터 호출을 확인합니다.
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
유형 enum 컴퓨터 호출의 유형입니다. 항상 computer_call입니다.
가능한 값: computer_call

ComputerToolCallOutput

컴퓨터 도구 호출의 출력입니다.

이름 유형 설명 필수 기본값
acknowledged_safety_checks array 개발자가 승인한 API에서 보고한 안전 검사입니다.
아니오
call_id 문자열 출력을 생성한 컴퓨터 도구 호출의 ID입니다.
아이디 문자열 컴퓨터 도구 호출 출력의 ID입니다.
아니오
출력 ComputerScreenshotImage 컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다.
상태 열거형 메시지 입력의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 컴퓨터 도구 호출 출력의 형식입니다. 항상 computer_call_output입니다.

가능한 값: computer_call_output

ComputerToolCallOutputResource

이름 유형 설명 필수 기본값
acknowledged_safety_checks array 개발자가 승인한 API에서 보고한 안전 검사입니다.
아니오
call_id 문자열 출력을 생성한 컴퓨터 도구 호출의 ID입니다.
아이디 문자열 컴퓨터 호출 도구 출력의 고유 ID입니다.
출력 ComputerScreenshotImage 컴퓨터 사용 도구와 함께 사용되는 컴퓨터 스크린샷 이미지입니다.
상태 열거형 메시지 입력의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 컴퓨터 도구 호출 출력의 형식입니다. 항상 computer_call_output입니다.

가능한 값: computer_call_output

ComputerToolCallSafetyCheck

컴퓨터 호출에 대한 보류 중인 안전 검사입니다.

이름 유형 설명 필수 기본값
코드 문자열 보류 중인 안전 검사의 유형입니다.
아이디 문자열 보류 중인 안전 검사의 ID입니다.
메시지 문자열 보류 중인 안전 검사에 대한 세부 정보입니다.

콘텐츠

다중 모달 입력 및 출력 콘텐츠입니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

좌표

x/y 좌표 쌍(예: { x: 100, y: 200 }

이름 유형 설명 필수 기본값
x 정수 X 좌표입니다.
y 정수 Y 좌표입니다.

CreateModelResponseProperties

이름 유형 설명 필수 기본값
메타데이터 메타데이터 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다.

키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다.
아니오
model 문자열 응답을 생성하는 데 사용되는 모델입니다. 아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. .
아니오

createResponse

이름 유형 설명 필수 기본값
include 배열 {"$ref": "#/components/schemas/includable/description"} 아니오
입력 문자열 또는 배열 응답을 생성하는 데 사용되는 모델에 대한 텍스트, 이미지 또는 파일 입력입니다.
지침 문자열 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다.

함께 previous_response_id사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다.
아니오
최대 출력 토큰 integer 표시되는 출력 토큰 및 추론 토큰을 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다.
아니오
병렬 도구 호출 boolean 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다.
아니오 진실
이전_응답_아이디 문자열 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. 아니오
추리 이성적 사고 o 시리즈 모델만

추론 모델에 대한 구성 옵션입니다.
아니오
store boolean API를 통해 나중에 검색할 수 있도록 생성된 모델 응답을 저장할지 여부입니다.
아니오 진실
스트림 boolean true로 설정하면 모델 응답 데이터가 서버에서 보낸 이벤트를 사용하여 생성될 때 클라이언트로 스트리밍됩니다. 아니오 거짓
문자 메시지 객체 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요:
- 텍스트 입력 및 출력
- 구조적 출력
아니오
└─ 형식 TextResponseFormatConfiguration 모델이 출력해야 하는 형식을 지정하는 개체입니다.

구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.

gpt-4o 및 최신 모델에는 권장되지 않습니다.

{ "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다.
아니오
도구_선택 ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다.
아니오
도구들 array 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.

모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다.

- 기본 제공 도구
아니오
truncation 열거형 모델 응답에 사용할 잘림 전략입니다.
- auto: 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하면 모델은 컨텍스트를 잘라낸다.
는 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞도록 응답합니다.
- disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.

가능한 값: autodisabled
아니오

DoubleClick

두 번 클릭 동작입니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트 유형을 지정합니다. 두 번 클릭 작업의 경우 이 속성은 항상 .로 설정됩니다 double_click.

가능한 값: double_click
x integer 두 번 클릭이 발생한 x 좌표입니다.
y integer 이중 클릭이 발생한 y 좌표입니다.

Drag

끌기 작업입니다.

이름 유형 설명 필수 기본값
array 끌기 동작의 경로를 나타내는 좌표 배열입니다. 좌표는 개체의 배열로 표시됩니다( 예:[{ x: 100, y: 200 }, { x: 200, y: 300 }]
유형 enum 이벤트 유형을 지정합니다. 끌기 작업의 경우 이 속성은 항상 .로 설정됩니다 drag.

가능한 값: drag

쉬운 입력 메시지

계층 구조 다음 명령을 나타내는 역할이 있는 모델에 대한 메시지 입력입니다. developer 역할 또는 system 역할과 함께 제공된 지침은 user 역할과 함께 제공된 지침보다 우선합니다. 역할이 있는 assistant 메시지는 이전 상호 작용에서 모델에 의해 생성된 것으로 추정됩니다.

이름 유형 설명 필수 기본값
내용 문자열 또는 InputMessageContentList 응답을 생성하는 데 사용되는 모델에 대한 텍스트, 이미지 또는 오디오 입력입니다.
이전 도우미 응답을 포함할 수도 있습니다.
역할 enum 메시지 입력의 역할입니다. user, assistant, system 또는 developer 중 하나입니다.

가능한 값: user, assistant, systemdeveloper
유형 enum 메시지 입력의 형식입니다. 항상 message입니다.

가능한 값: message
아니오

FileCitation

파일에 대한 인용입니다.

이름 유형 설명 필수 기본값
file_id 문자열 파일의 ID입니다.
인덱스 integer 파일 목록에 있는 파일의 인덱스입니다.
유형 enum 파일 인용의 형식입니다. 항상 file_citation입니다.

가능한 값: file_citation

FilePath

파일의 경로입니다.

이름 유형 설명 필수 기본값
file_id 문자열 파일의 ID입니다.
인덱스 integer 파일 목록에 있는 파일의 인덱스입니다.
유형 enum 파일 경로의 형식입니다. 항상 file_path입니다.

가능한 값: file_path

FileSearchRanker

파일 검색에 사용할 순위입니다. 지정하지 않으면 auto 순위 결정기를 사용합니다.

재산 가치
설명 파일 검색에 사용할 순위입니다. 지정하지 않으면 auto 순위 결정기를 사용합니다.
유형 문자열
auto
default_2024_08_21

파일검색도구

업로드된 파일에서 관련 콘텐츠를 검색하는 도구입니다.

이름 유형 설명 필수 기본값
filters ComparisonFilter 또는 CompoundFilter 파일 특성에 따라 적용할 필터입니다. 아니오
결과_최대수량 (max_num_results) integer 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다.
아니오
랭킹 옵션 객체 검색에 대한 순위 옵션입니다. 아니오
└─ ranker enum 파일 검색에 사용할 순위입니다.
가능한 값: autodefault-2024-11-15
아니오
└점수 임계값 숫자 파일 검색의 점수 임계값으로, 0에서 1 사이의 숫자입니다.
1에 가까운 숫자는 가장 관련성이 큰 결과만 반환하려고 시도하지만 더 적은 결과를 반환할 수 있습니다.
아니오 0
유형 enum 파일 검색 도구의 형식입니다. 항상 file_search입니다.

가능한 값: file_search
vector_store_ids array 검색할 벡터 저장소의 ID입니다.

FileSearchToolCall (파일 검색 도구 호출)

파일 검색 도구 호출의 결과입니다.

이름 유형 설명 필수 기본값
아이디 문자열 파일 검색 도구 호출의 고유 ID입니다.
쿼리 array 파일을 검색하는 데 사용되는 쿼리입니다.
결과 array 파일 검색 도구 호출의 결과입니다.
아니오
상태 enum 파일 검색 도구 호출의 상태입니다. in_progress, searching, incomplete 또는 failed 중 하나

가능한 값: in_progress, searching, completed, incompletefailed
유형 enum 파일 검색 도구 호출의 형식입니다. 항상 file_search_call입니다.

가능한 값: file_search_call

펑션툴 (FunctionTool)

모델에서 호출하도록 선택할 수 있는 함수를 사용자 고유의 코드로 정의합니다.

이름 유형 설명 필수 기본값
설명 문자열 함수에 대한 설명입니다. 모델에서 함수를 호출할지 여부를 결정하는 데 사용됩니다.
아니오
이름 문자열 호출할 함수의 이름입니다.
매개 변수 객체 함수의 매개 변수를 설명하는 JSON 스키마 개체입니다.
엄격한 boolean 엄격한 매개 변수 유효성 검사를 적용할지 여부입니다. 기본값 true.
유형 enum 함수 도구의 형식입니다. 항상 function입니다.

가능한 값: function

FunctionToolCall

함수를 실행하는 도구 호출입니다.

이름 유형 설명 필수 기본값
논쟁들 문자열 함수에 전달할 인수의 JSON 문자열입니다.
call_id 문자열 모델에서 생성된 함수 도구 호출의 고유 ID입니다.
아이디 문자열 함수 도구 호출의 고유 ID입니다.
이름 문자열 실행할 함수의 이름입니다.
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 함수 도구 호출의 형식입니다. 항상 function_call입니다.

가능한 값: function_call

FunctionToolCallOutput

함수 도구 호출의 출력입니다.

이름 유형 설명 필수 기본값
call_id 문자열 모델에서 생성된 함수 도구 호출의 고유 ID입니다.
아이디 문자열 함수 도구 호출 출력의 고유 ID입니다. 이 항목이 API를 통해 반환될 때 채워집니다.
아니오
출력 문자열 함수 도구 호출 출력의 JSON 문자열입니다.
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 함수 도구 호출 출력의 형식입니다. 항상 function_call_output입니다.

가능한 값: function_call_output

FunctionToolCallOutputResource

이름 유형 설명 필수 기본값
call_id 문자열 모델에서 생성된 함수 도구 호출의 고유 ID입니다.
아이디 문자열 함수 호출 도구 출력의 고유 ID입니다.
출력 문자열 함수 도구 호출 출력의 JSON 문자열입니다.
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 함수 도구 호출 출력의 형식입니다. 항상 function_call_output입니다.

가능한 값: function_call_output

includable

모델 응답에 포함할 추가 출력 데이터를 지정합니다. 현재 지원되는 값은 다음과 같습니다.

  • file_search_call.results: 파일 검색 도구 호출의 검색 결과를 포함합니다.
  • message.input_image.image_url: 입력 메시지의 이미지 URL을 포함합니다.
  • computer_call_output.output.image_url: 컴퓨터 호출 출력의 이미지 URL을 포함합니다.
재산 가치
설명 모델 응답에 포함할 추가 출력 데이터를 지정합니다. 현재 지원되는 값은 다음과 같습니다.
- file_search_call.results: 파일 검색 도구 호출의 검색 결과를 포함합니다.
- message.input_image.image_url: 입력 메시지의 이미지 URL을 포함합니다.
- computer_call_output.output.image_url: 컴퓨터 호출 출력의 이미지 URL을 포함합니다.
유형 문자열
file_search_call.results
message.input_image.image_url
computer_call_output.output.image_url

InputAudio

모델에 대한 오디오 입력입니다.

이름 유형 설명 필수 기본값
데이터 문자열 Base64로 인코딩된 오디오 데이터입니다.
포맷 enum 오디오 데이터의 형식입니다. 현재 지원되는 형식은 다음과 같습니다 mp3wav.

가능한 값: mp3wav
유형 enum 입력 항목의 형식입니다. 항상 input_audio입니다.

가능한 값: input_audio

입력 내용

이 구성 요소는 다음 중 하나일 수 있습니다.

입력 파일

모델에 대한 파일 입력입니다.

이름 유형 설명 필수 기본값
파일_데이터 문자열 모델로 보낼 파일의 콘텐츠입니다.
아니오
file_id 문자열 모델로 보낼 파일의 ID입니다.
아니오
파일 이름 문자열 모델로 보낼 파일의 이름입니다.
아니오
유형 enum 입력 항목의 형식입니다. 항상 input_file입니다.

가능한 값: input_file

InputImage

모델에 대한 이미지 입력입니다.

이름 유형 설명 필수 기본값
세부사항 enum 모델에 보낼 이미지의 세부 수준입니다. high, low 또는 auto 중 하나입니다. 기본값은 auto입니다.

가능한 값: high, lowauto
file_id 문자열 모델로 보낼 파일의 ID입니다.
아니오
image_url 문자열 모델로 보낼 이미지의 URL입니다. 데이터 URL의 정규화된 URL 또는 base64로 인코딩된 이미지입니다.
아니오
유형 enum 입력 항목의 형식입니다. 항상 input_image입니다.

가능한 값: input_image

입력항목

이 구성 요소는 다음 중 하나일 수 있습니다.

입력메시지

계층 구조 다음 명령을 나타내는 역할이 있는 모델에 대한 메시지 입력입니다. developer 역할 또는 system 역할과 함께 제공된 지침은 user 역할과 함께 제공된 지침보다 우선합니다.

이름 유형 설명 필수 기본값
내용 입력메시지콘텐츠리스트 다른 콘텐츠를 포함하는 모델에 대한 하나 이상의 입력 항목 목록
형식을 포함합니다.
역할 enum 메시지 입력의 역할입니다. user, system 또는 developer 중 하나입니다.

가능한 값: user, systemdeveloper
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 메시지 입력의 형식입니다. 항상 message로 설정하세요.

가능한 값: message
아니오

입력메시지콘텐츠목록

다양한 콘텐츠 형식을 포함하는 모델에 대한 하나 이상의 입력 항목 목록입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

입력메시지자원

이름 유형 설명 필수 기본값
내용 입력메시지콘텐츠리스트 다른 콘텐츠를 포함하는 모델에 대한 하나 이상의 입력 항목 목록
형식을 포함합니다.
아이디 문자열 메시지 입력의 고유 ID입니다.
역할 enum 메시지 입력의 역할입니다. user, system 또는 developer 중 하나입니다.

가능한 값: user, systemdeveloper
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 메시지 입력의 형식입니다. 항상 message로 설정하세요.

가능한 값: message
아니오

입력 텍스트

모델에 대한 텍스트 입력입니다.

이름 유형 설명 필수 기본값
문자 메시지 문자열 모델에 대한 텍스트 입력입니다.
유형 enum 입력 항목의 형식입니다. 항상 input_text입니다.

가능한 값: input_text

항목

응답을 생성하는 데 사용되는 콘텐츠 항목입니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

ItemReference

참조할 항목의 내부 식별자입니다.

이름 유형 설명 필수 기본값
아이디 문자열 참조할 항목의 ID입니다.
유형 enum 참조할 항목의 형식입니다. 항상 item_reference입니다.

가능한 값: item_reference

아이템리소스

응답을 생성하는 데 사용되는 콘텐츠 항목입니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

KeyPress

모델이 수행하려는 키 프레스의 컬렉션입니다.

이름 유형 설명 필수 기본값
열쇠 array 모델이 누르도록 요청하는 키 조합입니다. 각각 키를 나타내는 문자열 배열입니다.
유형 enum 이벤트 유형을 지정합니다. 키 프레스 작업의 경우 이 속성은 항상 .로 설정됩니다 keypress.

가능한 값: keypress

메타데이터

개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다.

키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

모델 응답 속성

이름 유형 설명 필수 기본값
메타데이터 메타데이터 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다.

키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다.
아니오
model 문자열 응답을 생성하는 데 사용되는 모델입니다. 아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
아니오 1
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
아니오 1
사용자 문자열 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. .
아니오

움직이다

마우스 이동 동작입니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트 유형을 지정합니다. 이동 작업의 경우 이 속성은 항상 .로 설정됩니다 move.

가능한 값: move
x 정수 이동할 x 좌표입니다.
y 정수 이동할 y 좌표입니다.

OutputAudio

모델의 오디오 출력입니다.

이름 유형 설명 필수 기본값
데이터 문자열 모델의 Base64로 인코딩된 오디오 데이터입니다.
transcript 문자열 모델의 오디오 데이터 대본입니다.
유형 enum 출력 오디오의 형식입니다. 항상 output_audio입니다.

가능한 값: output_audio

출력내용

이 구성 요소는 다음 중 하나일 수 있습니다.

출력 항목

이름 유형 설명 필수 기본값
조치 ComputerAction
논쟁들 문자열 함수에 전달할 인수의 JSON 문자열입니다.
call_id 문자열 출력을 사용하여 도구 호출에 응답할 때 사용되는 식별자입니다.
내용 array 추론 텍스트 내용입니다.
아이디 문자열 추론 콘텐츠의 고유 식별자입니다.
이름 문자열 실행할 함수의 이름입니다.
대기 중인 안전 검사 array 보류 중인 보안 검사에서 컴퓨터 호출을 확인합니다.
쿼리 array 파일을 검색하는 데 사용되는 쿼리입니다.
결과 array 파일 검색 도구 호출의 결과입니다.
아니오
역할 enum 출력 메시지의 역할입니다. 항상 assistant입니다.

가능한 값: assistant
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
유형 enum 개체의 유형. 항상 reasoning입니다.

가능한 값: reasoning

출력 메시지

모델의 출력 메시지입니다.

이름 유형 설명 필수 기본값
내용 array 출력 메시지의 내용입니다.
아이디 문자열 출력 메시지의 고유 ID입니다.
역할 enum 출력 메시지의 역할입니다. 항상 assistant입니다.

가능한 값: assistant
상태 열거형 메시지 입력의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 입력 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
유형 enum 출력 메시지의 형식입니다. 항상 message입니다.

가능한 값: message

출력 텍스트

모델의 텍스트 출력입니다.

이름 유형 설명 필수 기본값
주석 array 텍스트 출력의 주석입니다.
문자 메시지 문자열 모델의 텍스트 출력입니다.
유형 enum 출력 텍스트의 형식입니다. 항상 output_text입니다.

가능한 값: output_text

실시간 세션 생성 요청

실시간 세션 개체 구성입니다.

이름 유형 설명 필수 기본값
입력 오디오 형식 enum 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
pcm16의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
input_audio_noise_reduction 객체 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.
노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다.
오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다.
아니오
└─ 형식 enum 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.

가능한 값: near_fieldfar_field
아니오
input_audio_transcription 객체 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 전사 엔드포인트를 통해 비동기적으로 실행되며 모델이 들은 정확한 내용이라기보다 입력 오디오 콘텐츠의 지침으로 취급해야 합니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다.
아니오
└) 언어 문자열 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.
아니오
└─ model 문자열 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1입니다.
아니오
└) 프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.
whisper-1은 프롬프트가 키워드 목록입니다.
모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대").
아니오
지침 문자열 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친숙한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다.

서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다.
아니오
최대 응답 출력 토큰 정수 또는 문자열 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf입니다.
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
model 문자열 이 세션에 사용되는 배포의 이름입니다.
아니오
출력_오디오_포맷 enum 출력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
출력 pcm16오디오는 24kHz 속도로 샘플링됩니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
온도 숫자 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 오디오 모델의 경우 최상의 성능을 위해 0.8의 온도를 사용하는 것이 좋습니다.
아니오 0.8
도구_선택 문자열 모델이 도구를 선택하는 방법입니다. 옵션은 auto, none, required 또는 함수를 지정하십시오.
아니오 auto
도구들 array 모델에서 사용할 수 있는 도구(함수)입니다. 아니오
회전 감지 객체 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.
서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다.
아니오
└ 생성_응답 boolean VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다.
아니오 진실
└) 열망 enum semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.

가능한 값: low, medium, highauto
아니오
└interrupt_response 부울 VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto)으로 진행 중인 응답을 자동으로 중단할지 여부입니다.
아니오 진실
└prefix_padding_ms integer server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 enum 턴 감지 유형입니다.

가능한 값: server_vadsemantic_vad
아니오
목소리 VoiceIdsShared 아니오

RealtimeSessionCreateResponse

임시 키가 있는 새 실시간 세션 구성입니다. 키의 기본 TTL은 1분입니다.

이름 유형 설명 필수 기본값
클라이언트 비밀번호 객체 API에서 반환된 임시 키입니다.
└─ 만료_시간 integer 토큰이 만료되는 시기에 대한 타임스탬프입니다. 현재 모든 토큰은 1분 후에 만료됩니다.
아니오
└─ value 문자열 클라이언트 환경에서 실시간 API에 대한 연결을 인증하는 데 사용할 수 있는 임시 키입니다. 서버 쪽에서만 사용해야 하는 표준 API 토큰이 아닌 클라이언트 쪽 환경에서 사용합니다.
아니오
입력 오디오 형식 문자열 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
아니오
input_audio_transcription 객체 입력 오디오 전사의 구성은 기본적으로 비활성화되어 있으며, 활성화된 후 null로 설정하여 비활성화할 수 있습니다. 입력 오디오 전사는 모델이 오디오를 직접 사용하기 때문에 모델에 내장된 기능이 아닙니다. 전사는 Whisper를 통해 비동기적으로 실행되며 모델이 이해하는 표현이 아닌 대략적인 지침으로 취급해야 합니다.
아니오
└─ model 문자열 전사에 사용할 모델로, 현재 지원되는 유일한 모델은 whisper-1입니다.
아니오
지침 문자열 모델 호출 앞에 추가된 기본 시스템 지침(즉, 시스템 메시지)입니다. 이 필드를 사용하면 클라이언트가 원하는 응답에 대한 모델을 안내할 수 있습니다. 모델은 응답 콘텐츠 및 형식(예: "매우 간결", "친절한 행동", "좋은 응답의 예") 및 오디오 동작(예: "빠르게 말하기", "음성에 감정 주입", "자주 웃음")에 대해 지시할 수 있습니다. 지침은 모델이 뒤따를 것이라고 보장되지는 않지만 원하는 동작에 대한 지침을 모델에 제공합니다.
서버는 이 필드가 설정되지 않고 세션 시작 시 이벤트에 표시되는 session.created 경우 사용할 기본 지침을 설정합니다.
아니오
최대 응답 출력 토큰 정수 또는 문자열 도구 호출을 포함하는 단일 도우미 응답에 대한 최대 출력 토큰 수입니다. 출력 토큰을 제한하거나 inf 지정된 모델에 사용할 수 있는 최대 토큰에 대해 1에서 4096 사이의 정수를 제공합니다. 기본값은 inf입니다.
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
출력_오디오_포맷 문자열 출력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
아니오
온도 숫자 모델의 샘플링 온도([0.6, 1.2]로 제한됨) 기본값은 0.8입니다.
아니오
도구_선택 문자열 모델이 도구를 선택하는 방법입니다. 옵션은 auto, none, required 또는 함수를 지정하십시오.
아니오
도구들 array 모델에서 사용할 수 있는 도구(함수)입니다. 아니오
회전 감지 객체 턴 검색을 위한 구성입니다. null로 설정하면 꺼집니다. 서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
아니오
└prefix_padding_ms integer VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 문자열 발화 턴 감지 형식으로, 현재 server_vad만 지원됩니다.
아니오
목소리 VoiceIdsShared 아니오

RealtimeTranscriptionSessionCreateRequest

실시간 전사 세션 개체 구성입니다.

이름 유형 설명 필수 기본값
include 배열 전사에 포함할 항목 집합입니다. 현재 사용 가능한 항목은 다음과 같습니다.
- item.input_audio_transcription.logprobs
아니오
입력 오디오 형식 enum 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
pcm16의 경우 입력 오디오는 24kHz 샘플 속도, 단일 채널(mono) 및 little-endian 바이트 순서의 16비트 PCM이어야 합니다.

가능한 값: pcm16, g711_ulawg711_alaw
아니오
input_audio_noise_reduction 객체 입력 오디오 노이즈 감소를 위한 구성입니다. 이 설정을 해제하도록 null 설정할 수 있습니다.
노이즈 감소는 VAD 및 모델로 전송되기 전에 입력 오디오 버퍼에 추가된 오디오를 필터링합니다.
오디오를 필터링하면 입력 오디오에 대한 인식을 향상시켜 VAD 및 턴 감지 정확도(오검출(불필요한 탐지) 감소)와 모델 성능을 향상시킬 수 있습니다.
아니오
└─ 형식 enum 노이즈 감소 유형입니다. near_field 는 헤드폰과 같은 긴밀한 대화형 마이크를 위한 것으로, far_field 노트북이나 회의실 마이크와 같은 원거리 마이크용입니다.

가능한 값: near_fieldfar_field
아니오
input_audio_transcription 객체 입력 오디오 전사에 대한 구성입니다. 클라이언트는 필요에 따라 언어를 설정하고 전사를 요청하는 메시지를 표시할 수 있습니다. 이러한 지침은 전사 서비스에 대한 추가 지침을 제공합니다.
아니오
└) 언어 문자열 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.
아니오
└─ model 열거형 전사에 사용할 모델로, 현재 옵션은 gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1입니다.

가능한 값: gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1
아니오
└) 프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다.
whisper-1은 프롬프트가 키워드 목록입니다.
모델의 경우 gpt-4o-transcribe 프롬프트는 무료 텍스트 문자열입니다(예: "기술과 관련된 단어 기대").
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
회전 감지 객체 발화 턴 감지에 대한 구성으로, 서버 VAD 또는 의미 체계 VAD입니다. 이 설정을 해제하도록 null 설정할 수 있습니다. 이 경우 클라이언트는 모델 응답을 수동으로 트리거해야 합니다.
서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
의미 체계 VAD는 더 고급이며 턴 검색 모델(VAD와 함께)을 사용하여 사용자가 말하기를 완료했는지 여부를 의미 체계적으로 추정한 다음 이 확률에 따라 시간 제한을 동적으로 설정합니다. 예를 들어 사용자 오디오가 uhhm 소리로 끝날 경우 모델은 발화 턴이 끝날 확률을 낮게 계산하고 사용자가 계속 말할 때까지 더 오래 기다립니다. 이는 좀 더 자연스러운 대화에 유용할 수 있지만 대기 시간이 더 짧을 수 있습니다.
아니오
└ 생성_응답 boolean VAD 중지 이벤트가 발생할 때 자동으로 응답을 생성할지 여부입니다. 전사 세션에는 사용할 수 없습니다.
아니오 진실
└) 열망 enum semantic_vad 모드에만 사용됩니다. 모델이 응답하려는 열망. low 는 사용자가 말을 계속할 때까지 더 오래 기다리며 더 high 빠르게 응답합니다. auto 는 기본값이며 medium 와 동일합니다.

가능한 값: low, medium, highauto
아니오
└interrupt_response 부울 VAD 시작 이벤트가 발생할 때 기본 대화에 대한 출력(예 conversation auto)으로 진행 중인 응답을 자동으로 중단할지 여부입니다. 전사 세션에는 사용할 수 없습니다.
아니오 진실
└prefix_padding_ms integer server_vad 모드에만 사용됩니다. VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer server_vad 모드에만 사용됩니다. 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 server_vad 모드에만 사용됩니다. VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 enum 턴 감지 유형입니다.

가능한 값: server_vadsemantic_vad
아니오

RealtimeTranscriptionSessionCreateResponse

새 실시간 전사 세션 구성입니다.

REST API를 통해 서버에서 세션을 만들 때 세션 개체에는 임시 키도 포함됩니다. 키의 기본 TTL은 1분입니다. WebSocket API를 통해 세션을 업데이트할 때는 이 속성이 없습니다.

이름 유형 설명 필수 기본값
클라이언트 비밀번호 객체 API에서 반환된 임시 키입니다. REST API를 통해 서버에서 세션이 만들어지는 경우에만 존재합니다.
└─ 만료_시간 integer 토큰이 만료되는 시기에 대한 타임스탬프입니다. 현재 모든 토큰은 1분 후에 만료됩니다.
아니오
└─ value 문자열 클라이언트 환경에서 실시간 API에 대한 연결을 인증하는 데 사용할 수 있는 임시 키입니다. 서버 쪽에서만 사용해야 하는 표준 API 토큰이 아닌 클라이언트 쪽 환경에서 사용합니다.
아니오
입력 오디오 형식 문자열 입력 오디오의 형식입니다. 옵션은 pcm16, g711_ulaw 또는 g711_alaw입니다.
아니오
input_audio_transcription 객체 전사 모델의 구성입니다.
아니오
└) 언어 문자열 입력 오디오의 언어입니다. ISO-639-1(예: en형식)로 입력 언어를 제공하면 정확도와 대기 시간이 향상됩니다.
아니오
└─ model 열거형 전사에 사용할 모델입니다. gpt-4o-transcribe, gpt-4o-mini-transcribe 또는 whisper-1일 수 있습니다.

가능한 값: gpt-4o-transcribe, gpt-4o-mini-transcribewhisper-1
아니오
└) 프롬프트 문자열 모델 스타일을 안내하거나 이전 오디오 세그먼트를 계속 진행하기 위한 선택적 텍스트입니다. 프롬프트는 오디오 언어와 일치해야 합니다.
아니오
형식 모델이 응답할 수 있는 형식 집합입니다. 오디오를 사용하지 않도록 설정하려면 ["text"]로 설정합니다.
아니오
회전 감지 객체 턴 검색을 위한 구성입니다. null로 설정하면 꺼집니다. 서버 VAD는 모델이 오디오 볼륨을 기반으로 음성의 시작과 끝을 감지하고 사용자 음성의 끝에 응답한다는 것을 의미합니다.
아니오
└prefix_padding_ms integer VAD가 음성을 감지하기 전에 포함할 오디오 양(밀리초)입니다. 기본값은 300ms입니다.
아니오
└침묵 지속 시간(ms) silence_duration_ms integer 음성 중지를 감지하는 무음 기간(밀리초)입니다. 기본값은 500ms입니다. 값이 짧아질수록 모델은 더 빠르게 응답하겠지만, 사용자로부터 짧은 일시 중지 시에도 모델이 반응할 수 있습니다.
아니오
└) 임계값 숫자 VAD의 활성화 임계값(0.0~1.0)은 기본값인 0.5입니다. 임계값이 높을수록 모델을 활성화하기 위해 더 큰 오디오가 필요하므로 시끄러운 환경에서 더 나은 성능을 발휘할 수 있습니다.
아니오
└─ 형식 문자열 발화 턴 감지 형식으로, 현재 server_vad만 지원됩니다.
아니오

논리적 사고

o 시리즈 모델만

추론 모델에 대한 구성 옵션입니다.

이름 유형 설명 필수 기본값
노력 추론 노력 o 시리즈 모델만

추론 모델에서 추론 작업을 제한합니다.
현재 지원되는 값은 low, mediumhigh입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.
중간
요약 enum o 시리즈 모델만

모델에서 수행하는 추론에 대한 요약입니다. 이는 모델의 추론 프로세스를 디버깅하고 이해하는 데 유용할 수 있습니다.
concise 또는 detailed중 하나입니다.

가능한 값: concisedetailed
아니오

추리 항목

응답을 생성하는 동안 추론 모델에서 사용하는 생각 체인에 대한 설명입니다.

이름 유형 설명 필수 기본값
내용 array 추론 텍스트 내용입니다.
아이디 문자열 추론 콘텐츠의 고유 식별자입니다.
상태 열거형 항목의 상태입니다. in_progress, completed 또는 incomplete 중 하나입니다. 항목이 API를 통해 반환될 때 채워집니다.

가능한 값: in_progress, completedincomplete
아니오
유형 enum 개체의 유형. 항상 reasoning입니다.

가능한 값: reasoning

거절

모델의 거부입니다.

이름 유형 설명 필수 기본값
거절 문자열 모델의 거부 설명입니다.
유형 enum 거부의 유형입니다. 항상 refusal입니다.

가능한 값: refusal

응답

이름 유형 설명 필수 기본값
created_at 숫자 이 응답을 만든 시점의 Unix 타임스탬프(초)입니다.
오류 ResponseError 모델이 응답을 생성하지 못할 때 반환되는 오류 개체입니다.
아이디 문자열 이 응답의 고유 식별자입니다.
불완전한 세부사항 객체 응답이 불완전한 이유에 대한 세부 정보입니다.
└) 이유 enum 응답이 불완전한 이유입니다.
가능한 값: max_output_tokenscontent_filter
아니오
지침 문자열 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다.

함께 previous_response_id사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다.
최대 출력 토큰 integer 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다.
아니오
메타데이터 메타데이터 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다.

키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자인 문자열입니다.
model 문자열 응답을 생성하는 데 사용되는 모델입니다.
객체 enum 이 리소스의 개체 유형은 항상 response로 설정됩니다.

가능한 값: response
출력 array 모델에서 생성된 콘텐츠 항목의 배열입니다.

- 배열의 항목 output 길이와 순서는 모델의 응답에 따라 달라집니다.
- 배열의 첫 번째 항목에 접근하여 그것을 모델에서 생성한 콘텐츠가 포함된 메시지라고 가정하는 대신, SDK에서 지원되는 속성을 사용하는 것이 좋습니다.
출력_텍스트 문자열 SDK 전용 편의 속성으로, output_text 배열에 있는 모든 output 항목이 포함된 경우 해당 항목의 집계된 텍스트 출력을 포함합니다.
Python 및 JavaScript SDK에서 지원됩니다.
아니오
병렬 도구 호출 boolean 모델이 도구 호출을 병렬로 실행할 수 있도록 허용할지 여부입니다.
진실
이전_응답_아이디 문자열 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. 아니오
추리 이성적 사고 o 시리즈 모델만

추론 모델에 대한 구성 옵션입니다.
아니오
상태 enum 응답 생성의 상태입니다. completed, failed, in_progress 또는 incomplete 중 하나입니다.

가능한 값: completed, failed, in_progressincomplete
아니오
온도 숫자 사용할 샘플링 온도(0에서 2 사이)입니다. 0.8과 같이 값이 높을수록 출력이 더욱 무작위로 생성되고, 0.2와 같이 더 낮은 값을 지정하면 출력이 더욱 집중되고 결정적이게 됩니다.
일반적으로 이 항목 또는 top_p 중 하나만 변경하는 것이 좋습니다.
1
문자 메시지 객체 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요:
- 텍스트 입력 및 출력
- 구조적 출력
아니오
└─ 형식 TextResponseFormatConfiguration 모델이 출력해야 하는 형식을 지정하는 개체입니다.

구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.

gpt-4o 및 최신 모델에는 권장되지 않습니다.

{ "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다.
아니오
도구_선택 ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다.
도구들 array 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.

모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다.

- 기본 제공 도구
top_p 숫자 모델이 top_p 확률 질량을 가진 토큰의 결과를 고려하는 핵 샘플링이라고 하는 온도를 사용한 샘플링의 대안입니다. 따라서 0.1은 상위 10% 확률 질량을 구성하는 토큰만 고려됨을 의미합니다.

일반적으로 이 항목 또는 temperature 중 하나만 변경하는 것이 좋습니다.
1
truncation 열거형 모델 응답에 사용할 잘림 전략입니다.
- auto: 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다.
- disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.

가능한 값: autodisabled
아니오
사용량 ResponseUsage 입력 토큰, 출력 토큰, 출력 토큰 분석 및 사용된 총 토큰을 포함한 토큰 사용량 세부 정보를 나타냅니다.
아니오
사용자 문자열 최종 사용자를 나타내는 고유 식별자입니다. 이 식별자는 OpenAI가 남용을 모니터링하고 감지하는 데 도움이 될 수 있습니다. .
아니오

ResponseAudioDeltaEvent

부분 오디오 응답이 있을 때 내보내집니다.

이름 유형 설명 필수 기본값
델타 문자열 Base64로 인코딩된 응답 오디오 바이트의 청크입니다.
유형 enum 이벤트의 형식입니다. 항상 response.audio.delta입니다.

가능한 값: response.audio.delta

ResponseAudioDoneEvent

오디오 응답이 완료되면 내보냅니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트의 형식입니다. 항상 response.audio.done입니다.

가능한 값: response.audio.done

ResponseAudioTranscriptDeltaEvent

오디오의 부분 대본이 있을 때 내보냅니다.

이름 유형 설명 필수 기본값
델타 문자열 오디오 응답의 부분 대본입니다.
유형 enum 이벤트의 형식입니다. 항상 response.audio.transcript.delta입니다.

가능한 값: response.audio.transcript.delta

ResponseAudioTranscriptDoneEvent

전체 오디오 대본이 완료될 때 내보내집니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트의 형식입니다. 항상 response.audio.transcript.done입니다.

가능한 값: response.audio.transcript.done

ResponseCodeInterpreterCallCodeDeltaEvent

코드 인터프리터에서 부분 코드 조각을 추가할 때 내보내집니다.

이름 유형 설명 필수 기본값
델타 문자열 코드 인터프리터가 추가한 부분 코드 조각입니다.
출력 인덱스 integer 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.code_interpreter_call.code.delta입니다.

가능한 값: response.code_interpreter_call.code.delta

ResponseCodeInterpreterCallCodeDoneEvent

코드 조각 출력이 코드 인터프리터에 의해 종료될 때 내보내집니다.

이름 유형 설명 필수 기본값
코드 문자열 코드 인터프리터의 최종 코드 조각 출력입니다.
출력 인덱스 integer 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.code_interpreter_call.code.done입니다.

가능한 값: response.code_interpreter_call.code.done

ResponseCodeInterpreterCallCompletedEvent

코드 인터프리터 호출이 완료되면 내보내집니다.

이름 유형 설명 필수 기본값
코드_인터프리터_호출 CodeInterpreterToolCall 코드를 실행하는 도구 호출입니다.
출력 인덱스 integer 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.code_interpreter_call.completed입니다.

가능한 값: response.code_interpreter_call.completed

ResponseCodeInterpreterCallInProgressEvent

코드 인터프리터 호출이 진행 중일 때 내보내집니다.

이름 유형 설명 필수 기본값
코드_인터프리터_호출 CodeInterpreterToolCall 코드를 실행하는 도구 호출입니다.
출력 인덱스 integer 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.code_interpreter_call.in_progress입니다.

가능한 값: response.code_interpreter_call.in_progress

ResponseCodeInterpreterCallInterpretingEvent

코드 인터프리터가 코드 조각을 적극적으로 해석할 때 내보내집니다.

이름 유형 설명 필수 기본값
코드_인터프리터_호출 CodeInterpreterToolCall 코드를 실행하는 도구 호출입니다.
출력 인덱스 integer 코드 인터프리터 호출이 진행 중인 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.code_interpreter_call.interpreting입니다.

가능한 값: response.code_interpreter_call.interpreting

응답완료이벤트

모델 응답이 완료되면 내보내집니다.

이름 유형 설명 필수 기본값
응답 응답
유형 enum 이벤트의 형식입니다. 항상 response.completed입니다.

가능한 값: response.completed

ResponseContentPartAddedEvent

새 콘텐츠 파트가 추가될 때 내보내집니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 추가된 콘텐츠 파트의 인덱스입니다.
항목_아이디 문자열 콘텐츠 파트가 추가된 출력 항목의 ID입니다.
출력 인덱스 integer 콘텐츠 파트가 추가된 출력 항목의 인덱스입니다.
부분 OutputContent
유형 enum 이벤트의 형식입니다. 항상 response.content_part.added입니다.

가능한 값: response.content_part.added

ResponseContentPartDoneEvent

콘텐츠 파트가 완료되면 내보내집니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 완료된 콘텐츠 파트의 인덱스입니다.
항목_아이디 문자열 콘텐츠 파트가 추가된 출력 항목의 ID입니다.
출력 인덱스 integer 콘텐츠 파트가 추가된 출력 항목의 인덱스입니다.
부분 OutputContent
유형 enum 이벤트의 형식입니다. 항상 response.content_part.done입니다.

가능한 값: response.content_part.done

ResponseCreatedEvent

응답을 만들 때 내보내는 이벤트입니다.

이름 유형 설명 필수 기본값
응답 응답
유형 enum 이벤트의 형식입니다. 항상 response.created입니다.

가능한 값: response.created

응답 오류

모델이 응답을 생성하지 못할 때 반환되는 오류 개체입니다.

이름 유형 설명 필수 기본값
코드 ResponseErrorCode 응답에 대한 오류 코드입니다.
메시지 문자열 사람이 읽을 수 있는 오류 설명입니다.

응답 오류 코드

응답에 대한 오류 코드입니다.

재산 가치
설명 응답에 대한 오류 코드입니다.
유형 문자열
server_error
rate_limit_exceeded
invalid_prompt
vector_store_timeout
invalid_image
invalid_image_format
invalid_base64_image
invalid_image_url
image_too_large
image_too_small
image_parse_error
image_content_policy_violation
invalid_image_mode
image_file_too_large
unsupported_image_media_type
empty_image_file
failed_to_download_image
image_file_not_found

응답 오류 이벤트

오류가 발생할 때 내보냅니다.

이름 유형 설명 필수 기본값
코드 문자열 오류 코드입니다.
메시지 문자열 오류 메시지입니다.
param 문자열 오류 매개 변수입니다.
유형 enum 이벤트의 형식입니다. 항상 error입니다.

가능한 값: error

응답 실패 이벤트

응답이 실패할 때 내보내는 이벤트입니다.

이름 유형 설명 필수 기본값
응답 응답
유형 enum 이벤트의 형식입니다. 항상 response.failed입니다.

가능한 값: response.failed

ResponseFileSearchCallCompletedEvent

파일 검색 호출이 완료될 때 내보내집니다(결과를 찾은 경우).

이름 유형 설명 필수 기본값
항목_아이디 문자열 파일 검색 호출이 시작되는 출력 항목의 ID입니다.
출력 인덱스 integer 파일 검색 호출이 시작되는 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.file_search_call.completed입니다.

가능한 값: response.file_search_call.completed

ResponseFileSearchCallInProgressEvent

파일 검색 호출이 시작될 때 내보내집니다.

이름 유형 설명 필수 기본값
항목_아이디 문자열 파일 검색 호출이 시작되는 출력 항목의 ID입니다.
출력 인덱스 integer 파일 검색 호출이 시작되는 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.file_search_call.in_progress입니다.

가능한 값: response.file_search_call.in_progress

ResponseFileSearchCallSearchingEvent

파일 검색이 현재 검색 중일 때 내보내집니다.

이름 유형 설명 필수 기본값
항목_아이디 문자열 파일 검색 호출이 시작되는 출력 항목의 ID입니다.
출력 인덱스 integer 파일 검색 호출에서 검색하는 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.file_search_call.searching입니다.

가능한 값: response.file_search_call.searching

ResponseFunctionCallArgumentsDeltaEvent

부분 함수 호출 인수 델타가 있을 때 내보내집니다.

이름 유형 설명 필수 기본값
델타 문자열 추가되는 함수 호출 인수 델타입니다.
항목_아이디 문자열 함수 호출 인수 델타가 추가되는 출력 항목의 ID입니다.
출력 인덱스 integer 함수 호출 인수 델타가 추가되는 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.function_call_arguments.delta입니다.

가능한 값: response.function_call_arguments.delta

ResponseFunctionCallArgumentsDoneEvent

함수 호출 인수가 종료될 때 내보내집니다.

이름 유형 설명 필수 기본값
논쟁들 문자열 함수 호출 인수입니다.
항목_아이디 문자열 항목의 ID입니다.
출력 인덱스 integer 출력 항목의 인덱스입니다.
유형 enum
가능한 값: response.function_call_arguments.done

ResponseInProgressEvent

응답이 진행 중일 때 내보내집니다.

이름 유형 설명 필수 기본값
응답 응답
유형 enum 이벤트의 형식입니다. 항상 response.in_progress입니다.

가능한 값: response.in_progress

ResponseIncompleteEvent

응답이 완료되지 않은 것으로 완료될 때 내보내지는 이벤트입니다.

이름 유형 설명 필수 기본값
응답 응답
유형 enum 이벤트의 형식입니다. 항상 response.incomplete입니다.

가능한 값: response.incomplete

응답항목목록

응답 항목 목록입니다.

이름 유형 설명 필수 기본값
데이터 array 이 응답을 생성하는 데 사용되는 항목 목록입니다.
첫번째_아이디 문자열 목록의 첫 번째 항목 ID입니다.
has_more boolean 사용할 수 있는 항목이 더 있는지 여부입니다.
마지막 아이디 문자열 목록의 마지막 항목 ID입니다.
객체 enum 반환되는 개체의 형식은 list이어야 합니다.
가능한 값: list

반응 방식

모델이 생성하도록 할 출력 형식. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.

["text"]

gpt-4o-audio-preview 모델을 사용하여 오디오를 생성할 수도 있습니다. 이 모델이 텍스트 및 오디오 응답을 모두 생성하도록 요청하려면 다음을 사용할 수 있습니다.

["text", "audio"]

이 구성 요소에 대해 정의된 속성이 없습니다.

응답 양식(텍스트 전용)

모델이 생성하도록 할 출력 형식. 대부분의 모델은 기본값인 텍스트를 생성할 수 있습니다.

["text"]

이 API는 곧 오디오 및 이미지를 포함한 다른 출력 형식을 지원합니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

응답출력항목추가이벤트

새 출력 항목이 추가될 때 내보내집니다.

이름 유형 설명 필수 기본값
물품 OutputItem
출력 인덱스 integer 추가된 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_item.added입니다.

가능한 값: response.output_item.added

응답출력항목완료이벤트

출력 항목이 완료된 것으로 표시될 때 내보내집니다.

이름 유형 설명 필수 기본값
물품 OutputItem
출력 인덱스 integer 완료된 것으로 표시된 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_item.done입니다.

가능한 값: response.output_item.done

ResponseProperties

이름 유형 설명 필수 기본값
지침 문자열 시스템(또는 개발자) 메시지를 모델 컨텍스트의 첫 번째 항목으로 삽입합니다.

함께 previous_response_id사용하는 경우 이전 응답의 지침은 다음 응답으로 전달되지 않습니다. 이렇게 하면 시스템(또는 개발자) 메시지를 새 응답으로 간단하게 교환할 수 있습니다.
아니오
최대 출력 토큰 integer 표시되는 출력 토큰 및 대화 상태를 포함하여 응답에 대해 생성할 수 있는 토큰 수에 대한 상한입니다.
아니오
이전_응답_아이디 문자열 모델에 대한 이전 응답의 고유 ID입니다. 멀티 턴 대화를 만드는 데 사용합니다. 아니오
추리 이성적 사고 o 시리즈 모델만

추론 모델에 대한 구성 옵션입니다.
아니오
문자 메시지 객체 모델의 텍스트 응답에 대한 구성 옵션입니다. 일반 텍스트 또는 구조화된 JSON 데이터일 수 있습니다. 더 알아보세요:
- 텍스트 입력 및 출력
- 구조적 출력
아니오
└─ 형식 TextResponseFormatConfiguration 모델이 출력해야 하는 형식을 지정하는 개체입니다.

구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다. 기본 형식은 { "type": "text" } 추가 옵션이 없습니다.

gpt-4o 및 최신 모델에는 권장되지 않습니다.

{ "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다.
아니오
도구_선택 ToolChoiceOptions 또는 ToolChoiceTypes 또는 ToolChoiceFunction 모델이 응답을 생성할 때 사용할 도구(또는 도구)를 선택하는 방법입니다. 매개 변수를 tools 참조하여 모델이 호출할 수 있는 도구를 지정하는 방법을 확인합니다.
아니오
도구들 array 응답을 생성하는 동안 모델에서 호출할 수 있는 도구 배열입니다. 매개 변수를 설정 tool_choice 하여 사용할 도구를 지정할 수 있습니다.

모델을 제공할 수 있는 도구의 두 가지 범주는 다음과 같습니다.

- 기본 제공 도구
아니오
truncation 열거형 모델 응답에 사용할 잘림 전략입니다.
- auto: 이 응답의 컨텍스트와 이전 응답의 컨텍스트가 모델의 컨텍스트 창 크기를 초과하는 경우 모델은 대화 중간에 입력 항목을 삭제하여 컨텍스트 창에 맞게 응답을 자립니다.
- disabled (기본값): 모델 응답이 모델의 컨텍스트 창 크기를 초과하면 요청이 실패하고 400 오류가 발생합니다.

가능한 값: autodisabled
아니오

ResponseRefusalDeltaEvent

부분 거부 텍스트가 있을 때 내보냅니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 거부 텍스트가 추가되는 콘텐츠 부분의 인덱스입니다.
델타 문자열 추가되는 거부 텍스트입니다.
항목_아이디 문자열 거부 텍스트가 추가되는 출력 항목의 ID입니다.
출력 인덱스 integer 거부 텍스트가 추가되는 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.refusal.delta입니다.

가능한 값: response.refusal.delta

응답거부완료이벤트

거부 텍스트가 종료될 때 내보내집니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 거부 텍스트가 완료된 콘텐츠 부분의 인덱스입니다.
항목_아이디 문자열 거부 텍스트가 완료된 출력 항목의 ID입니다.
출력 인덱스 integer 거부 텍스트가 완료된 출력 항목의 인덱스입니다.
거절 문자열 최종 거부 텍스트입니다.
유형 enum 이벤트의 형식입니다. 항상 response.refusal.done입니다.

가능한 값: response.refusal.done

responseStreamEvent

이름 유형 설명 필수 기본값
annotation Annotation
annotation_index integer 추가된 주석의 인덱스입니다.
논쟁들 문자열 함수 호출 인수입니다.
코드 문자열 오류 코드입니다.
코드_인터프리터_호출 CodeInterpreterToolCall 코드를 실행하는 도구 호출입니다.
콘텐츠_인덱스 integer 텍스트 콘텐츠가 종료되는 콘텐츠 부분의 인덱스입니다.
델타 문자열 추가된 텍스트 델타입니다.
물품 OutputItem 완료된 것으로 표시된 출력 항목입니다.
항목_아이디 문자열 텍스트 콘텐츠가 최종 확정된 출력 항목의 ID입니다.
메시지 문자열 오류 메시지입니다.
출력 인덱스 integer 텍스트가 완성될 때의 출력 항목 인덱스입니다.
param 문자열 오류 매개 변수입니다.
부분 OutputContent 완료된 콘텐츠 부분입니다.
거절 문자열 최종 거부 텍스트입니다.
응답 응답 불완전한 응답입니다.
문자 메시지 문자열 최종 확정된 텍스트 콘텐츠입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_text.done입니다.

가능한 값: response.output_text.done

ResponseTextAnnotationDeltaEvent

텍스트 주석이 추가될 때 내보내집니다.

이름 유형 설명 필수 기본값
annotation Annotation
annotation_index integer 추가된 주석의 인덱스입니다.
콘텐츠_인덱스 integer 텍스트 주석이 추가된 콘텐츠 파트의 인덱스입니다.
항목_아이디 문자열 텍스트 주석이 추가된 출력 항목의 ID입니다.
출력 인덱스 integer 텍스트 주석이 추가된 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_text.annotation.added입니다.

가능한 값: response.output_text.annotation.added

ResponseTextDeltaEvent

추가 텍스트 델타가 있을 때 내보냅니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 텍스트 델타가 추가된 콘텐츠 부분의 인덱스입니다.
델타 문자열 추가된 텍스트 델타입니다.
항목_아이디 문자열 텍스트 델타가 추가된 출력 항목의 ID입니다.
출력 인덱스 integer 텍스트 델타가 추가된 출력 항목의 인덱스입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_text.delta입니다.

가능한 값: response.output_text.delta

ResponseTextDoneEvent

텍스트 콘텐츠가 종료될 때 내보내집니다.

이름 유형 설명 필수 기본값
콘텐츠_인덱스 integer 텍스트 콘텐츠가 종료되는 콘텐츠 부분의 인덱스입니다.
항목_아이디 문자열 텍스트 콘텐츠가 최종 확정된 출력 항목의 ID입니다.
출력 인덱스 integer 텍스트가 완성될 때의 출력 항목 인덱스입니다.
문자 메시지 문자열 최종 확정된 텍스트 콘텐츠입니다.
유형 enum 이벤트의 형식입니다. 항상 response.output_text.done입니다.

가능한 값: response.output_text.done

ResponseUsage

입력 토큰, 출력 토큰, 출력 토큰 분석 및 사용된 총 토큰을 포함한 토큰 사용량 세부 정보를 나타냅니다.

이름 유형 설명 필수 기본값
입력_토큰 integer 입력 토큰의 수입니다.
출력_토큰 integer 출력 토큰의 수입니다.
output_tokens_details 객체 출력 토큰에 대한 자세한 분석입니다.
└─ 추론_토큰 integer 추론 토큰의 수입니다. 아니오
총_토큰 integer 사용된 총 토큰 수입니다.

스크린샷

스크린샷 작업입니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트 유형을 지정합니다. 스크린샷 작업의 경우 이 속성은 항상 .로 설정됩니다 screenshot.

가능한 값: screenshot

Scroll

스크롤 동작입니다.

이름 유형 설명 필수 기본값
스크롤_엑스 integer 가로 스크롤 거리입니다.
scroll_y integer 세로 스크롤 거리입니다.
유형 enum 이벤트 유형을 지정합니다. 스크롤 작업의 경우 이 속성은 항상 .로 설정됩니다 scroll.

가능한 값: scroll
x integer 스크롤이 발생한 x 좌표입니다.
y integer 스크롤이 발생한 y 좌표입니다.

StopConfiguration

API가 추가 토큰 생성을 중지하는 최대 4개의 시퀀스입니다. 반환된 텍스트에는 중지 시퀀스가 포함되지 않습니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

텍스트 응답 형식 구성

모델이 출력해야 하는 형식을 지정하는 개체입니다.

구성 { "type": "json_schema" } 은 구조적 출력을 사용하도록 설정하여 모델이 제공된 JSON 스키마와 일치하도록 합니다.

기본 형식은 { "type": "text" } 추가 옵션이 없습니다.

gpt-4o 및 최신 모델에는 권장되지 않습니다.

{ "type": "json_object" } 이전 JSON 모드를 사용하도록 설정하면 모델이 생성하는 메시지가 유효한 JSON인지 확인합니다. 이를 지원하는 모델에는 사용하는 json_schema 것이 좋습니다.

이 구성 요소는 다음 중 하나일 수 있습니다.

텍스트응답형식JSON스키마

JSON 스키마 응답 형식입니다. 구조적 JSON 응답을 생성하는 데 사용됩니다. 구조적 출력에 대해 자세히 알아봅니다.

이름 유형 설명 필수 기본값
설명 문자열 응답 형식의 용도에 대한 설명이며, 모델에서 형식으로 응답하는 방법을 결정하는 데 사용됩니다.
아니오
이름 문자열 응답 형식의 이름입니다. a~z, A~Z, 0~9 또는 밑줄과 대시를 포함해야 하며 최대 길이는 64자여야 합니다.
아니오
schema(스키마) 응답형식JsonSchemaSchema JSON 스키마 개체로 설명되는 응답 형식에 대한 스키마입니다.
엄격한 boolean 출력을 생성할 때 엄격한 스키마 준수를 사용하도록 설정할지 여부입니다.
true로 설정하면 모델은 항상 schema 필드에 정의된 정확한 스키마를 따릅니다. stricttrue인 경우 JSON 스키마의 하위 집합만 지원됩니다.
아니오 거짓
유형 enum 정의되는 응답 형식의 유형입니다. 항상 json_schema입니다.
가능한 값: json_schema

도구

이 구성 요소는 다음 중 하나일 수 있습니다.

도구 선택 함수

모델을 강제로 특정 함수를 호출하려면 이 옵션을 사용합니다.

이름 유형 설명 필수 기본값
이름 문자열 호출할 함수의 이름입니다.
유형 enum 함수 호출의 경우 형식은 항상 function.입니다.
가능한 값: function

도구 선택 옵션

모델이 호출하는 도구(있는 경우)를 제어합니다.

none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.

auto는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다.

required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다.

재산 가치
설명 모델이 호출하는 도구(있는 경우)를 제어합니다.

none 는 모델이 도구를 호출하지 않고 대신 메시지를 생성한다는 의미입니다.

auto는 모델이 메시지 생성 또는 하나 이상의 도구 호출 중에서 선택할 수 있음을 의미합니다.

required는 모델이 하나 이상의 도구를 호출해야 함을 의미합니다.
유형 문자열
none
auto
required

도구 선택 유형

모델이 기본 제공 도구를 사용하여 응답을 생성해야 임을 나타냅니다.

이름 유형 설명 필수 기본값
유형 enum 모델에서 사용해야 하는 호스트된 도구의 형식입니다. 허용되는 값은 다음과 같습니다.
- file_search
- computer_use_preview

가능한 값: file_searchcomputer_use_preview

유형

텍스트에 입력할 작업입니다.

이름 유형 설명 필수 기본값
문자 메시지 문자열 입력할 텍스트입니다.
유형 enum 이벤트 유형을 지정합니다. 형식 작업의 경우 이 속성은 항상 .로 설정됩니다 type.

가능한 값: type

벡터 저장소 파일 속성 수정 요청

이름 유형 설명 필수 기본값
특성 VectorStoreFileAttributes 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다.

URL 인용

모델 응답을 생성하는 데 사용되는 웹 리소스에 대한 인용입니다.

이름 유형 설명 필수 기본값
end_index integer 메시지에서 URL 인용의 마지막 문자 인덱스입니다.
start_index integer 메시지에서 URL 인용의 첫 번째 문자 인덱스입니다.
제목 문자열 웹 리소스의 제목입니다.
유형 enum URL 인용의 형식입니다. 항상 url_citation입니다.

가능한 값: url_citation
url 문자열 웹 리소스의 URL입니다.

VectorStore 파일 속성

개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다.

이 구성 요소에 대해 정의된 속성이 없습니다.

VectorStoreFileContentResponse

벡터 저장소 파일의 구문 분석된 콘텐츠를 나타냅니다.

이름 유형 설명 필수 기본값
데이터 array 파일의 콘텐츠를 구문 분석했습니다.
has_more boolean 가져올 콘텐츠 페이지가 더 있는지를 나타냅니다.
다음_페이지 문자열 다음 페이지의 토큰(있는 경우)입니다.
객체 enum 항상 vector_store.file_content.page인 개체 형식입니다.
가능한 값: vector_store.file_content.page

벡터 스토어 검색 요청

이름 유형 설명 필수 기본값
filters ComparisonFilter 또는 CompoundFilter 파일 특성에 따라 적용할 필터입니다. 아니오
결과_최대수량 (max_num_results) integer 반환할 결과의 최대 수입니다. 이 숫자는 1에서 50 사이여야 합니다. 아니오 10
문의 문자열 또는 배열 검색에 대한 쿼리 문자열
랭킹 옵션 객체 검색에 대한 순위 옵션입니다. 아니오
└─ ranker enum 가능한 값: autodefault-2024-11-15 아니오
└점수 임계값 숫자 아니오 0
쿼리 재작성 boolean 벡터 검색을 위해 자연어 쿼리를 다시 작성할지 여부입니다. 아니오 거짓

벡터 저장소 검색 결과 내용 객체

이름 유형 설명 필수 기본값
문자 메시지 문자열 검색에서 반환된 텍스트 콘텐츠입니다.
유형 enum 콘텐츠의 형식입니다.
가능한 값: text

벡터스토어검색결과항목

이름 유형 설명 필수 기본값
특성 VectorStoreFileAttributes 개체에 연결할 수 있는 16개의 키-값 쌍 집합입니다. 구조화된 형식으로 개체에 대한 추가 정보를 저장하고 API 또는 대시보드를 통해 개체를 쿼리하는 데 유용할 수 있습니다. 키는 최대 길이가 64자인 문자열입니다. 값은 최대 길이가 512자이고 부울 또는 숫자인 문자열입니다.
내용 array 파일에서 가져온 콘텐츠 조각입니다.
file_id 문자열 벡터 저장소 파일의 ID입니다.
파일 이름 문자열 벡터 저장소 파일의 이름입니다.
score 숫자 결과의 유사성 점수입니다.

벡터 저장소 검색 결과 페이지

이름 유형 설명 필수 기본값
데이터 array 검색 결과 항목의 목록입니다.
has_more boolean 가져올 결과가 더 있는지를 나타냅니다.
다음_페이지 문자열 다음 페이지의 토큰(있는 경우)입니다.
객체 enum 항상 vector_store.search_results.page인 개체 형식입니다.
가능한 값: vector_store.search_results.page
검색_쿼리 array

VoiceIdsShared

이 구성 요소에 대해 정의된 속성이 없습니다.

대기

대기 작업입니다.

이름 유형 설명 필수 기본값
유형 enum 이벤트 유형을 지정합니다. 대기 작업의 경우 이 속성은 항상 .로 설정됩니다 wait.

가능한 값: wait

추론노력

o 시리즈 모델만

추론 모델에서 추론 작업을 제한합니다. 현재 지원되는 값은 low, mediumhigh입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.

재산 가치
설명 o 시리즈 모델만

추론 모델에서 추론 작업을 제한합니다.
현재 지원되는 값은 low, mediumhigh입니다. 추론 작업을 줄이면 응답 속도가 빨라지고 응답에서 추론에 사용되는 토큰이 줄어들 수 있습니다.
유형 문자열
기본값 중간
low
medium
high

errorEvent

오류가 발생하면 발생합니다. 이는 내부 서버 오류 또는 시간 제한으로 인해 발생할 수 있습니다.

이름 유형 설명 필수 기본값
데이터 오류
이벤트 문자열

event 열거형: ErrorEventEnum

가치 설명
오류

완료된이벤트

스트림이 종료되면 발생합니다.

이름 유형 설명 필수 기본값
데이터 문자열
이벤트 문자열

event 열거형: DoneEventEnum

가치 설명
완료

data 열거형: DoneEventDataEnum

가치 설명
[완료]

다음 단계

모델 및 REST API를 사용한 미세 조정에 대해 알아보세요. Azure OpenAI를 지원하는 기본 모델에 대해 자세히 알아봅니다.