다음을 통해 공유


Microsoft Foundry 모델 API 수명 주기 내의 Azure OpenAI

이 문서는 Azure OpenAI API에 대한 지원 수명 주기를 이해하는 데 도움이 됩니다.

비고

언제든지 새 API 응답 개체를 API 응답에 추가할 수 있습니다. 필요한 응답 개체만 구문 분석하는 것이 좋습니다.

API 진화

이전에 Azure OpenAI는 새 API 버전의 월별 업데이트를 받았습니다. 새로운 기능을 활용하려면 새로운 API 릴리스마다 코드 및 환경 변수를 지속적으로 업데이트해야 했습니다. 또한 Azure OpenAI는 OpenAI와 Azure OpenAI 간에 코드를 마이그레이션할 때 오버헤드를 발생시킨 Azure 특정 클라이언트를 사용하는 추가 단계가 필요했습니다.

2025년 8월부터 다음을 지원하는 차세대 v1 Azure OpenAI API를 옵트인할 수 있습니다.

  • 매월 새 api-version기능을 지정할 필요 없이 최신 기능에 지속적으로 액세스합니다.
  • 새 기능이 더 자주 출시되어 API 릴리스 주기가 더 빨라집니다.
  • 키 기반 인증을 사용할 때 OpenAI와 Azure OpenAI 간에 교환하기 위한 최소한의 코드 변경으로 OpenAI 클라이언트를 지원합니다.
  • 토큰 기반 인증 및 자동 토큰 새로 고침에 대한 OpenAI 클라이언트 지원은 별도의 Azure OpenAI 클라이언트에 종속되지 않아도 됩니다.
  • v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델을 사용하여 채팅 완료를 호출합니다.

아직 미리 보기 상태인 새 API 호출에 대한 액세스는 API 버전을 교환하지 않고도 원하는 기능을 옵트인할 수 있도록 기능별 미리 보기 헤더를 전달하여 제어됩니다. 또는 일부 기능은 API 경로를 통해 미리 보기 상태를 나타내며 추가 헤더가 필요하지 않습니다.

예제:

  • /openai/v1/evals는 미리 보기 상태이며 "aoai-evals":"preview" 헤더를 전달해야 합니다.
  • /openai/v1/fine_tuning/alpha/graders/는 미리 보기 상태이며 API 경로에 alpha가 있기 때문에 사용자 지정 헤더가 필요하지 않습니다.

초기 v1 GA(일반 공급) API 출시에서는 유추 및 작성 API 기능의 하위 집합만 지원합니다. 모든 GA 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다. 곧 더 많은 기능에 대한 지원을 빠르게 추가할 예정입니다.

코드 변경

v1 API

Python v1 예제

API 키:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),
    base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)

response = client.responses.create(   
  model="gpt-4.1-nano", # Replace with your model deployment name 
  input="This is a test.",
)

print(response.model_dump_json(indent=2)) 
  • OpenAI() 클라이언트가 대신 사용됩니다 AzureOpenAI().
  • base_url 는 Azure OpenAI 엔드포인트를 전달하고 /openai/v1 엔드포인트 주소에 추가됩니다.
  • api-version은 더 이상 v1 GA API를 사용하는 필수 매개 변수가 아닙니다.

환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY

client = OpenAI()

Microsoft Entra ID:

중요합니다

자동 토큰 새로 고침 처리는 이전에 AzureOpenAI() 클라이언트를 사용하여 처리되었습니다. v1 API는 OpenAI() 클라이언트에 자동 토큰 새로 고침 지원을 추가하여 이 종속성을 제거합니다.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key = token_provider  
)

response = client.responses.create(
    model="gpt-4.1-nano",
    input= "This is a test" 
)

print(response.model_dump_json(indent=2)) 
  • base_url 는 Azure OpenAI 엔드포인트를 전달하고 /openai/v1 엔드포인트 주소에 추가됩니다.
  • api_key 매개 변수가 token_provider로 설정되어, 정적 API 키를 사용하는 대신 인증 토큰의 자동 검색 및 새로 고침이 활성화됩니다.

모델 지원

Azure OpenAI 모델의 경우 응답 API를 사용하는 것이 좋습니다. 그러나 v1 API를 사용하면 OpenAI v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델과 채팅 완료 호출을 수행할 수도 있습니다.

base_urlhttps://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/ 형식과 https://YOUR-RESOURCE-NAME.services.ai.azure.com/openai/v1/ 형식을 모두 허용합니다.

비고

응답 API는 Microsoft AI, DeepSeek 및 Grok 모델과 같이 Azure에서 직접 판매하는 Foundry 모델에서도 작동합니다. 이러한 모델에서 응답 API를 사용하는 방법을 알아보려면 Microsoft Foundry 모델을 사용하여 텍스트 응답을 생성하는 방법을 참조하세요.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key=token_provider,
)
completion = client.chat.completions.create(
  model="MAI-DS-R1", # Replace with your model deployment name.
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Tell me about the attention is all you need paper"}
  ]
)

#print(completion.choices[0].message)
print(completion.model_dump_json(indent=2))

v1 API 지원

상태

일반적으로 사용 가능한 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다.

API 경로 상태
/openai/v1/chat/completions 일반 공급
/openai/v1/embeddings 일반 공급
/openai/v1/evals Preview
/openai/v1/files 일반 공급
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy Preview
/openai/v1/fine_tuning/alpha/graders/ Preview
/openai/v1/fine_tuning/ 일반 공급
/openai/v1/models 일반 공급
/openai/v1/responses 일반 공급
/openai/v1/vector_stores 일반 공급

미리 보기 헤더

API 경로 Header
/openai/v1/evals "aoai-evals":"preview"
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy "aoai-copy-ft-checkpoints" : "preview"

v1 미리 보기 릴리스와 2025-04-01-preview 간의 변경 내용

  • v1 미리 보기 API
  • 비디오 생성 지원
  • 새로운 응답 API 기능:
    • MCP(원격 모델 컨텍스트 프로토콜) 서버 도구 통합
    • 비동기 백그라운드 작업 지원
    • 암호화된 추론 항목
    • 이미지 생성

2025-04-01-preview와 2025-03-01-preview 간의 변경 내용

2025-03-01-preview와 2025-02-01-preview 간의 변경 내용

2025-02-01-preview와 2025-01-01-preview 사이의 변경 내용

  • 완료된 저장 항목(증류 API 지원).

2025-01-01-preview와 2024-12-01-preview 간의 변경 내용

2024-12-01-미리 보기와 2024-10-01-미리 보기 간의 변경 내용

  • storemetadata 저장된 완료 지원을 위해 추가된 매개 변수입니다.
  • 최신 reasoning_effort을 위해 을(를) 추가했습니다.
  • user_security_context을 위해 을(를) 추가했습니다.

2024-09-01-미리 보기와 2024-08-01-미리 보기 간의 변경 내용

  • max_completion_tokenso1-preview 모델을 지원하기 위해 o1-mini을(를) 추가했습니다. max_tokenso1 시리즈 모델에서 작동하지 않습니다.
  • parallel_tool_calls이(가) 추가되었습니다.
  • completion_tokens_detailsreasoning_tokens을(를) 추가했습니다.
  • stream_optionsinclude_usage을(를) 추가했습니다.

2024-07-01-preview와 2024-08-01-preview API 사양 간의 변경 내용

  • 구조적 출력 지원
  • 대용량 파일 업로드 API가 추가되었습니다.
  • 데이터 변경 내용:
    • Mongo DB 통합.
    • role_information 매개 변수가 제거되었습니다.
    • rerank_score가 인용 개체에 추가되었습니다.
    • AML 데이터 원본이 제거되었습니다.
    • AI 검색 벡터화 통합 개선.

2024-05-01-preview와 2024-07-01-preview API 사양 간의 변경 내용

2024-04-01-preview와 2024-05-01-preview API 사양 간의 변경 내용

2024-03-01-preview와 2024-04-01-preview API 사양 간의 변경 내용

  • 호환성이 손상되는 변경: 향상된 기능 매개 변수가 제거되었습니다. 이는 gpt-4버전:vision-preview 모델에 영향을 줍니다.
  • timestamp_granularities 매개 변수가 추가되었습니다.
  • audioWord 개체가 추가되었습니다.
  • 추가 TTS response_formats: wav & pcm.

알려진 문제

  • Azure OpenAI 사양은 2025-04-01-preview OpenAPI 3.1을 사용하며, 현재 Azure API Management에서 완전히 지원되지 않는 알려진 문제입니다.

다음 단계