이 문서는 Azure OpenAI API에 대한 지원 수명 주기를 이해하는 데 도움이 됩니다.
비고
언제든지 새 API 응답 개체를 API 응답에 추가할 수 있습니다. 필요한 응답 개체만 구문 분석하는 것이 좋습니다.
API 진화
이전에 Azure OpenAI는 새 API 버전의 월별 업데이트를 받았습니다. 새로운 기능을 활용하려면 새로운 API 릴리스마다 코드 및 환경 변수를 지속적으로 업데이트해야 했습니다. 또한 Azure OpenAI는 OpenAI와 Azure OpenAI 간에 코드를 마이그레이션할 때 오버헤드를 발생시킨 Azure 특정 클라이언트를 사용하는 추가 단계가 필요했습니다.
2025년 8월부터 다음을 지원하는 차세대 v1 Azure OpenAI API를 옵트인할 수 있습니다.
- 매월 새
api-version기능을 지정할 필요 없이 최신 기능에 지속적으로 액세스합니다. - 새 기능이 더 자주 출시되어 API 릴리스 주기가 더 빨라집니다.
- 키 기반 인증을 사용할 때 OpenAI와 Azure OpenAI 간에 교환하기 위한 최소한의 코드 변경으로 OpenAI 클라이언트를 지원합니다.
- 토큰 기반 인증 및 자동 토큰 새로 고침에 대한 OpenAI 클라이언트 지원은 별도의 Azure OpenAI 클라이언트에 종속되지 않아도 됩니다.
- v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델을 사용하여 채팅 완료를 호출합니다.
아직 미리 보기 상태인 새 API 호출에 대한 액세스는 API 버전을 교환하지 않고도 원하는 기능을 옵트인할 수 있도록 기능별 미리 보기 헤더를 전달하여 제어됩니다. 또는 일부 기능은 API 경로를 통해 미리 보기 상태를 나타내며 추가 헤더가 필요하지 않습니다.
예제:
-
/openai/v1/evals는 미리 보기 상태이며"aoai-evals":"preview"헤더를 전달해야 합니다. -
/openai/v1/fine_tuning/alpha/graders/는 미리 보기 상태이며 API 경로에alpha가 있기 때문에 사용자 지정 헤더가 필요하지 않습니다.
초기 v1 GA(일반 공급) API 출시에서는 유추 및 작성 API 기능의 하위 집합만 지원합니다. 모든 GA 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다. 곧 더 많은 기능에 대한 지원을 빠르게 추가할 예정입니다.
코드 변경
v1 API
API 키:
import os
from openai import OpenAI
client = OpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)
response = client.responses.create(
model="gpt-4.1-nano", # Replace with your model deployment name
input="This is a test.",
)
print(response.model_dump_json(indent=2))
-
OpenAI()클라이언트가 대신 사용됩니다AzureOpenAI(). -
base_url는 Azure OpenAI 엔드포인트를 전달하고/openai/v1엔드포인트 주소에 추가됩니다. -
api-version은 더 이상 v1 GA API를 사용하는 필수 매개 변수가 아닙니다.
환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY
client = OpenAI()
Microsoft Entra ID:
중요합니다
자동 토큰 새로 고침 처리는 이전에 AzureOpenAI() 클라이언트를 사용하여 처리되었습니다. v1 API는 OpenAI() 클라이언트에 자동 토큰 새로 고침 지원을 추가하여 이 종속성을 제거합니다.
from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key = token_provider
)
response = client.responses.create(
model="gpt-4.1-nano",
input= "This is a test"
)
print(response.model_dump_json(indent=2))
-
base_url는 Azure OpenAI 엔드포인트를 전달하고/openai/v1엔드포인트 주소에 추가됩니다. -
api_key매개 변수가token_provider로 설정되어, 정적 API 키를 사용하는 대신 인증 토큰의 자동 검색 및 새로 고침이 활성화됩니다.
모델 지원
Azure OpenAI 모델의 경우 응답 API를 사용하는 것이 좋습니다. 그러나 v1 API를 사용하면 OpenAI v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델과 채팅 완료 호출을 수행할 수도 있습니다.
base_url는 https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/ 형식과 https://YOUR-RESOURCE-NAME.services.ai.azure.com/openai/v1/ 형식을 모두 허용합니다.
비고
응답 API는 Microsoft AI, DeepSeek 및 Grok 모델과 같이 Azure에서 직접 판매하는 Foundry 모델에서도 작동합니다. 이러한 모델에서 응답 API를 사용하는 방법을 알아보려면 Microsoft Foundry 모델을 사용하여 텍스트 응답을 생성하는 방법을 참조하세요.
from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = OpenAI(
base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
api_key=token_provider,
)
completion = client.chat.completions.create(
model="MAI-DS-R1", # Replace with your model deployment name.
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Tell me about the attention is all you need paper"}
]
)
#print(completion.choices[0].message)
print(completion.model_dump_json(indent=2))
v1 API 지원
상태
일반적으로 사용 가능한 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다.
| API 경로 | 상태 |
|---|---|
/openai/v1/chat/completions |
일반 공급 |
/openai/v1/embeddings |
일반 공급 |
/openai/v1/evals |
Preview |
/openai/v1/files |
일반 공급 |
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy |
Preview |
/openai/v1/fine_tuning/alpha/graders/ |
Preview |
/openai/v1/fine_tuning/ |
일반 공급 |
/openai/v1/models |
일반 공급 |
/openai/v1/responses |
일반 공급 |
/openai/v1/vector_stores |
일반 공급 |
미리 보기 헤더
| API 경로 | Header |
|---|---|
/openai/v1/evals |
"aoai-evals":"preview" |
/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy |
"aoai-copy-ft-checkpoints" : "preview" |
v1 미리 보기 릴리스와 2025-04-01-preview 간의 변경 내용
- v1 미리 보기 API
- 비디오 생성 지원
-
새로운 응답 API 기능:
- MCP(원격 모델 컨텍스트 프로토콜) 서버 도구 통합
- 비동기 백그라운드 작업 지원
- 암호화된 추론 항목
- 이미지 생성
2025-04-01-preview와 2025-03-01-preview 간의 변경 내용
2025-03-01-preview와 2025-02-01-preview 간의 변경 내용
- 응답 API
- 컴퓨터 사용
2025-02-01-preview와 2025-01-01-preview 사이의 변경 내용
- 완료된 저장 항목(증류 API 지원).
2025-01-01-preview와 2024-12-01-preview 간의 변경 내용
-
예측 출력
prediction지원을 위해 매개 변수를 추가했습니다. -
gpt-4o-audio-preview모델 지원.
2024-12-01-미리 보기와 2024-10-01-미리 보기 간의 변경 내용
-
store및metadata저장된 완료 지원을 위해 추가된 매개 변수입니다. -
최신
reasoning_effort을 위해 을(를) 추가했습니다. -
user_security_context을 위해 을(를) 추가했습니다.
2024-09-01-미리 보기와 2024-08-01-미리 보기 간의 변경 내용
-
max_completion_tokens및o1-preview모델을 지원하기 위해o1-mini을(를) 추가했습니다.max_tokens는 o1 시리즈 모델에서 작동하지 않습니다. -
parallel_tool_calls이(가) 추가되었습니다. -
completion_tokens_details및reasoning_tokens을(를) 추가했습니다. -
stream_options및include_usage을(를) 추가했습니다.
2024-07-01-preview와 2024-08-01-preview API 사양 간의 변경 내용
- 구조적 출력 지원
- 대용량 파일 업로드 API가 추가되었습니다.
- 데이터 변경 내용:
- Mongo DB 통합.
-
role_information매개 변수가 제거되었습니다. -
rerank_score가 인용 개체에 추가되었습니다. - AML 데이터 원본이 제거되었습니다.
- AI 검색 벡터화 통합 개선.
2024-05-01-preview와 2024-07-01-preview API 사양 간의 변경 내용
- Batch API 지원 추가
- 벡터 저장소 청크 전략 매개 변수
-
max_num_results이(가) 파일 검색 도구에서 출력되어야 합니다.
2024-04-01-preview와 2024-05-01-preview API 사양 간의 변경 내용
- 도우미 v2 지원 - 파일 검색 도구 및 벡터 스토리지
- 검사점, 시드, 이벤트 미세 조정
- 데이터 업데이트 시
- DALL-E 2는 이제 모델 배포를 지원하며 최신 미리 보기 API와 함께 사용할 수 있습니다.
- 콘텐츠 필터링 업데이트
2024-03-01-preview와 2024-04-01-preview API 사양 간의 변경 내용
-
호환성이 손상되는 변경: 향상된 기능 매개 변수가 제거되었습니다. 이는
gpt-4버전:vision-preview모델에 영향을 줍니다. - timestamp_granularities 매개 변수가 추가되었습니다.
-
audioWord개체가 추가되었습니다. - 추가 TTS
response_formats: wav & pcm.
알려진 문제
- Azure OpenAI 사양은
2025-04-01-previewOpenAPI 3.1을 사용하며, 현재 Azure API Management에서 완전히 지원되지 않는 알려진 문제입니다.