Microsoft Foundry 모델 API 수명 주기 내의 Azure OpenAI

이 문서는 Azure OpenAI API에 대한 지원 수명 주기를 이해하는 데 도움이 됩니다.

비고

언제든지 새 API 응답 개체를 API 응답에 추가할 수 있습니다. 필요한 응답 개체만 구문 분석하는 것이 좋습니다.

API 진화

이전에 Azure OpenAI는 새 API 버전의 월별 업데이트를 받았습니다. 새로운 기능을 활용하려면 새로운 API 릴리스마다 코드 및 환경 변수를 지속적으로 업데이트해야 했습니다. 또한 Azure OpenAI는 OpenAI와 Azure OpenAI 간에 코드를 마이그레이션할 때 오버헤드를 발생시킨 Azure 특정 클라이언트를 사용하는 추가 단계가 필요했습니다.

2025년 8월부터 다음을 지원하는 차세대 v1 Azure OpenAI API를 옵트인할 수 있습니다.

매월 새 api-version기능을 지정할 필요 없이 최신 기능에 지속적으로 액세스합니다.
새 기능이 더 자주 출시되어 API 릴리스 주기가 더 빨라집니다.
키 기반 인증을 사용할 때 OpenAI와 Azure OpenAI 간에 교환하기 위한 최소한의 코드 변경으로 OpenAI 클라이언트를 지원합니다.
토큰 기반 인증 및 자동 토큰 새로 고침에 대한 OpenAI 클라이언트 지원은 별도의 Azure OpenAI 클라이언트에 종속되지 않아도 됩니다.
v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델을 사용하여 채팅 완료를 호출합니다.

아직 미리 보기 상태인 새 API 호출에 대한 액세스는 API 버전을 교환하지 않고도 원하는 기능을 옵트인할 수 있도록 기능별 미리 보기 헤더를 전달하여 제어됩니다. 또는 일부 기능은 API 경로를 통해 미리 보기 상태를 나타내며 추가 헤더가 필요하지 않습니다.

예제:

/openai/v1/evals는 미리 보기 상태이며 "aoai-evals":"preview" 헤더를 전달해야 합니다.
/openai/v1/fine_tuning/alpha/graders/는 미리 보기 상태이며 API 경로에 alpha가 있기 때문에 사용자 지정 헤더가 필요하지 않습니다.

초기 v1 GA(일반 공급) API 출시에서는 유추 및 작성 API 기능의 하위 집합만 지원합니다. 모든 GA 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다. 곧 더 많은 기능에 대한 지원을 빠르게 추가할 예정입니다.

코드 변경

v1 API

Python v1 예제

API 키:

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),
    base_url="https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"
)

response = client.responses.create(   
  model="gpt-4.1-nano", # Replace with your model deployment name 
  input="This is a test.",
)

print(response.model_dump_json(indent=2))

OpenAI() 클라이언트가 대신 사용됩니다 AzureOpenAI().
base_url 는 Azure OpenAI 엔드포인트를 전달하고 /openai/v1 엔드포인트 주소에 추가됩니다.
api-version은 더 이상 v1 GA API를 사용하는 필수 매개 변수가 아닙니다.

환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY

client = OpenAI()

Microsoft Entra ID:

중요합니다

자동 토큰 새로 고침 처리는 이전에 AzureOpenAI() 클라이언트를 사용하여 처리되었습니다. v1 API는 OpenAI() 클라이언트에 자동 토큰 새로 고침 지원을 추가하여 이 종속성을 제거합니다.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key = token_provider  
)

response = client.responses.create(
    model="gpt-4.1-nano",
    input= "This is a test" 
)

print(response.model_dump_json(indent=2))

base_url 는 Azure OpenAI 엔드포인트를 전달하고 /openai/v1 엔드포인트 주소에 추가됩니다.
api_key 매개 변수가 token_provider로 설정되어, 정적 API 키를 사용하는 대신 인증 토큰의 자동 검색 및 새로 고침이 활성화됩니다.

v1 API

C# v1 예제

API 키:

OpenAIClient client = new(
    new ApiKeyCredential("{your-api-key}"),
    new OpenAIClientOptions()
    {
        Endpoint = new("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    })

Microsoft Entra ID:

#pragma warning disable OPENAI001

BearerTokenPolicy tokenPolicy = new(
    new DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default");
OpenAIClient client = new(
    authenticationPolicy: tokenPolicy,
    options: new OpenAIClientOptions()
    {
        Endpoint = new("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    })

v1 API

JavaScript v1 예제

API 키:

const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: "{your-api-key}" 
});

환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY

const client = new OpenAI();

Microsoft Entra ID:

const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://cognitiveservices.azure.com/.default');
const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: tokenProvider
});

v1 API

Go v1 예제

API 키:

client := openai.NewClient(
    option.WithBaseURL("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    option.WithAPIKey("{your-api-key}")
)

환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY

client := openai.NewClient()

Microsoft Entra ID:

tokenCredential, err := azidentity.NewDefaultAzureCredential(nil)

client := openai.NewClient(
    option.WithBaseURL("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/"),
    azure.WithTokenCredential(tokenCredential)
)

Java v1 예제

v1 API

API 키:


OpenAIClient client = OpenAIOkHttpClient.builder()
                .baseUrl("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/")
                .apiKey(apiKey)
                .build();

환경 변수가 설정된 API 키: OPENAI_BASE_URLOPENAI_API_KEY

OpenAIClient client = OpenAIOkHttpClient.builder()
                .fromEnv()
                .build();

Microsoft Entra ID:

Credential tokenCredential = BearerTokenCredential.create(
        AuthenticationUtil.getBearerTokenSupplier(
                new DefaultAzureCredentialBuilder().build(),
                "https://cognitiveservices.azure.com/.default"));
OpenAIClient client = OpenAIOkHttpClient.builder()
        .baseUrl("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/")
        .credential(tokenCredential)
        .build();

v1 API

API 키:

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "api-key: $AZURE_OPENAI_API_KEY" \
  -d '{
     "model": "gpt-4.1-nano",
     "input": "This is a test"
    }'

Microsoft Entra ID:

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_OPENAI_AUTH_TOKEN" \
  -d '{
     "model": "gpt-4o",
     "input": "This is a test"
    }'

모델 지원

Azure OpenAI 모델의 경우 응답 API를 사용하는 것이 좋습니다. 그러나 v1 API를 사용하면 OpenAI v1 채팅 완료 구문을 지원하는 DeepSeek 및 Grok와 같은 다른 공급자의 모델과 채팅 완료 호출을 수행할 수도 있습니다.

base_url는 https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/ 형식과 https://YOUR-RESOURCE-NAME.services.ai.azure.com/openai/v1/ 형식을 모두 허용합니다.

비고

응답 API는 Microsoft AI, DeepSeek 및 Grok 모델과 같이 Azure에서 직접 판매하는 Foundry 모델에서도 작동합니다. 이러한 모델에서 응답 API를 사용하는 방법을 알아보려면 Microsoft Foundry 모델을 사용하여 텍스트 응답을 생성하는 방법을 참조하세요.

from openai import OpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = OpenAI(  
  base_url = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",  
  api_key=token_provider,
)
completion = client.chat.completions.create(
  model="MAI-DS-R1", # Replace with your model deployment name.
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Tell me about the attention is all you need paper"}
  ]
)

#print(completion.choices[0].message)
print(completion.model_dump_json(indent=2))

using Azure.Identity;
using OpenAI;
using OpenAI.Chat;
using System.ClientModel.Primitives;

#pragma warning disable OPENAI001

BearerTokenPolicy tokenPolicy = new(
    new DefaultAzureCredential(),
    "https://cognitiveservices.azure.com/.default");

ChatClient client = new(
    model: "MAI-DS-R1", // Replace with your model deployment name.
    authenticationPolicy: tokenPolicy,
    options: new OpenAIClientOptions() { 
    
        Endpoint = new Uri("https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1")
   }
);

ChatCompletion completion = client.CompleteChat("Tell me about the attention is all you need paper");

Console.WriteLine($"[ASSISTANT]: {completion.Content[0].Text}");

import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
import { OpenAI } from "openai";

const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://cognitiveservices.azure.com/.default');
const client = new OpenAI({
    baseURL: "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/",
    apiKey: tokenProvider
});

const messages = [
    { role: 'system', content: 'You are a helpful assistant.' },
    { role: 'user', content: 'Tell me about the attention is all you need paper' }
];

// Make the API request with top-level await
const result = await client.chat.completions.create({ 
    messages, 
    model: 'MAI-DS-R1', // model deployment name
    max_tokens: 100 
});

// Print the full response
console.log('Full response:', result);

// Print just the message content from the response
console.log('Response content:', result.choices[0].message.content);


package main

import (
	"context"
	"fmt"
	"log"

	"github.com/Azure/azure-sdk-for-go/sdk/azidentity"
	"github.com/openai/openai-go/v3"
	"github.com/openai/openai-go/v3/azure"
	"github.com/openai/openai-go/v3/option"
)

func main() {
	// Create an Azure credential
	tokenCredential, err := azidentity.NewDefaultAzureCredential(nil)
	if err != nil {
		log.Fatalf("Failed to create credential: %s", err)
	}

	// Create a client with Azure OpenAI endpoint and token credential
	client := openai.NewClient(
		option.WithBaseURL("https://YOUR-RESOURCE_NAME.openai.azure.com/openai/v1/"),
		azure.WithTokenCredential(tokenCredential),
	)

	// Make a completion request
	chatCompletion, err := client.Chat.Completions.New(context.TODO(), openai.ChatCompletionNewParams{
		Messages: []openai.ChatCompletionMessageParamUnion{
			openai.UserMessage("Explain what the bitter lesson is?"),
		},
		Model: "MAI-DS-R1", // Use your deployed model name on Azure
	})
	if err != nil {
		log.Fatalf("Failed to get chat completions: %s", err)
	}

	fmt.Println(chatCompletion.Choices[0].Message.Content)
}

package com.example;

import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.openai.models.ChatModel;
import com.openai.models.chat.completions.ChatCompletion;
import com.openai.models.chat.completions.ChatCompletionCreateParams;

public class OpenAITest {
    public static void main(String[] args) {
        // Get API key from environment variable for security
        String apiKey = System.getenv("OPENAI_API_KEY");
        String resourceName = "https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1";
        String modelDeploymentName = "MAI-DS-R1"; //replace with you model deployment name

        try {
            OpenAIClient client = OpenAIOkHttpClient.builder()
                    .baseUrl(resourceName)
                    .apiKey(apiKey)
                    .build();

           ChatCompletionCreateParams params = ChatCompletionCreateParams.builder()
              .addUserMessage("Explain what the bitter lesson is?")
              .model(modelDeploymentName)
              .build();
           ChatCompletion chatCompletion = client.chat().completions().create(params);
        }
    }
}

curl -X POST https://YOUR-RESOURCE-NAME.openai.azure.com/openai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_OPENAI_AUTH_TOKEN" \
  -d '{
      "model": "MAI-DS-R1",
      "messages": [
      {
        "role": "developer",
        "content": "You are a helpful assistant."
      },
      {
        "role": "user",
        "content": "Explain what the bitter lesson is?"
      }
    ]
  }'

v1 API 지원

v1 OpenAPI 3.0 사양

상태

일반적으로 사용 가능한 기능은 프로덕션 환경에서 사용할 수 있도록 지원됩니다.

API 경로	상태
`/openai/v1/chat/completions`	일반 공급
`/openai/v1/embeddings`	일반 공급
`/openai/v1/evals`	Preview
`/openai/v1/files`	일반 공급
`/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy`	Preview
`/openai/v1/fine_tuning/alpha/graders/`	Preview
`/openai/v1/fine_tuning/`	일반 공급
`/openai/v1/models`	일반 공급
`/openai/v1/responses`	일반 공급
`/openai/v1/vector_stores`	일반 공급

미리 보기 헤더

API 경로	Header
`/openai/v1/evals`	`"aoai-evals":"preview"`
`/openai/v1/fine_tuning/jobs/{fine_tuning_job_id}/checkpoints/{fine_tuning_checkpoint_id}/copy`	`"aoai-copy-ft-checkpoints" : "preview"`

v1 미리 보기 릴리스와 2025-04-01-preview 간의 변경 내용

v1 미리 보기 API
비디오 생성 지원
새로운 응답 API 기능:
- MCP(원격 모델 컨텍스트 프로토콜) 서버 도구 통합
- 비동기 백그라운드 작업 지원
- 암호화된 추론 항목
- 이미지 생성

2025-04-01-preview와 2025-03-01-preview 간의 변경 내용

2025-03-01-preview와 2025-02-01-preview 간의 변경 내용

응답 API
컴퓨터 사용

2025-02-01-preview와 2025-01-01-preview 사이의 변경 내용

완료된 저장 항목(증류 API 지원).

2025-01-01-preview와 2024-12-01-preview 간의 변경 내용

예측 출력prediction 지원을 위해 매개 변수를 추가했습니다.
gpt-4o-audio-preview 모델 지원.

2024-12-01-미리 보기와 2024-10-01-미리 보기 간의 변경 내용

store및 metadata 저장된 완료 지원을 위해 추가된 매개 변수입니다.
최신 reasoning_effort을 위해 을(를) 추가했습니다.
user_security_context을 위해 을(를) 추가했습니다.

2024-09-01-미리 보기와 2024-08-01-미리 보기 간의 변경 내용

max_completion_tokens 및 o1-preview 모델을 지원하기 위해 o1-mini을(를) 추가했습니다. max_tokens는 o1 시리즈 모델에서 작동하지 않습니다.
parallel_tool_calls이(가) 추가되었습니다.
completion_tokens_details 및 reasoning_tokens을(를) 추가했습니다.
stream_options 및 include_usage을(를) 추가했습니다.

2024-07-01-preview와 2024-08-01-preview API 사양 간의 변경 내용

구조적 출력 지원
대용량 파일 업로드 API가 추가되었습니다.
데이터 변경 내용:
- Mongo DB 통합.
- role_information 매개 변수가 제거되었습니다.
- rerank_score가 인용 개체에 추가되었습니다.
- AML 데이터 원본이 제거되었습니다.
- AI 검색 벡터화 통합 개선.

2024-05-01-preview와 2024-07-01-preview API 사양 간의 변경 내용

Batch API 지원 추가
벡터 저장소 청크 전략 매개 변수
max_num_results이(가) 파일 검색 도구에서 출력되어야 합니다.

2024-04-01-preview와 2024-05-01-preview API 사양 간의 변경 내용

도우미 v2 지원 - 파일 검색 도구 및 벡터 스토리지
검사점, 시드, 이벤트 미세 조정
데이터 업데이트 시
DALL-E 2는 이제 모델 배포를 지원하며 최신 미리 보기 API와 함께 사용할 수 있습니다.
콘텐츠 필터링 업데이트

2024-03-01-preview와 2024-04-01-preview API 사양 간의 변경 내용

호환성이 손상되는 변경: 향상된 기능 매개 변수가 제거되었습니다. 이는 gpt-4버전:vision-preview 모델에 영향을 줍니다.
timestamp_granularities 매개 변수가 추가되었습니다.
audioWord 개체가 추가되었습니다.
추가 TTS response_formats: wav & pcm.

알려진 문제

Azure OpenAI 사양은 2025-04-01-preview OpenAPI 3.1을 사용하며, 현재 Azure API Management에서 완전히 지원되지 않는 알려진 문제입니다.

다음 단계

피드백

이 페이지가 도움이 되었나요?

Last updated on 2025-12-07

다음을 통해 공유

Microsoft Foundry 모델 API 수명 주기 내의 Azure OpenAI

API 진화

코드 변경

v1 API

모델 지원

v1 API 지원

상태

미리 보기 헤더

v1 미리 보기 릴리스와 2025-04-01-preview 간의 변경 내용

2025-04-01-preview와 2025-03-01-preview 간의 변경 내용

2025-03-01-preview와 2025-02-01-preview 간의 변경 내용

2025-02-01-preview와 2025-01-01-preview 사이의 변경 내용

2025-01-01-preview와 2024-12-01-preview 간의 변경 내용

2024-12-01-미리 보기와 2024-10-01-미리 보기 간의 변경 내용

2024-09-01-미리 보기와 2024-08-01-미리 보기 간의 변경 내용

2024-07-01-preview와 2024-08-01-preview API 사양 간의 변경 내용

2024-05-01-preview와 2024-07-01-preview API 사양 간의 변경 내용

2024-04-01-preview와 2024-05-01-preview API 사양 간의 변경 내용

2024-03-01-preview와 2024-04-01-preview API 사양 간의 변경 내용

알려진 문제

다음 단계

피드백

추가 리소스