다음을 통해 공유


Foundry 모델 배포에 Content Understanding 분석기 연결

Foundry Tools의 Azure Content Understanding은 생성 AI 모델이 필요한 모든 작업에 대해 Foundry 모델 배포를 사용합니다. 이 방법을 사용하면 프로비전된 용량의 사용을 최대화하고 필요한 경우 더 적은 배포로 용량을 집계할 수 있습니다. 가격 및 대기 시간에 가장 적합한 모델을 선택할 수도 있습니다.

연결된 배포에서 처리된 모든 토큰(입력 및 출력)에 대한 요금이 청구되며 Content Understanding은 Content-Understanding 관련 미터에 대해서만 요금을 청구합니다. 청구 모델에 대한 자세한 내용은 가격 책정 설명자를 참조하세요.

서비스에는 chat completion 모델과 embeddings 모델이 필요하며, 각 모델에 대해 몇 가지 다른 옵션을 지원합니다.

지원되는 모델

서비스는 정기적으로 업데이트되어 더 많은 모델에 대한 지원을 추가합니다. 현재 지원되는 모델은 서비스 제한 - 지원되는 생성 모델에서 찾을 수 있습니다.

리소스 수준에서 기본 배포 설정

요청을 사용하여 리소스 수준에서 기본 모델 배포를 정의할 수 있습니다 PATCH . 기본값을 설정하는 경우 모든 분석기 요청과 함께 모델 배포를 전달할 필요가 없습니다.

1단계: 리소스에 대한 기본 배포를 설정합니다.

PATCH /contentunderstanding/defaults
{
  // Specify the default model deployments for each completion and embedding model you plan to use
  "modelDeployments": {
    // This dictionary is formatted as "model name": "deployment name"
    "gpt-4.1": "gpt-4.1-deployment",
    "gpt-4.1-mini": "gpt-4.1-mini",
    "text-embedding-3-large": "text-embedding-3-large-deployment",
    "text-embedding-ada-002": "text-embedding-ada-002"
  }
}

2단계: 모델 배포를 지정하지 않고 분석기를 호출합니다.

POST /myReceipt:analyze
{
  // No modelDeployments needed - uses resource defaults
}

리소스에 기본값이 정의되어 있는 경우에도 분석 호출을 제공하여 modelDeployments 특정 요청에 대해 재정의할 수 있습니다.

분석기용 모델 정의

사용자 지정 분석기를 만들 때 분석기에서 사용해야 하는 채팅 완료 및 포함 모델을 지정합니다. 이 구성은 가장 낮은 비용으로 최상의 결과를 제공하는 모델을 선택할 수 있는 유연성을 제공합니다. 분석기 정의는 모델 이름을 분석기 정의와 연결하지만 특정 모델 배포는 연결하지 않습니다.

{
  "analyzerId": "myReceipt",
  "models": {
    // Specifies the completion and embedding models used by this analyzer. 
    "completion": "gpt-4.1",
    "embedding": "text-embedding-ada-002"
  },
  "config": {
    
  }
  // Complete analyzer definition
}

팁 (조언)

GPT-4.1은 Foundry 및 Studio에서 사용하는 데 권장되는 모델입니다. GPT-4.1 외에도 지원되는 채팅 완성 모델을 실험하거나 사용할 수 있습니다. embeddings 모델은 레이블이 지정된 샘플이나 문맥적 학습을 활용하여 분석기의 품질을 향상시킬 때 사용됩니다.

분석기 테스트 및 사용량 검토

분석기에서 분석 요청을 제출하면 응답 개체에 속성이 usage 포함됩니다. 이 속성에는 배포에 사용된 토큰 및 분석기에서 발생하는 기타 청구 사용에 대한 정보가 포함됩니다. 배포 시 사용량 데이터를 바탕으로 이 데이터를 검증하여 Content Understanding의 사용량과 모델 배포 간의 상관 관계를 확인할 수 있습니다.

{
  "usage": {
    "documentPagesMinimal": 3, 
    "documentPagesBasic": 2, 
    "documentPagesStandard": 1, 
    "audioHours": 0.234,
    "videoHours": 0.123,
    "contextualizationToken": 1000,
    "tokens": {
      "gpt-4.1-input": 1234, /*Completion model Input and output tokens consumed*/
      "gpt-4.1-output": 2345,
      "text-embedding-3-large": 3456 /*Embedding tokens consumed*/
    }
  }
}

Content Understanding에 대한 청구 작동 방식에 대한 자세한 내용은 가격 책정 설명자를 참조하세요.