Foundry Tools의 Azure Content Understanding은 생성 AI 모델이 필요한 모든 작업에 대해 Foundry 모델 배포를 사용합니다. 이 방법을 사용하면 프로비전된 용량의 사용을 최대화하고 필요한 경우 더 적은 배포로 용량을 집계할 수 있습니다. 가격 및 대기 시간에 가장 적합한 모델을 선택할 수도 있습니다.
연결된 배포에서 처리된 모든 토큰(입력 및 출력)에 대한 요금이 청구되며 Content Understanding은 Content-Understanding 관련 미터에 대해서만 요금을 청구합니다. 청구 모델에 대한 자세한 내용은 가격 책정 설명자를 참조하세요.
서비스에는 chat completion 모델과 embeddings 모델이 필요하며, 각 모델에 대해 몇 가지 다른 옵션을 지원합니다.
지원되는 모델
서비스는 정기적으로 업데이트되어 더 많은 모델에 대한 지원을 추가합니다. 현재 지원되는 모델은 서비스 제한 - 지원되는 생성 모델에서 찾을 수 있습니다.
리소스 수준에서 기본 배포 설정
요청을 사용하여 리소스 수준에서 기본 모델 배포를 정의할 수 있습니다 PATCH . 기본값을 설정하는 경우 모든 분석기 요청과 함께 모델 배포를 전달할 필요가 없습니다.
1단계: 리소스에 대한 기본 배포를 설정합니다.
PATCH /contentunderstanding/defaults
{
// Specify the default model deployments for each completion and embedding model you plan to use
"modelDeployments": {
// This dictionary is formatted as "model name": "deployment name"
"gpt-4.1": "gpt-4.1-deployment",
"gpt-4.1-mini": "gpt-4.1-mini",
"text-embedding-3-large": "text-embedding-3-large-deployment",
"text-embedding-ada-002": "text-embedding-ada-002"
}
}
2단계: 모델 배포를 지정하지 않고 분석기를 호출합니다.
POST /myReceipt:analyze
{
// No modelDeployments needed - uses resource defaults
}
리소스에 기본값이 정의되어 있는 경우에도 분석 호출을 제공하여 modelDeployments 특정 요청에 대해 재정의할 수 있습니다.
분석기용 모델 정의
사용자 지정 분석기를 만들 때 분석기에서 사용해야 하는 채팅 완료 및 포함 모델을 지정합니다. 이 구성은 가장 낮은 비용으로 최상의 결과를 제공하는 모델을 선택할 수 있는 유연성을 제공합니다. 분석기 정의는 모델 이름을 분석기 정의와 연결하지만 특정 모델 배포는 연결하지 않습니다.
{
"analyzerId": "myReceipt",
"models": {
// Specifies the completion and embedding models used by this analyzer.
"completion": "gpt-4.1",
"embedding": "text-embedding-ada-002"
},
"config": {
}
// Complete analyzer definition
}
팁 (조언)
GPT-4.1은 Foundry 및 Studio에서 사용하는 데 권장되는 모델입니다. GPT-4.1 외에도 지원되는 채팅 완성 모델을 실험하거나 사용할 수 있습니다. embeddings 모델은 레이블이 지정된 샘플이나 문맥적 학습을 활용하여 분석기의 품질을 향상시킬 때 사용됩니다.
분석기 테스트 및 사용량 검토
분석기에서 분석 요청을 제출하면 응답 개체에 속성이 usage 포함됩니다. 이 속성에는 배포에 사용된 토큰 및 분석기에서 발생하는 기타 청구 사용에 대한 정보가 포함됩니다. 배포 시 사용량 데이터를 바탕으로 이 데이터를 검증하여 Content Understanding의 사용량과 모델 배포 간의 상관 관계를 확인할 수 있습니다.
{
"usage": {
"documentPagesMinimal": 3,
"documentPagesBasic": 2,
"documentPagesStandard": 1,
"audioHours": 0.234,
"videoHours": 0.123,
"contextualizationToken": 1000,
"tokens": {
"gpt-4.1-input": 1234, /*Completion model Input and output tokens consumed*/
"gpt-4.1-output": 2345,
"text-embedding-3-large": 3456 /*Embedding tokens consumed*/
}
}
}
Content Understanding에 대한 청구 작동 방식에 대한 자세한 내용은 가격 책정 설명자를 참조하세요.