Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Azure Content Understanding de Foundry Tools utiliza las implementaciones del modelo Foundry para todas las operaciones que requieren un modelo de IA generativa. Este enfoque le permite maximizar el uso de la capacidad aprovisionada y agregar capacidad en menos implementaciones si es necesario. También puede elegir el modelo que se adapte mejor a su escenario para el precio y la latencia.
Se le facturan todos los tokens (entrada y salida) procesados por la implementación conectada y Content Understanding solo le factura los medidores específicos de Content-Understanding. Consulte el explicador de precios para obtener más información sobre el modelo de facturación.
El servicio requiere un chat completion modelo y un embeddings modelo y admite varias opciones diferentes para cada uno.
Modelos compatibles
El servicio se actualiza periódicamente para agregar compatibilidad con más modelos. Los modelos admitidos actualmente se pueden encontrar en Límites de servicio: modelos generativos admitidos.
Establecimiento de implementaciones predeterminadas en el nivel de recurso
Puede definir implementaciones de modelos predeterminadas en el nivel de recurso mediante una PATCH solicitud. Al establecer los valores predeterminados, no es necesario pasar implementaciones de modelos en cada solicitud al analizador.
Paso 1: Establezca las implementaciones predeterminadas en el recurso.
PATCH /contentunderstanding/defaults
{
// Specify the default model deployments for each completion and embedding model you plan to use
"modelDeployments": {
// This dictionary is formatted as "model name": "deployment name"
"gpt-4.1": "gpt-4.1-deployment",
"gpt-4.1-mini": "gpt-4.1-mini",
"text-embedding-3-large": "text-embedding-3-large-deployment",
"text-embedding-ada-002": "text-embedding-ada-002"
}
}
Paso 2: Llame al analizador sin especificar implementaciones de modelos.
POST /myReceipt:analyze
{
// No modelDeployments needed - uses resource defaults
}
Cuando tenga los valores predeterminados definidos en el recurso, puede invalidarlos para una solicitud específica proporcionando modelDeployments en la llamada de análisis.
Definición de modelos para el analizador
Al crear un analizador personalizado, especifique qué modelos de finalización e inserción de chat debe usar el analizador. Esta configuración proporciona la flexibilidad de elegir un modelo que proporciona los mejores resultados a un costo más bajo. La definición del analizador asocia un nombre de modelo a la definición del analizador, pero no a una implementación de modelo específica.
{
"analyzerId": "myReceipt",
"models": {
// Specifies the completion and embedding models used by this analyzer.
"completion": "gpt-4.1",
"embedding": "text-embedding-ada-002"
},
"config": {
}
// Complete analyzer definition
}
Sugerencia
GPT-4.1 es un modelo recomendado para su uso con Foundry y Studio. Puede experimentar o usar cualquiera de los modelos de finalización de chat admitidos además de GPT-4.1. Los modelos de embeddings se utilizan cuando se emplean ejemplos etiquetados o aprendizaje en contexto para mejorar la precisión del analizador.
Prueba del analizador y revisión del uso
Al enviar una solicitud de análisis para el analizador, el objeto de respuesta contiene una usage propiedad . Esta propiedad incluye información sobre los tokens consumidos en tu implementación y otros usos de facturación en los que incurre el analizador. Puede validar estos datos frente a sus datos de uso en la implementación para correlacionar el uso de Content Understanding con la implementación del modelo.
{
"usage": {
"documentPagesMinimal": 3,
"documentPagesBasic": 2,
"documentPagesStandard": 1,
"audioHours": 0.234,
"videoHours": 0.123,
"contextualizationToken": 1000,
"tokens": {
"gpt-4.1-input": 1234, /*Completion model Input and output tokens consumed*/
"gpt-4.1-output": 2345,
"text-embedding-3-large": 3456 /*Embedding tokens consumed*/
}
}
}
Para más información sobre cómo funciona la facturación para Content Understanding, consulte el explicador de precios.