Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Un analizador de Azure Content Understanding en Foundry Tools es una unidad de procesamiento configurable que define cómo se debe analizar el contenido y qué información se debe extraer. Piense en un analizador como una receta que indique al servicio:
- Tipo de contenido que se va a procesar (documentos, imágenes, audio o vídeo)
- Elementos que se van a extraer (texto, diseño, tablas, campos, transcripciones)
- Estructurar la salida (Markdown, campos JSON, segmentos)
- Qué modelos de inteligencia artificial se van a usar para el procesamiento
Los analizadores son los componentes fundamentales del Entendimiento de Contenido. Combinan la extracción de contenido, el análisis con tecnología de inteligencia artificial y la salida de datos estructurados en una única configuración reutilizable. Puede usar analizadores creados previamente para escenarios comunes o crear analizadores personalizados adaptados a sus necesidades específicas.
Tipos de analizador
Content Understanding proporciona varios tipos de analizadores:
-
Analizadores base: analizadores fundamentales que proporcionan funcionalidades de procesamiento principales para cada tipo de contenido (
prebuilt-document,prebuilt-audio,prebuilt-video,prebuilt-image). Estos analizadores se suelen usar como bloques de creación para analizadores personalizados. -
Analizadores rag: optimizados para escenarios de generación aumentada por recuperación, extrayendo contenido con comprensión semántica para aplicaciones de búsqueda e inteligencia artificial (por ejemplo
prebuilt-documentSearch, ,prebuilt-videoSearch). -
Analizadores específicos del dominio: preconfigurado para determinados tipos de documentos y sectores, como facturas, recibos, documentos de identificador y contratos (por ejemplo
prebuilt-invoice, ,prebuilt-receipt,prebuilt-idDocument). - Analizadores personalizados: los analizadores que se crean mediante la extensión de analizadores base con esquemas de campo personalizados y configuraciones para satisfacer sus requisitos específicos.
Para obtener más información y una lista completa de analizadores específicos del dominio disponibles, consulte Analizadores creados previamente.
Estructura de configuración del analizador
Una configuración del analizador se define mediante un objeto JSON que contiene varias propiedades de nivel superior. Puede configurar los siguientes componentes:
-
Propiedades del analizador : identidad principal y metadatos
- analyzerId : identificador único
- name : nombre para mostrar
- description : descripción de propósito
- baseAnalyzerId : referencia del analizador primario
-
Configuración del modelo : configuración del modelo de IA
- modelos : modelos predeterminados
-
Configuración de procesamiento : opciones de procesamiento de contenido
- config : configuración de comportamiento
-
Esquema de campo : extracción de datos estructurados
- fieldSchema : definiciones de campo
Este es un ejemplo condensado que muestra la estructura general de una configuración del analizador:
{
"analyzerId": "my-custom-invoice-analyzer",
"description": "Extracts vendor information, line items, and totals from commercial invoices",
"baseAnalyzerId": "prebuilt-document",
"config": {
...
"enableOcr": true
...
},
"fieldSchema": {...}
}
},
"models": {
"completion": "gpt-4.1",
"embedding": "text-embedding-3-large"
}
}
Propiedades del analizador
Estas propiedades identifican y describen de forma única el analizador:
analyzerId
- Descripción: Identificador único del analizador. Este identificador es cómo se hace referencia al analizador en las llamadas API.
-
Ejemplo:
"prebuilt-invoice","my-custom-analyzer" -
Directrices:
- Usar nombres descriptivos que indiquen el propósito del analizador
- En el caso de los analizadores personalizados, elija nombres que no entren en conflicto con los nombres de analizador precompilados.
- Uso de minúsculas con guiones para la coherencia
name
- Descripción: Nombre legible que se muestra en las interfaces de usuario y en la documentación.
-
Ejemplo:
"Invoice document understanding","Custom receipt processor"
description
- Descripción: Breve explicación de lo que hace el analizador y qué contenido procesa. El modelo de IA usa esta descripción como contexto durante la extracción de campos, por lo que las descripciones claras mejoran la precisión de la extracción.
-
Ejemplo:
"Analyzes invoice documents to extract line items, totals, vendor information, and payment terms" -
Directrices:
- Ser específico sobre lo que extrae el analizador
- Mencionar los tipos de contenido que admite
- Mantenerla concisa pero informativa
- Escribe descripciones claras, ya que guían la comprensión del modelo de inteligencia artificial.
baseAnalyzerId
- Descripción: Hace referencia a un analizador primario desde el que este analizador hereda la configuración.
-
Analizadores básicos admitidos:
-
"prebuilt-document": para analizadores personalizados basados en documentos -
"prebuilt-audio": para analizadores personalizados basados en audio -
"prebuilt-video": para analizadores personalizados basados en vídeo -
"prebuilt-image": para analizadores personalizados basados en imágenes
-
-
Ejemplo:
"baseAnalyzerId": "prebuilt-document"
Nota:
Al especificar un analizador base, el analizador personalizado hereda todas las configuraciones predeterminadas y puede invalidar configuraciones específicas.
Configuración del modelo
models
-
Descripción: Especifica los nombres de modelo de Foundry que se usarán al procesar con este analizador. Estos son los nombres de modelo (no los nombres de implementación) que usa el servicio. Deben coincidir con uno de los
supportedModelsdel analizador de base. La lista completa de modelos admitidos por Content Understanding es la lista de modelos admitidos. -
Propiedades:
-
completion- Nombre del modelo para tareas de finalización (extracción de campos, segmentación, análisis de figura, etc.) -
embedding- Nombre del modelo para insertar tareas (mediante una base de conocimiento)
-
- Importante: Estos son los nombres de modelo del catálogo Foundry, no los nombres de implementación. En tiempo de ejecución, el servicio asigna estos nombres de modelo a las implementaciones de modelos reales que configure en el nivel de recurso.
-
Example:
{ "completion": "gpt-4o", "embedding": "text-embedding-3-large" }
Consulte Conectar su recurso de Content Understanding con modelos Foundry para más detalles sobre cómo configurar modelos conectados.
Configuración de procesamiento
El config objeto contiene todas las opciones de procesamiento que controlan cómo se analiza el contenido. Estas opciones se dividen en categorías basadas en la funcionalidad:
Propiedades del objeto config
Opciones generales
returnDetails
- Valor predeterminado: false (varía según el analizador)
- Descripción: Controla si se debe incluir información detallada en la respuesta (puntuaciones de confianza, cuadros de límite, intervalos de texto, metadatos)
-
Cuándo usar:
- Establézcalo en
trueal depurar problemas de extracción - Cuando necesite información de ubicación para los datos extraídos
- Cuando se requieren puntuaciones de confianza para la validación
- Para garantizar la calidad y las pruebas
- Establézcalo en
- Impacto en la respuesta: Aumenta significativamente el tamaño de respuesta con más metadatos
Opciones de extracción de contenido de documentos
enableOcr
- Valor predeterminado: true
- Descripción: Habilita el reconocimiento óptico de caracteres para extraer texto de imágenes y documentos escaneados
-
Cuándo usar:
- Habilitar para documentos escaneados, fotos e archivos PDF basados en imágenes
- Deshabilitación de archivos PDF digitales nativos para mejorar el rendimiento
- Compatible con: Analizadores de documentos
enableLayout
- Valor predeterminado: true
- Descripción: Extrae información de diseño, incluidos párrafos, líneas, palabras, orden de lectura y elementos estructurales.
-
Cuándo usar:
- Necesario para comprender la estructura y la jerarquía del documento
- Necesario para la extracción precisa de párrafos y secciones
- Deshabilitar si solo se necesita la extracción de texto sin formato
- Compatible con: Analizadores basados en documentos
enableFormula
- Valor predeterminado: true
- Descripción: Detecta y extrae fórmulas matemáticas y ecuaciones en formato LaTeX
-
Cuándo usar:
- Habilitación de documentos científicos, documentos de investigación, documentación técnica
- Desactivar en los documentos empresariales generales para mejorar el rendimiento
- Compatible con: Analizadores basados en documentos
enableBarcode
- Valor predeterminado: true
- Descripción: Detecta y extrae códigos de barras y códigos QR, devolviendo los valores descodificados.
-
Cuándo usar:
- Habilitar para documentos de inventario, etiquetas de envío, documentación del producto
- Deshabilitar cuando los códigos de barras no están presentes para mejorar el rendimiento
- Compatible con: Analizadores basados en documentos
- Tipos de códigos de barras admitidos: Código QR, PDF417, UPC-A, UPC-E, Código 39, Código 128, EAN-8, EAN-13, DataBar, Código 93, Codabar, ITF, Código QR Micro, Aztec, Data Matrix, MaxiCode
Opciones de tabla y gráfico
tableFormat
-
Predeterminado:
"html" -
Valores admitidos:
"html","markdown" - Descripción: Especifica el formato de salida de las tablas extraídas.
-
Cuándo usar:
- Se usa
"html"para la representación web o cuando las estructuras de tabla complejas necesitan conservación - Uso
"markdown"para tablas sencillas en documentación o procesamiento basado en texto
- Se usa
- Compatible con: Analizadores basados en documentos
chartFormat
-
Predeterminado:
"chartjs" -
Valores admitidos:
"chartjs" - Descripción: Especifica el formato para los datos de gráficos y gráficas extraídas, compatibles con la biblioteca Chart.js
-
Cuándo usar:
- Al extraer datos de gráficos de barras, gráficos de líneas, gráficos circulares
- Conversión de gráficos visuales en datos estructurados para volver a representar
- Compatible con: Analizadores basados en documentos
Opciones de análisis de figuras e imágenes
enableFigureDescription
- Valor predeterminado: false
- Descripción: Genera descripciones de texto de lenguaje natural para ilustraciones, diagramas, imágenes e ilustraciones
-
Cuándo usar:
- Para los requisitos de accesibilidad (generación de texto alternativo)
- Comprensión de diagramas y flujogramas
- Extracción de información de infografías
- Compatible con: Analizadores basados en documentos
enableFigureAnalysis
- Valor predeterminado: false
- Descripción: Realiza un análisis más profundo de ilustraciones, incluida la extracción de datos del gráfico y la identificación de componentes de diagrama.
-
Cuándo usar:
- Extracción de datos estructurados de gráficos insertados en documentos
- Descripción de diagramas complejos
- Clasificación detallada de la ilustración
- Compatible con: Analizadores basados en documentos
Opciones de anotación
annotationFormat
-
Predeterminado:
"markdown" -
Valores admitidos:
"markdown" - Descripción: Especifica el formato de las anotaciones devueltas.
- Compatible con: Analizadores basados en documentos
Opciones de extracción de campos
estimateFieldSourceAndConfidence
- Valor predeterminado: false (varía según el analizador)
- Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para cada valor de campo extraído.
-
Cuándo usar:
- Flujos de trabajo de validación y control de calidad
- Comprender la precisión de la extracción
- Problemas de depuración de extracción
- Resaltado del texto de origen en las interfaces de usuario
- Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)
Opciones de audio y vídeo
locales
-
Predeterminado:
[](matriz vacía) - Descripción: Lista de códigos de idioma o configuración regional para el procesamiento específico del idioma (principalmente para la transcripción)
-
Valores admitidos: Códigos de idioma BCP-47 (por ejemplo,
["en-US", "es-ES", "fr-FR", "de-DE"]) -
Cuándo usar:
- Transcripción de audio en varios idiomas
- Especificación del idioma esperado para mejorar la precisión
- Procesamiento de contenido en variantes regionales específicas
-
Compatible con:
prebuilt-audio, ,prebuilt-videoprebuilt-callCenter
Nota:
Para obtener una lista completa de los idiomas y configuraciones regionales admitidos, consulte Compatibilidad con idiomas y regiones.
disableFaceBlurring
- Valor predeterminado: false
- Descripción: Controla si las caras de imágenes y vídeos deben desenfocarse para la protección de la privacidad
-
Cuándo usar:
- Establézcalo en
truecuando se requiera visibilidad de caras para el análisis - Establézcalo en
falsecuando se desee la desidentificación de personas en contenido compartido.
- Establézcalo en
-
Compatible con:
prebuilt-image,prebuilt-video
Importante
La funcionalidad de capacidades de reconocimiento facial en Comprensión de Contenidos es un servicio de acceso limitado, y se requiere registro para acceder. La característica de agrupación y identificación faciales de Content Understanding se limita en función de los criterios de idoneidad y uso. El servicio Face solo está disponible para clientes y asociados administrados por Microsoft. Use el formulario de admisión de reconocimiento facial para solicitar acceso. Para obtener más información, consulte Las inversiones y medidas de seguridad de inteligencia artificial responsable para el reconocimiento facial.
Opciones de clasificación
contentCategories
- Predeterminado: No establecido
-
Descripción: Define categorías o tipos de contenido para la clasificación automática y el enrutamiento a controladores especializados. Cuando se usa con
enableSegment set to false, actualmente solo se soporta para documentos. Clasifica todo el archivo. Cuando se usa conenableSegment=true, el archivo se divide en fragmentos basados en estas categorías, con cada segmento clasificado y, opcionalmente, procesado por un analizador específico de categorías. Siempre selecciona una sola opción en la lista de categorías disponibles. -
Estructura: Cada categoría contiene:
-
description- (Obligatorio) Descripción detallada del tipo de categoría o documento. Esta descripción actúa como una solicitud que guía el modelo de IA para determinar los límites de segmento y la clasificación. Incluya características distintivas para ayudar a identificar dónde termina una categoría y otra comienza. -
analyzerId- (Opcional) Referencia a otro analizador que se va a usar para esta categoría. El analizador al que se hace referencia está vinculado, no copiado, lo que garantiza un comportamiento coherente. Si se omite, solo se realiza la categorización sin más procesamiento (escenario de solo división).
-
-
Uso del modelo: Los modelos especificados en la propiedad del
modelsanalizador primario solo se usan para la segmentación y la clasificación. Cada subanalizador usa su propia configuración de modelo para la extracción. -
Comportamiento con
enableSegment:-
enableSegment: true: el contenido se divide en segmentos en función de las descripciones de categorías. Cada segmento se clasifica en una de las categorías definidas. Devuelve metadatos de segmento en el objeto de contenido original, además de más objetos de contenido para segmentos conanalyzerIdespecificados. -
enableSegment: false: todo el contenido se clasifica como un todo en una categoría y se enruta en consecuencia. Útil para la clasificación jerárquica sin dividir.
-
- Coincidencia de categorías: Si no se define una categoría "otra" o "predeterminada", el contenido se ve obligado a clasificar en una de las categorías enumeradas. Incluya una categoría "otro" para gestionar correctamente los contenidos no coincidentes.
- Compatible con: Analizadores de documentos y vídeos. En el caso del vídeo, solo puede definir un contentCategory.
enableSegment
- Valor predeterminado: false
-
Descripción: Habilita la segmentación de contenido, lo que divide el archivo en fragmentos en función de las categorías especificadas en
contentCategories. A continuación, cada segmento se clasifica en una de las categorías definidas para el procesamiento selectivo. -
Comportamiento de segmentación: El servicio divide el contenido en unidades lógicas mediante el análisis del contenido con las descripciones de categorías. Los límites de segmento se determinan mediante:
- Documentos: Descripciones de categorías combinadas con la estructura de contenido (páginas, secciones, cambios de formato)
- Videos: Descripciones de categorías combinadas con indicaciones visuales (cambios de captura, transiciones de escena, límites temporales). Solo se admite una categoría de contenido.
-
Cuándo usar:
- Procesamiento de lotes de contenido mixto en los que diferentes partes necesitan un control diferente (por ejemplo, un PDF que contiene facturas y recibos)
- División de documentos largos en fragmentos clasificados para el análisis selectivo
- Analizar vídeos por tipo de contenido (por ejemplo, separar anuncios del contenido principal)
-
Estructura de salida:
- Devuelve una
segmentsmatriz del objeto de contenido que contiene metadatos para cada segmento (identificador, límites, categoría) - Cada segmento incluye su categoría clasificada de
contentCategories - Se devuelven más objetos de contenido para segmentos con la categoría
analyzerIdespecificada.
- Devuelve una
-
Segmentación jerárquica: Si el analizador de una categoría también tiene
enableSegment: true, los segmentos se pueden dividir de forma recursiva, lo que permite el desglose de contenido de varios niveles. - Impacto en el rendimiento: Aumenta el tiempo de procesamiento de archivos grandes, especialmente con muchos segmentos.
- Compatible con: Analizadores de documentos y vídeos
segmentPerPage
- Valor predeterminado: false
- Descripción: Cuando la segmentación está habilitada, fuerza un segmento por página en lugar de usar límites de contenido lógico. Reemplaza la necesidad de métodos de separación "perPage" independientes.
-
Cuándo usar:
- Flujos de trabajo de procesamiento de página a página
- Cada página debe tratarse como una unidad independiente
- Procesamiento paralelo de páginas individuales
- Extracción de campos de nivel de página en documentos de varias páginas
- Lotes de documentos mixtos donde cada página es un tipo de documento diferente
- Compatible con: Analizadores basados en documentos
omitContent
- Valor predeterminado: false
-
Descripción: Cuando
true, excluye el objeto de contenido original de la respuesta, devolviendo solo datos de campo estructurados o objetos de contenido de subanalizadores (cuando se usacontentCategories) -
Cuándo usar:
- Cuando solo se necesitan valores de campo extraídos
- En analizadores compuestos con
contentCategoriespara devolver solo los resultados clasificados - En el caso de las cadenas de clasificación jerárquicas, solo se devuelven los resultados del analizador hoja.
-
Ejemplo: análisis selectivo:
{ "config": { "enableSegment": true, "contentCategories": { "invoice": { "analyzerId": "prebuilt-invoice" }, "other": { } // Categorize but don't process }, "omitContent": true // Only return invoice analysis results } } - Compatible con: Analizadores de documentos
Configuración de campos
La fieldSchema propiedad define qué datos estructurados extrae el analizador del contenido. Especifica los campos, sus tipos y cómo se deben extraer.
Intención de diseño: Extracción estructurada
Los esquemas de campo transforman el contenido no estructurado en datos estructurados y consultables. El esquema actúa como ambos:
- Un contrato que define qué datos se extraen
- Una guía para el modelo de IA sobre qué buscar y cómo interpretarlo
Estructura de esquema de campo
{
"fieldSchema": {
"name": "InvoiceAnalysis",
"fields": {
"VendorName": {
"type": "string",
"description": "Name of the vendor or supplier",
"method": "extract"
},
"InvoiceTotal": {
"type": "number",
"description": "Total amount due on the invoice",
"method": "extract"
},
"LineItems": {
"type": "array",
"items": {
"type": "object",
"properties": {
"Description": { "type": "string" },
"Quantity": { "type": "number" },
"UnitPrice": { "type": "number" },
"Amount": { "type": "number" }
}
},
"description": "List of items on the invoice, typically in a table format",
"method": "generative"
}
}
}
}
Propiedades del esquema de campo
name
- Descripción: Nombre del esquema, que normalmente describe el tipo de contenido o el caso de uso
-
Ejemplo:
"InvoiceAnalysis","ReceiptExtraction","ContractFields"
fields
-
Descripción: Objeto que define cada campo que se va a extraer, con nombres de campo como claves. El objeto
{}vacío indica que no se extraen campos estructurados (por ejemplo, analizadores de solo diseño). -
Compatibilidad jerárquica: Admite campos anidados a través de
objectyarraytipos para representar estructuras de datos complejas - Procedimiento recomendado: Evite el anidamiento profundo (más de 2 a 3 niveles), ya que puede reducir la precisión de rendimiento y extracción.
Propiedades de definición de campo
Cada campo del fields objeto tiene las siguientes propiedades:
type
-
Valores admitidos:
"string","number","boolean""date", ,"object","array" - Descripción: Tipo de datos del valor del campo. Elija el tipo que mejor coincida con la semántica de datos para una extracción óptima.
description
- Descripción: Explicación clara de lo que contiene el campo y dónde encontrarlo. El modelo de inteligencia artificial procesa esta descripción como un mini aviso para guiar la extracción de campos, por lo que la especificidad y la claridad mejoran directamente la precisión de la extracción.
Para obtener información sobre cómo escribir descripciones de campos eficaces, consulte Procedimientos recomendados para la extracción de campos.
method
-
Valores admitidos:
"generate","extract","classify" - Descripción: Método de extracción que se va a usar para este campo. Cuando no se especifica, el sistema determina automáticamente el mejor método en función del tipo de campo y la descripción.
-
Tipos de método:
-
"generate"- Los valores se generan libremente en función del contenido mediante modelos de IA (lo mejor para campos complejos o variables que requieren interpretación) -
"extract"- Los valores se extraen a medida que aparecen en el contenido (lo mejor para la extracción de texto literal de ubicaciones específicas). La extracción requiere queenableSourceGroundingAndConfidencese establezca en verdadero para este campo. -
"classify"- Los valores se clasifican en un conjunto predefinido de categorías (mejor cuando se usaenumcon un conjunto fijo de valores posibles)
-
estimateSourceAndConfidence
- Valor predeterminado: false
-
Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para este valor de campo. Debe ser verdadero para los campos con
method= extract. Esta propiedad sobrescribirá la propiedad de nivel de analizadorestimateFieldSourceAndConfidence. -
Cuándo usar:
- Flujos de trabajo de validación y control de calidad
- Comprender la precisión de la extracción
- Problemas de depuración de extracción
- Resaltado del texto de origen en las interfaces de usuario
- Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)
items (para tipos de matriz)
- Descripción: Define la estructura de los elementos de la matriz.
-
Propiedades:
-
type- Tipo de elementos de matriz ("string","number","object") -
properties- Para los elementos de objeto, define la estructura de campo anidada.
-
properties (para los tipos de objeto)
- Descripción: Define la estructura de campos anidados dentro del objeto .
-
Example:
{ "Address": { "type": "object", "properties": { "Street": { "type": "string" }, "City": { "type": "string" }, "State": { "type": "string" }, "ZipCode": { "type": "string" } }, "description": "Complete mailing address" } }
Ejemplo completo del analizador
Este es un ejemplo completo de una configuración personalizada del analizador de facturas que muestra los conceptos clave que se describen en esta referencia:
{
"analyzerId": "my-custom-invoice-analyzer",
"name": "Custom Invoice Analyzer",
"description": "Extracts vendor information, line items, and totals from commercial invoices",
"baseAnalyzerId": "prebuilt-document",
"config": {
"returnDetails": true,
"enableOcr": true,
"enableLayout": true,
"tableFormat": "html",
"estimateFieldSourceAndConfidence": true,
"omitContent": false
},
"fieldSchema": {
"name": "InvoiceFields",
"fields": {
"VendorName": {
"type": "string",
"description": "Name of the vendor or supplier, typically found in the header section",
"method": "extract"
},
"VendorAddress": {
"type": "object",
"properties": {
"Street": { "type": "string" },
"City": { "type": "string" },
"State": { "type": "string" },
"ZipCode": { "type": "string" }
},
"description": "Complete vendor mailing address"
},
"InvoiceNumber": {
"type": "string",
"description": "Unique invoice number, often labeled as 'Invoice #' or 'Invoice No.'",
"method": "extract"
},
"InvoiceDate": {
"type": "date",
"description": "Date the invoice was issued, in format MM/DD/YYYY",
"method": "extract"
},
"DueDate": {
"type": "date",
"description": "Payment due date",
"method": "extract"
},
"LineItems": {
"type": "array",
"items": {
"type": "object",
"properties": {
"Description": {
"type": "string",
"description": "Item or service description"
},
"Quantity": {
"type": "number",
"description": "Quantity ordered"
},
"UnitPrice": {
"type": "number",
"description": "Price per unit"
},
"Amount": {
"type": "number",
"description": "Line total (Quantity × UnitPrice)"
}
}
},
"description": "List of items or services on the invoice, typically in a table format",
"method": "generative"
},
"Subtotal": {
"type": "number",
"description": "Sum of all line items before tax",
"method": "extract"
},
"Tax": {
"type": "number",
"description": "Tax amount",
},
"Total": {
"type": "number",
"description": "Total amount due (Subtotal + Tax)",
},
"PaymentTerms": {
"type": "string",
"description": "Payment terms and conditions (e.g., 'Net 30', 'Due upon receipt')",
"method": "generative"
}
}
},
"supportedModels": {
"completion": ["gpt-4o", "gpt-4o-mini", "gpt-4.1"],
"embedding": ["text-embedding-3-large", "text-embedding-3-small"]
},
"models": {
"completion": "gpt-4.1",
"embedding": "text-embedding-3-large"
}
}
Creación de un analizador personalizado
Para crear un analizador personalizado basado en la estructura de configuración descrita en este documento, use la API REST content Understanding para enviar la definición del analizador.
Punto de conexión de la API
Use el siguiente comando curl para crear un analizador personalizado mediante el envío de la configuración del analizador desde un archivo JSON:
curl -X PUT "https://{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01-preview" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: {key}" \
-d @analyzer-definition.json
Reemplace los marcadores de posición siguientes:
-
{endpoint}: el punto de conexión del recurso de Content Understanding -
{analyzerId}- Identificador único del analizador -
{key}- La clave de suscripción de Content Understanding -
analyzer-definition.json- Ruta de acceso al archivo de configuración del analizador
Cuerpo de la solicitud
El archivo de configuración del analizador debe ser un objeto JSON que contenga las propiedades descritas en esta referencia. Para obtener un ejemplo completo, consulte el tutorial Creación de analizadores personalizados.
Respuesta
La API devuelve una respuesta con un 201 CreatedOperation-Location encabezado que puede usar para realizar un seguimiento del estado de la operación de creación del analizador.
Pasos siguientes
Para ver un tutorial completo con ejemplos de diferentes tipos de contenido (documentos, imágenes, audio, vídeo), consulte Creación de un analizador personalizado.
Configuración por tipo de contenido
Los distintos tipos de contenido admiten diferentes opciones de configuración. Esta es una referencia rápida:
Analizadores de documentos
Analizador base:prebuilt-document
Opciones de configuración admitidas:
- ✅
returnDetails - ✅
omitContent - ✅
enableOcr - ✅
enableLayout - ✅
enableFormula - ✅
enableBarcode - ✅
tableFormat - ✅
chartFormat - ✅
enableFigureDescription - ✅
enableFigureAnalysis - ✅
enableAnnotations - ✅
annotationFormat - ✅
enableSegment - ✅
segmentPerPage -
✅
estimateFieldSourceAndConfidence(analizadores estructurados) -
✅
contentCategories(analizadores de varias variantes)
Analizadores de audio
Analizador base:prebuilt-audio
Opciones de configuración admitidas:
- ✅
returnDetails - ✅
locales
Analizadores de vídeo
Analizador base:prebuilt-video
Opciones de configuración admitidas:
- ✅
returnDetails - ✅
locales - ✅
contentCategories - ✅
enableSegment - ✅
omitContent - ✅
disableFaceBlurring
Analizadores de imágenes
Analizador base:prebuilt-image
Opciones de configuración admitidas:
- ✅
returnDetails - ✅
disableFaceBlurring
Contenido relacionado
- Más información sobre los analizadores creados previamente disponibles en Content Understanding
- Explora plantillas de análisis para comenzar rápidamente
- Creación de su propio analizador siguiendo el tutorial del analizador personalizado
- Descripción de los procedimientos recomendados para obtener resultados óptimos de extracción
- Revise los elementos de documento y los elementos de vídeo para obtener más información sobre el contenido extraído.
- Introducción a la creación y prueba de analizadores en Foundry