¿Qué es un analizador de comprensión del contenido?

Un analizador de Azure Content Understanding en Foundry Tools es una unidad de procesamiento configurable que define cómo se debe analizar el contenido y qué información se debe extraer. Piense en un analizador como una receta que indique al servicio:

Tipo de contenido que se va a procesar (documentos, imágenes, audio o vídeo)
Elementos que se van a extraer (texto, diseño, tablas, campos, transcripciones)
Estructurar la salida (Markdown, campos JSON, segmentos)
Qué modelos de inteligencia artificial se van a usar para el procesamiento

Los analizadores son los componentes fundamentales del Entendimiento de Contenido. Combinan la extracción de contenido, el análisis con tecnología de inteligencia artificial y la salida de datos estructurados en una única configuración reutilizable. Puede usar analizadores creados previamente para escenarios comunes o crear analizadores personalizados adaptados a sus necesidades específicas.

Tipos de analizador

Content Understanding proporciona varios tipos de analizadores:

Analizadores base: analizadores fundamentales que proporcionan funcionalidades de procesamiento principales para cada tipo de contenido (prebuilt-document, prebuilt-audio, prebuilt-video, prebuilt-image). Estos analizadores se suelen usar como bloques de creación para analizadores personalizados.
Analizadores rag: optimizados para escenarios de generación aumentada por recuperación, extrayendo contenido con comprensión semántica para aplicaciones de búsqueda e inteligencia artificial (por ejemplo prebuilt-documentSearch, , prebuilt-videoSearch).
Analizadores específicos del dominio: preconfigurado para determinados tipos de documentos y sectores, como facturas, recibos, documentos de identificador y contratos (por ejemplo prebuilt-invoice, , prebuilt-receipt, prebuilt-idDocument).
Analizadores personalizados: los analizadores que se crean mediante la extensión de analizadores base con esquemas de campo personalizados y configuraciones para satisfacer sus requisitos específicos.

Para obtener más información y una lista completa de analizadores específicos del dominio disponibles, consulte Analizadores creados previamente.

Estructura de configuración del analizador

Una configuración del analizador se define mediante un objeto JSON que contiene varias propiedades de nivel superior. Puede configurar los siguientes componentes:

Propiedades del analizador : identidad principal y metadatos
- analyzerId : identificador único
- name : nombre para mostrar
- description : descripción de propósito
- baseAnalyzerId : referencia del analizador primario
Configuración del modelo : configuración del modelo de IA
- modelos : modelos predeterminados
Configuración de procesamiento : opciones de procesamiento de contenido
- config : configuración de comportamiento
Esquema de campo : extracción de datos estructurados
- fieldSchema : definiciones de campo

Este es un ejemplo condensado que muestra la estructura general de una configuración del analizador:

{
  "analyzerId": "my-custom-invoice-analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    ...
    "enableOcr": true
    ...
  },
  "fieldSchema": {...}
    }
  },
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Propiedades del analizador

Estas propiedades identifican y describen de forma única el analizador:

`analyzerId`

Descripción: Identificador único del analizador. Este identificador es cómo se hace referencia al analizador en las llamadas API.
Ejemplo:"prebuilt-invoice", "my-custom-analyzer"
Directrices:
- Usar nombres descriptivos que indiquen el propósito del analizador
- En el caso de los analizadores personalizados, elija nombres que no entren en conflicto con los nombres de analizador precompilados.
- Uso de minúsculas con guiones para la coherencia

`name`

Descripción: Nombre legible que se muestra en las interfaces de usuario y en la documentación.
Ejemplo:"Invoice document understanding", "Custom receipt processor"

`description`

Descripción: Breve explicación de lo que hace el analizador y qué contenido procesa. El modelo de IA usa esta descripción como contexto durante la extracción de campos, por lo que las descripciones claras mejoran la precisión de la extracción.
Ejemplo:"Analyzes invoice documents to extract line items, totals, vendor information, and payment terms"
Directrices:
- Ser específico sobre lo que extrae el analizador
- Mencionar los tipos de contenido que admite
- Mantenerla concisa pero informativa
- Escribe descripciones claras, ya que guían la comprensión del modelo de inteligencia artificial.

`baseAnalyzerId`

Descripción: Hace referencia a un analizador primario desde el que este analizador hereda la configuración.
Analizadores básicos admitidos:
- "prebuilt-document" : para analizadores personalizados basados en documentos
- "prebuilt-audio" : para analizadores personalizados basados en audio
- "prebuilt-video" : para analizadores personalizados basados en vídeo
- "prebuilt-image" : para analizadores personalizados basados en imágenes
Ejemplo:"baseAnalyzerId": "prebuilt-document"

Nota:

Al especificar un analizador base, el analizador personalizado hereda todas las configuraciones predeterminadas y puede invalidar configuraciones específicas.

Configuración del modelo

`models`

Descripción: Especifica los nombres de modelo de Foundry que se usarán al procesar con este analizador. Estos son los nombres de modelo (no los nombres de implementación) que usa el servicio. Deben coincidir con uno de los supportedModels del analizador de base. La lista completa de modelos admitidos por Content Understanding es la lista de modelos admitidos.
Propiedades:
- completion - Nombre del modelo para tareas de finalización (extracción de campos, segmentación, análisis de figura, etc.)
- embedding - Nombre del modelo para insertar tareas (mediante una base de conocimiento)
Importante: Estos son los nombres de modelo del catálogo Foundry, no los nombres de implementación. En tiempo de ejecución, el servicio asigna estos nombres de modelo a las implementaciones de modelos reales que configure en el nivel de recurso.

Example:

{
  "completion": "gpt-4o",
  "embedding": "text-embedding-3-large"
}

Consulte Conectar su recurso de Content Understanding con modelos Foundry para más detalles sobre cómo configurar modelos conectados.

Configuración de procesamiento

El config objeto contiene todas las opciones de procesamiento que controlan cómo se analiza el contenido. Estas opciones se dividen en categorías basadas en la funcionalidad:

Propiedades del objeto config

Opciones generales

`returnDetails`

Valor predeterminado: false (varía según el analizador)
Descripción: Controla si se debe incluir información detallada en la respuesta (puntuaciones de confianza, cuadros de límite, intervalos de texto, metadatos)
Cuándo usar:
- Establézcalo en true al depurar problemas de extracción
- Cuando necesite información de ubicación para los datos extraídos
- Cuando se requieren puntuaciones de confianza para la validación
- Para garantizar la calidad y las pruebas
Impacto en la respuesta: Aumenta significativamente el tamaño de respuesta con más metadatos

Opciones de extracción de contenido de documentos

`enableOcr`

Valor predeterminado: true
Descripción: Habilita el reconocimiento óptico de caracteres para extraer texto de imágenes y documentos escaneados
Cuándo usar:
- Habilitar para documentos escaneados, fotos e archivos PDF basados en imágenes
- Deshabilitación de archivos PDF digitales nativos para mejorar el rendimiento
Compatible con: Analizadores de documentos

`enableLayout`

Valor predeterminado: true
Descripción: Extrae información de diseño, incluidos párrafos, líneas, palabras, orden de lectura y elementos estructurales.
Cuándo usar:
- Necesario para comprender la estructura y la jerarquía del documento
- Necesario para la extracción precisa de párrafos y secciones
- Deshabilitar si solo se necesita la extracción de texto sin formato
Compatible con: Analizadores basados en documentos

`enableFormula`

Valor predeterminado: true
Descripción: Detecta y extrae fórmulas matemáticas y ecuaciones en formato LaTeX
Cuándo usar:
- Habilitación de documentos científicos, documentos de investigación, documentación técnica
- Desactivar en los documentos empresariales generales para mejorar el rendimiento
Compatible con: Analizadores basados en documentos

`enableBarcode`

Valor predeterminado: true
Descripción: Detecta y extrae códigos de barras y códigos QR, devolviendo los valores descodificados.
Cuándo usar:
- Habilitar para documentos de inventario, etiquetas de envío, documentación del producto
- Deshabilitar cuando los códigos de barras no están presentes para mejorar el rendimiento
Compatible con: Analizadores basados en documentos
Tipos de códigos de barras admitidos: Código QR, PDF417, UPC-A, UPC-E, Código 39, Código 128, EAN-8, EAN-13, DataBar, Código 93, Codabar, ITF, Código QR Micro, Aztec, Data Matrix, MaxiCode

Opciones de tabla y gráfico

`tableFormat`

Predeterminado:"html"
Valores admitidos:"html", "markdown"
Descripción: Especifica el formato de salida de las tablas extraídas.
Cuándo usar:
- Se usa "html" para la representación web o cuando las estructuras de tabla complejas necesitan conservación
- Uso "markdown" para tablas sencillas en documentación o procesamiento basado en texto
Compatible con: Analizadores basados en documentos

`chartFormat`

Predeterminado:"chartjs"
Valores admitidos:"chartjs"
Descripción: Especifica el formato para los datos de gráficos y gráficas extraídas, compatibles con la biblioteca Chart.js
Cuándo usar:
- Al extraer datos de gráficos de barras, gráficos de líneas, gráficos circulares
- Conversión de gráficos visuales en datos estructurados para volver a representar
Compatible con: Analizadores basados en documentos

Opciones de análisis de figuras e imágenes

`enableFigureDescription`

Valor predeterminado: false
Descripción: Genera descripciones de texto de lenguaje natural para ilustraciones, diagramas, imágenes e ilustraciones
Cuándo usar:
- Para los requisitos de accesibilidad (generación de texto alternativo)
- Comprensión de diagramas y flujogramas
- Extracción de información de infografías
Compatible con: Analizadores basados en documentos

`enableFigureAnalysis`

Valor predeterminado: false
Descripción: Realiza un análisis más profundo de ilustraciones, incluida la extracción de datos del gráfico y la identificación de componentes de diagrama.
Cuándo usar:
- Extracción de datos estructurados de gráficos insertados en documentos
- Descripción de diagramas complejos
- Clasificación detallada de la ilustración
Compatible con: Analizadores basados en documentos

Opciones de anotación

`annotationFormat`

Predeterminado:"markdown"
Valores admitidos:"markdown"
Descripción: Especifica el formato de las anotaciones devueltas.
Compatible con: Analizadores basados en documentos

Opciones de extracción de campos

`estimateFieldSourceAndConfidence`

Valor predeterminado: false (varía según el analizador)
Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para cada valor de campo extraído.
Cuándo usar:
- Flujos de trabajo de validación y control de calidad
- Comprender la precisión de la extracción
- Problemas de depuración de extracción
- Resaltado del texto de origen en las interfaces de usuario
Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)

Opciones de audio y vídeo

`locales`

Predeterminado:[] (matriz vacía)
Descripción: Lista de códigos de idioma o configuración regional para el procesamiento específico del idioma (principalmente para la transcripción)
Valores admitidos: Códigos de idioma BCP-47 (por ejemplo, ["en-US", "es-ES", "fr-FR", "de-DE"])
Cuándo usar:
- Transcripción de audio en varios idiomas
- Especificación del idioma esperado para mejorar la precisión
- Procesamiento de contenido en variantes regionales específicas
Compatible con:prebuilt-audio, , prebuilt-videoprebuilt-callCenter

Nota:

Para obtener una lista completa de los idiomas y configuraciones regionales admitidos, consulte Compatibilidad con idiomas y regiones.

`disableFaceBlurring`

Valor predeterminado: false
Descripción: Controla si las caras de imágenes y vídeos deben desenfocarse para la protección de la privacidad
Cuándo usar:
- Establézcalo en true cuando se requiera visibilidad de caras para el análisis
- Establézcalo en false cuando se desee la desidentificación de personas en contenido compartido.
Compatible con:prebuilt-image, prebuilt-video

Importante

La funcionalidad de capacidades de reconocimiento facial en Comprensión de Contenidos es un servicio de acceso limitado, y se requiere registro para acceder. La característica de agrupación y identificación faciales de Content Understanding se limita en función de los criterios de idoneidad y uso. El servicio Face solo está disponible para clientes y asociados administrados por Microsoft. Use el formulario de admisión de reconocimiento facial para solicitar acceso. Para obtener más información, consulte Las inversiones y medidas de seguridad de inteligencia artificial responsable para el reconocimiento facial.

Opciones de clasificación

`contentCategories`

Predeterminado: No establecido
Descripción: Define categorías o tipos de contenido para la clasificación automática y el enrutamiento a controladores especializados. Cuando se usa con enableSegment set to false, actualmente solo se soporta para documentos. Clasifica todo el archivo. Cuando se usa con enableSegment=true, el archivo se divide en fragmentos basados en estas categorías, con cada segmento clasificado y, opcionalmente, procesado por un analizador específico de categorías. Siempre selecciona una sola opción en la lista de categorías disponibles.
Estructura: Cada categoría contiene:
- description - (Obligatorio) Descripción detallada del tipo de categoría o documento. Esta descripción actúa como una solicitud que guía el modelo de IA para determinar los límites de segmento y la clasificación. Incluya características distintivas para ayudar a identificar dónde termina una categoría y otra comienza.
- analyzerId - (Opcional) Referencia a otro analizador que se va a usar para esta categoría. El analizador al que se hace referencia está vinculado, no copiado, lo que garantiza un comportamiento coherente. Si se omite, solo se realiza la categorización sin más procesamiento (escenario de solo división).
Uso del modelo: Los modelos especificados en la propiedad del models analizador primario solo se usan para la segmentación y la clasificación. Cada subanalizador usa su propia configuración de modelo para la extracción.
Comportamiento con enableSegment:
- enableSegment: true: el contenido se divide en segmentos en función de las descripciones de categorías. Cada segmento se clasifica en una de las categorías definidas. Devuelve metadatos de segmento en el objeto de contenido original, además de más objetos de contenido para segmentos con analyzerId especificados.
- enableSegment: false: todo el contenido se clasifica como un todo en una categoría y se enruta en consecuencia. Útil para la clasificación jerárquica sin dividir.
Coincidencia de categorías: Si no se define una categoría "otra" o "predeterminada", el contenido se ve obligado a clasificar en una de las categorías enumeradas. Incluya una categoría "otro" para gestionar correctamente los contenidos no coincidentes.
Compatible con: Analizadores de documentos y vídeos. En el caso del vídeo, solo puede definir un contentCategory.

`enableSegment`

Valor predeterminado: false
Descripción: Habilita la segmentación de contenido, lo que divide el archivo en fragmentos en función de las categorías especificadas en contentCategories. A continuación, cada segmento se clasifica en una de las categorías definidas para el procesamiento selectivo.
Comportamiento de segmentación: El servicio divide el contenido en unidades lógicas mediante el análisis del contenido con las descripciones de categorías. Los límites de segmento se determinan mediante:
- Documentos: Descripciones de categorías combinadas con la estructura de contenido (páginas, secciones, cambios de formato)
- Videos: Descripciones de categorías combinadas con indicaciones visuales (cambios de captura, transiciones de escena, límites temporales). Solo se admite una categoría de contenido.
Cuándo usar:
- Procesamiento de lotes de contenido mixto en los que diferentes partes necesitan un control diferente (por ejemplo, un PDF que contiene facturas y recibos)
- División de documentos largos en fragmentos clasificados para el análisis selectivo
- Analizar vídeos por tipo de contenido (por ejemplo, separar anuncios del contenido principal)
Estructura de salida:
- Devuelve una segments matriz del objeto de contenido que contiene metadatos para cada segmento (identificador, límites, categoría)
- Cada segmento incluye su categoría clasificada de contentCategories
- Se devuelven más objetos de contenido para segmentos con la categoría analyzerId especificada.
Segmentación jerárquica: Si el analizador de una categoría también tiene enableSegment: true, los segmentos se pueden dividir de forma recursiva, lo que permite el desglose de contenido de varios niveles.
Impacto en el rendimiento: Aumenta el tiempo de procesamiento de archivos grandes, especialmente con muchos segmentos.
Compatible con: Analizadores de documentos y vídeos

`segmentPerPage`

Valor predeterminado: false
Descripción: Cuando la segmentación está habilitada, fuerza un segmento por página en lugar de usar límites de contenido lógico. Reemplaza la necesidad de métodos de separación "perPage" independientes.
Cuándo usar:
- Flujos de trabajo de procesamiento de página a página
- Cada página debe tratarse como una unidad independiente
- Procesamiento paralelo de páginas individuales
- Extracción de campos de nivel de página en documentos de varias páginas
- Lotes de documentos mixtos donde cada página es un tipo de documento diferente
Compatible con: Analizadores basados en documentos

`omitContent`

Valor predeterminado: false
Descripción: Cuando true, excluye el objeto de contenido original de la respuesta, devolviendo solo datos de campo estructurados o objetos de contenido de subanalizadores (cuando se usa contentCategories)
Cuándo usar:
- Cuando solo se necesitan valores de campo extraídos
- En analizadores compuestos con contentCategories para devolver solo los resultados clasificados
- En el caso de las cadenas de clasificación jerárquicas, solo se devuelven los resultados del analizador hoja.

Ejemplo: análisis selectivo:

{
  "config": {
    "enableSegment": true,
    "contentCategories": {
      "invoice": { "analyzerId": "prebuilt-invoice" },
      "other": { }  // Categorize but don't process
    },
    "omitContent": true  // Only return invoice analysis results
  }
}

Compatible con: Analizadores de documentos

Configuración de campos

La fieldSchema propiedad define qué datos estructurados extrae el analizador del contenido. Especifica los campos, sus tipos y cómo se deben extraer.

Intención de diseño: Extracción estructurada

Los esquemas de campo transforman el contenido no estructurado en datos estructurados y consultables. El esquema actúa como ambos:

Un contrato que define qué datos se extraen
Una guía para el modelo de IA sobre qué buscar y cómo interpretarlo

Estructura de esquema de campo

{
  "fieldSchema": {
    "name": "InvoiceAnalysis",
    "fields": {
      "VendorName": {
        "type": "string",
        "description": "Name of the vendor or supplier",
        "method": "extract"
      },
      "InvoiceTotal": {
        "type": "number",
        "description": "Total amount due on the invoice",
        "method": "extract"
      },
      "LineItems": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "Description": { "type": "string" },
            "Quantity": { "type": "number" },
            "UnitPrice": { "type": "number" },
            "Amount": { "type": "number" }
          }
        },
        "description": "List of items on the invoice, typically in a table format",
        "method": "generative"
      }
    }
  }
}

Propiedades del esquema de campo

`name`

Descripción: Nombre del esquema, que normalmente describe el tipo de contenido o el caso de uso
Ejemplo:"InvoiceAnalysis", "ReceiptExtraction", "ContractFields"

`fields`

Descripción: Objeto que define cada campo que se va a extraer, con nombres de campo como claves. El objeto {} vacío indica que no se extraen campos estructurados (por ejemplo, analizadores de solo diseño).
Compatibilidad jerárquica: Admite campos anidados a través de object y array tipos para representar estructuras de datos complejas
Procedimiento recomendado: Evite el anidamiento profundo (más de 2 a 3 niveles), ya que puede reducir la precisión de rendimiento y extracción.

Propiedades de definición de campo

Cada campo del fields objeto tiene las siguientes propiedades:

`type`

Valores admitidos:"string" , "number", "boolean""date", , "object","array"
Descripción: Tipo de datos del valor del campo. Elija el tipo que mejor coincida con la semántica de datos para una extracción óptima.

`description`

Descripción: Explicación clara de lo que contiene el campo y dónde encontrarlo. El modelo de inteligencia artificial procesa esta descripción como un mini aviso para guiar la extracción de campos, por lo que la especificidad y la claridad mejoran directamente la precisión de la extracción.

Para obtener información sobre cómo escribir descripciones de campos eficaces, consulte Procedimientos recomendados para la extracción de campos.

`method`

Valores admitidos:"generate", "extract", "classify"
Descripción: Método de extracción que se va a usar para este campo. Cuando no se especifica, el sistema determina automáticamente el mejor método en función del tipo de campo y la descripción.
Tipos de método:
- "generate" - Los valores se generan libremente en función del contenido mediante modelos de IA (lo mejor para campos complejos o variables que requieren interpretación)
- "extract" - Los valores se extraen a medida que aparecen en el contenido (lo mejor para la extracción de texto literal de ubicaciones específicas). La extracción requiere que enableSourceGroundingAndConfidence se establezca en verdadero para este campo.
- "classify" - Los valores se clasifican en un conjunto predefinido de categorías (mejor cuando se usa enum con un conjunto fijo de valores posibles)

`estimateSourceAndConfidence`

Valor predeterminado: false
Descripción: Devuelve la ubicación de origen (número de página, cuadro de límite) y la puntuación de confianza para este valor de campo. Debe ser verdadero para los campos con method = extract. Esta propiedad sobrescribirá la propiedad de nivel de analizador estimateFieldSourceAndConfidence.
Cuándo usar:
- Flujos de trabajo de validación y control de calidad
- Comprender la precisión de la extracción
- Problemas de depuración de extracción
- Resaltado del texto de origen en las interfaces de usuario
Compatible con: Analizadores de documentos (factura, recibo, documentos de identificación, formularios fiscales)

`items` (para tipos de matriz)

Descripción: Define la estructura de los elementos de la matriz.
Propiedades:
- type - Tipo de elementos de matriz ("string", "number", "object")
- properties - Para los elementos de objeto, define la estructura de campo anidada.

`properties` (para los tipos de objeto)

Descripción: Define la estructura de campos anidados dentro del objeto .

Example:

{
  "Address": {
    "type": "object",
    "properties": {
      "Street": { "type": "string" },
      "City": { "type": "string" },
      "State": { "type": "string" },
      "ZipCode": { "type": "string" }
    },
    "description": "Complete mailing address"
  }
}

Ejemplo completo del analizador

Este es un ejemplo completo de una configuración personalizada del analizador de facturas que muestra los conceptos clave que se describen en esta referencia:

{
  "analyzerId": "my-custom-invoice-analyzer",
  "name": "Custom Invoice Analyzer",
  "description": "Extracts vendor information, line items, and totals from commercial invoices",
  "baseAnalyzerId": "prebuilt-document",
  "config": {
    "returnDetails": true,
    "enableOcr": true,
    "enableLayout": true,
    "tableFormat": "html",
    "estimateFieldSourceAndConfidence": true,
    "omitContent": false
  },
  "fieldSchema": {
    "name": "InvoiceFields",
    "fields": {
      "VendorName": {
        "type": "string",
        "description": "Name of the vendor or supplier, typically found in the header section",
        "method": "extract"
      },
      "VendorAddress": {
        "type": "object",
        "properties": {
          "Street": { "type": "string" },
          "City": { "type": "string" },
          "State": { "type": "string" },
          "ZipCode": { "type": "string" }
        },
        "description": "Complete vendor mailing address"
      },
      "InvoiceNumber": {
        "type": "string",
        "description": "Unique invoice number, often labeled as 'Invoice #' or 'Invoice No.'",
        "method": "extract"
      },
      "InvoiceDate": {
        "type": "date",
        "description": "Date the invoice was issued, in format MM/DD/YYYY",
        "method": "extract"
      },
      "DueDate": {
        "type": "date",
        "description": "Payment due date",
        "method": "extract"
      },
      "LineItems": {
        "type": "array",
        "items": {
          "type": "object",
          "properties": {
            "Description": {
              "type": "string",
              "description": "Item or service description"
            },
            "Quantity": {
              "type": "number",
              "description": "Quantity ordered"
            },
            "UnitPrice": {
              "type": "number",
              "description": "Price per unit"
            },
            "Amount": {
              "type": "number",
              "description": "Line total (Quantity × UnitPrice)"
            }
          }
        },
        "description": "List of items or services on the invoice, typically in a table format",
        "method": "generative"
      },
      "Subtotal": {
        "type": "number",
        "description": "Sum of all line items before tax",
        "method": "extract"
      },
      "Tax": {
        "type": "number",
        "description": "Tax amount",
      },
      "Total": {
        "type": "number",
        "description": "Total amount due (Subtotal + Tax)",
      },
      "PaymentTerms": {
        "type": "string",
        "description": "Payment terms and conditions (e.g., 'Net 30', 'Due upon receipt')",
        "method": "generative"
      }
    }
  },
  "supportedModels": {
    "completion": ["gpt-4o", "gpt-4o-mini", "gpt-4.1"],
    "embedding": ["text-embedding-3-large", "text-embedding-3-small"]
  },
  "models": {
    "completion": "gpt-4.1",
    "embedding": "text-embedding-3-large"
  }
}

Creación de un analizador personalizado

Para crear un analizador personalizado basado en la estructura de configuración descrita en este documento, use la API REST content Understanding para enviar la definición del analizador.

Punto de conexión de la API

Use el siguiente comando curl para crear un analizador personalizado mediante el envío de la configuración del analizador desde un archivo JSON:

curl -X PUT "https://{endpoint}/contentunderstanding/analyzers/{analyzerId}?api-version=2025-11-01-preview" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: {key}" \
  -d @analyzer-definition.json

Reemplace los marcadores de posición siguientes:

{endpoint}: el punto de conexión del recurso de Content Understanding
{analyzerId} - Identificador único del analizador
{key} - La clave de suscripción de Content Understanding
analyzer-definition.json - Ruta de acceso al archivo de configuración del analizador

Cuerpo de la solicitud

El archivo de configuración del analizador debe ser un objeto JSON que contenga las propiedades descritas en esta referencia. Para obtener un ejemplo completo, consulte el tutorial Creación de analizadores personalizados.

Respuesta

La API devuelve una respuesta con un 201 CreatedOperation-Location encabezado que puede usar para realizar un seguimiento del estado de la operación de creación del analizador.

Pasos siguientes

Para ver un tutorial completo con ejemplos de diferentes tipos de contenido (documentos, imágenes, audio, vídeo), consulte Creación de un analizador personalizado.

Configuración por tipo de contenido

Los distintos tipos de contenido admiten diferentes opciones de configuración. Esta es una referencia rápida:

Analizadores de documentos

Analizador base:prebuilt-document

Opciones de configuración admitidas:

✅ returnDetails
✅ omitContent
✅ enableOcr
✅ enableLayout
✅ enableFormula
✅ enableBarcode
✅ tableFormat
✅ chartFormat
✅ enableFigureDescription
✅ enableFigureAnalysis
✅ enableAnnotations
✅ annotationFormat
✅ enableSegment
✅ segmentPerPage
✅ estimateFieldSourceAndConfidence (analizadores estructurados)
✅ contentCategories (analizadores de varias variantes)

Analizadores de audio

Analizador base:prebuilt-audio

Opciones de configuración admitidas:

✅ returnDetails
✅ locales

Analizadores de vídeo

Analizador base:prebuilt-video

Opciones de configuración admitidas:

✅ returnDetails
✅ locales
✅ contentCategories
✅ enableSegment
✅ omitContent
✅ disableFaceBlurring

Analizadores de imágenes

Analizador base:prebuilt-image

Opciones de configuración admitidas:

✅ returnDetails
✅ disableFaceBlurring

Más información sobre los analizadores creados previamente disponibles en Content Understanding
Explora plantillas de análisis para comenzar rápidamente
Creación de su propio analizador siguiendo el tutorial del analizador personalizado
Descripción de los procedimientos recomendados para obtener resultados óptimos de extracción
Revise los elementos de documento y los elementos de vídeo para obtener más información sobre el contenido extraído.
Introducción a la creación y prueba de analizadores en Foundry

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-11-18

Compartir a través de

¿Qué es un analizador de comprensión del contenido?

Tipos de analizador

Estructura de configuración del analizador

Propiedades del analizador

analyzerId

name

description

baseAnalyzerId

Configuración del modelo

models

Configuración de procesamiento

Propiedades del objeto config

Opciones generales

returnDetails

Opciones de extracción de contenido de documentos

enableOcr

enableLayout

enableFormula

enableBarcode

Opciones de tabla y gráfico

tableFormat

chartFormat

Opciones de análisis de figuras e imágenes

enableFigureDescription

enableFigureAnalysis

Opciones de anotación

annotationFormat

Opciones de extracción de campos

estimateFieldSourceAndConfidence

Opciones de audio y vídeo

locales

disableFaceBlurring

Opciones de clasificación

contentCategories

enableSegment

segmentPerPage

omitContent

Configuración de campos

Intención de diseño: Extracción estructurada

Estructura de esquema de campo

Propiedades del esquema de campo

name

fields

Propiedades de definición de campo

type

description

method

estimateSourceAndConfidence

items (para tipos de matriz)

properties (para los tipos de objeto)

Ejemplo completo del analizador

Creación de un analizador personalizado

Punto de conexión de la API

Cuerpo de la solicitud

Respuesta

Pasos siguientes

Configuración por tipo de contenido

Analizadores de documentos

Analizadores de audio

Analizadores de vídeo

Analizadores de imágenes

Contenido relacionado

Comentarios

Recursos adicionales

`analyzerId`

`name`

`description`

`baseAnalyzerId`

`models`

`returnDetails`

`enableOcr`

`enableLayout`

`enableFormula`

`enableBarcode`

`tableFormat`

`chartFormat`

`enableFigureDescription`

`enableFigureAnalysis`

`annotationFormat`

`estimateFieldSourceAndConfidence`

`locales`

`disableFaceBlurring`

`contentCategories`

`enableSegment`

`segmentPerPage`

`omitContent`

`name`

`fields`

`type`

`description`

`method`

`estimateSourceAndConfidence`

`items` (para tipos de matriz)

`properties` (para los tipos de objeto)