Análisis de documentos: extracción de contenido estructurado

Información general

Las funcionalidades de análisis de Azure Content Understanding le ayudan a transformar los datos no estructurados en información estructurada y legible por la máquina. Mediante la identificación y extracción precisa de elementos a la vez que se conservan sus relaciones estructurales, puede crear flujos de trabajo de procesamiento eficaces para una amplia gama de aplicaciones.

El objeto contents con el tipo document admite la salida de un intervalo de archivos de entrada diferentes, incluidos documentos, imágenes, texto y archivos estructurados. Puede usar estas salidas para extraer contenido significativo de los archivos, conservar las estructuras de documentos y desbloquear todo el potencial de los datos.

El tipo de contenido del documento incluye la salida de los archivos de entrada, como:

Documentos: Archivos PDF, documentos de Word, presentaciones de PowerPoint y hojas de cálculo de Excel
Figuras: fotos, documentos escaneados, gráficos y diagramas
Archivos de texto: texto sin formato, HTML, Markdown y RTF
Contenido estructurado: archivos XML, JSON, CSV y TSV
Correo electrónico: formatos de mensaje EML y MSG

Para obtener más información sobre los tipos de archivo admitidos, los límites de tamaño de archivo y otras restricciones, consulte Cuotas y límites de servicio.

Estructura de respuesta JSON

Content Understanding API devuelve resultados de análisis en un formato JSON estructurado. Esta es la estructura general del contenedor:

{
  "id": "10a01d32-e21e-46e3-bb5c-361375f184de",
  "status": "Succeeded",
  "result": {
    "analyzerId": "my-analyzer",
    "apiVersion": "2025-05-01-preview",
    "createdAt": "2025-06-18T22:50:34Z",
    "warnings": [],
    "contents": [
      {
        "markdown": "# Example Document\n\n...",
        "fields": { /* extracted field values */ },
        "kind": "document",
        "startPageNumber": 1,
        "endPageNumber": 2,
        "unit": "inch",
        "pages": [ /* page-level elements */ ],
        "paragraphs": [ /* paragraph elements */ ],
        "sections": [ /* section elements */ ],
        "tables": [ /* table elements */ ],
        "figures": [ /* figure elements */ ],
        "hyperlinks": [ /* hyperlink elements */ ],
        "annotations": [ /* annotation elements */ ]
      }
    ]
  }
}

Elementos de documento

Puede extraer los siguientes elementos de documento mediante el análisis de documentos:

Markdown
Objetos de página
Estructura del documento
- Páginas
- Párrafos
- Líneas
- Tablas
- Secciones

No todos los elementos de contenido y diseño son aplicables o actualmente son compatibles con todos los tipos de archivo de documento.

Elementos de contenido de Markdown

Comprensión de contenidos genera Markdown con formato enriquecido que conserva la estructura del documento original. Por este motivo, los modelos de lenguaje grande pueden comprender mejor el contexto del documento y las relaciones jerárquicas para las tareas de generación y análisis con tecnología de inteligencia artificial. Además de palabras, marcas de selección, códigos de barras, fórmulas e imágenes como contenido, Markdown también incluye secciones, tablas y metadatos de página para la representación visual y el procesamiento de máquinas. Obtenga más información sobre cómo Comprensión de contenidos representa elementos de contenido y diseño en Markdown.

Palabras

Una palabra es un elemento de contenido que se compone de una secuencia de caracteres. El Anexo estándar Unicode n.º 29 define los límites de palabras. En el caso de los idiomas latinos, las palabras pueden separarse de la puntuación incluso sin espacios intermedios. En algunos idiomas, como chino, se usan diccionarios de palabras complementarios para habilitar la separación de palabras en límites semánticos. Para obtener más información, consulte Análisis de límites.

Ejemplo JSON:

{
  "words": [
    {
      "content": "Example",
      "span": {
        "length": 7
      },
      "confidence": 0.992,
      "source": "D(1,1.265,1.0836,2.4972,1.0816,2.4964,1.4117,1.2645,1.4117)"
    }
  ]
}

Recorte de pantalla que muestra las palabras detectadas.

Marcas de selección

Una marca de selección es un elemento de contenido que representa un glifo visual que indica el estado de una selección. Las marcas de selección pueden aparecer en el documento como casillas, marcas de verificación o botones. Puede seleccionar o borrar una marca de selección, con una representación visual diferente para indicar el estado. Las marcas de selección se codifican como palabras en el resultado del análisis de documentos mediante los caracteres ☒ Unicode (seleccionados) y ☐ (borrados).

Content Understanding detecta marcas de verificación dentro de una celda de tabla como marcas de selección en el estado seleccionado. No detecta celdas de tabla vacías como marcas de selección en estado borrado.

Ejemplo JSON:

{
  "words": [
    {
      "content": "☒",
      "span": {
        "length": 1
      },
      "confidence": 0.983,
      "source": "D(1,1.258,2.7952,1.3705,2.7949,1.371,2.9098,1.2575,2.9089)"
    }
  ]
}

Recorte de pantalla que muestra las marcas de selección detectadas.

Códigos de barras

Un código de barras es un elemento de contenido que describe códigos de barras lineales (por ejemplo, UPC o EAN) y bidimensionales (por ejemplo, QR o MaxiCode). Comprensión de contenidos representa códigos de barras mediante su tipo detectado y el valor extraído. Actualmente se admiten los siguientes formatos de código de barras:

Tipo de código de barras	Descripción
`QRCode`	Código QR, tal como se define en ISO/IEC 18004:2015
`PDF417`	PDF417, tal como se define en ISO 15438
`UPCA`	Código de producto universal de 12 dígitos GS1
`UPCE`	Código de producto universal de 6 dígitos GS1
`Code39`	Código de barras 39, tal como se define en ISO/IEC 16388:2007
`Code128`	Código de barras 128, tal como se define en ISO/IEC 15417:2007
`EAN8`	Número de artículo internacional de 8 dígitos (número de artículo europeo)
`EAN13`	Número de artículo internacional de 13 dígitos del GS1 (número de artículo europeo)
`DataBar`	Código de barras de barra de datos GS1
`Code93`	Código de barras 93, tal como se define en ANSI/AIM BC5-1995
`Codabar`	Código de barras codabar, tal como se define en ANSI/AIM BC3-1995
`DataBarExpanded`	Código de barras expandido de barra de datos GS1
`ITF`	"Código de barras Intercalado 2 de 5 (ITF)" tal como se define en ANSI/AIM BC2-1995
`MicroQRCode`	Código QR micro, tal como se define en ISO/IEC 23941:2022
`Aztec`	Código Azteca, tal como se define en ISO/IEC 24778:2008
`DataMatrix`	Código de matriz de datos, tal como se define en ISO/IEC 16022:2006
`MaxiCode`	MaxiCode, tal como se define en ISO/IEC 16023:2000

Ejemplo JSON:

{
  "barcodes": [
    {
      "kind": "Code39",
      "value": "Hello World",
      "source": "D(1,2.5738,4.8186,3.8617,4.8153,3.8621,4.9894,2.5743,4.9928)",
      "span": {"offset": 192, "length": 10 },
      "confidence": 0.977
    }
  ]
}

Fórmulas

Una fórmula es un elemento de contenido que representa expresiones matemáticas en el documento. Puede ser una fórmula insertada con otro texto o una fórmula de visualización que ocupa toda una línea. Las fórmulas de varias líneas se representan como varios elementos de fórmula de visualización agrupados en párrafos para conservar las relaciones matemáticas.

La fórmula puede ser de tipo inline o display dependiendo de la ubicación de la fórmula dentro del documento.

Ejemplo JSON:

{
  "formulas": [
    {
      "kind": "inline",
      "value": "x = \\frac { - b \\pm \\sqrt { b ^ { 2 } - 4 a c } } { 2 a }",
      "confidence": 0.708,
      "source": "D(1,3.4282,7.0195,4.0452,7.0307,4.0425,7.1803,3.4255,7.1691)",
      "span": {
        "offset": 394,
        "length": 51
      }
    }
  ]
}

Figuras

Una figura es un elemento de contenido que representa una imagen incrustada, una figura o un gráfico del documento. Content Understanding genera un resumen de las cifras detectadas, convierte imágenes selectas en chart.js representación y extrae cualquier texto incrustado de las imágenes y las leyendas y notas al pie asociadas. Los gráficos se representan en el contenido de la figura mediante la sintaxis de chart.js y los diagramas se representan en el contenido de la figura mediante una cadena en la sintaxis de Mermaid. Esta es una característica opcional que puede activar en la configuración del analizador estableciendo enableFigureAnalysis y enableFigureDescription como true.

Actualmente se admiten los siguientes tipos de ilustración:

Tipo de figura	Representación
`Bar chart`	Chart.js
`Line chart`	Chart.js
`Pie chart`	Chart.js
`Radar chart`	Chart.js
`Scatter chart`	Chart.js
`Bubble chart`	Chart.js
`Quadrant chart`	Chart.js
`Mixed chart (e.g. combined bar and line chart)`	Mermaid.js
`Flow chart`	Mermaid.js
`Sequence diagrams`	Mermaid.js
`Gantt chart`	Mermaid.js

Ejemplo JSON:

{
  "figures": [
     {
      // enableFigureDescription = True
      "description": "This figure illustrates the sales revenue over the year 2023.",

      // enableFigureAnalysis = True
      "kind": "chart",
      "content": {
        "type": "line",
        "data": {
          "labels": ["January", "February", "March", "April", "May", "June", "July"],
          "datasets": [
            {
              "label": "A",
              "data": [93, -29, -17, -8, 73, 98, 40]
            },
            {
              "label": "B",
              "data": [20, 85, -79, 93, 27, -81, -22]
            }
          ]
        },
        "options": {
          "title": { "text": "Title" }
        }
      }
    },
    {
      "kind": "mermaid",
      "content": "xychart-beta\n    title \"Sales Revenue\"\n    x-axis [jan, feb, mar, apr]..."
    },
  ]
}

Hipervínculos

Un hipervínculo es un elemento de contenido que representa un vínculo incrustado que se conecta a otro recurso, como la página web del documento. Content Understanding representa hipervínculos mediante su vínculo incrustado.

Ejemplo JSON:

{
  "hyperlinks": [
        {
          "content": "Microsoft",
          "url": "https://www.microsoft.com",
          "span": {...},
          "source": "..."
        }
  ]
}

Annotations

Las anotaciones son metadatos adicionales en el documento para proporcionar información adicional, aclaración o comentarios sin cambiar el propio contenido principal. Hay muchos tipos de anotaciones que pueden abarcar intervalos específicos de contenido o incluso hacer referencia a cuadros de límite específicos. A continuación se muestra la lista de tipos de anotación que se admiten.

Nota:

Tenga en cuenta que actualmente solo se admiten anotaciones en entradas PDF digitales.

Tipo de anotación
`highlight`
`underline`
`strikethrough`
`rectangle`
`circle`
`drawing`
`comments`
`other`

Ejemplo JSON:

{
  "annotations": [
    {
      "id": "underline-1",
      "kind": "underline",
      "spans": [...],
      "source": "D(pageNumber,l,t,w,h)",
      "comments": [
        {
          "message": "Hi",
          "author": "johndoe",
          "createdAt": "2023-10-01T12:00:00Z",
          "tags": ["approved"]
        }
      ]
      "author": "paulhsu",
      "createdAt": "2023-10-01T12:00:00Z",
      "lastModifiedAt": "2023-10-02T12:00:00Z",
      "tags": [ ... ],
    }
  ]
}

Elementos de diseño

Los elementos de diseño de documento son componentes visuales y estructurales, como páginas, tablas, párrafos, líneas, tablas, secciones y estructura general, que ayudan a interpretar el contenido. La extracción de estos elementos permite a las herramientas analizar documentos de forma eficaz para tareas como la recuperación de información, la comprensión semántica y la estructuración de datos.

Páginas

Una página es una agrupación de contenidos que suele corresponder a una cara de una hoja de papel. Una página representada se caracteriza por ancho y alto en la unidad especificada. En general, las imágenes usan píxeles mientras que los archivos PDF usan pulgadas. La angle propiedad describe el ángulo general del texto en grados para las páginas que se pueden girar.

En el caso de las hojas de cálculo, como Excel, cada una de ellas se asigna a una página. En el caso de las presentaciones, como PowerPoint, cada diapositiva se asigna a una página. Para formatos de archivo como documentos HTML o Word, que carecen de un concepto de página nativa sin representación, todo el contenido principal se trata como una sola página.

Ejemplo JSON:

{
  "pages": [
    {
      "pageNumber": 1,
      "angle": 0.0739153,
      "width": 8.5,
      "height": 11,
      "spans": [
        {
          "offset": 0,
          "length": 620
        }
      ],
      "words": [ /* array of word objects */ ],
      "barcodes": [ /* details of barcodes */ ],
      "lines": [ /* array of line objects */ ],
      "formulas": [ /* array of formula objects */ ]
    }
  ]
}

Párrafos

Un párrafo es una secuencia ordenada de líneas que forman una unidad lógica. Normalmente, las líneas comparten alineación y espaciado entre líneas. Los párrafos suelen delimitarse mediante sangría, espaciado agregado, o bien viñetas o numeración. Algunos párrafos tienen roles funcionales especiales en el documento. Los roles admitidos actualmente incluyen encabezado de página, pie de página, número de página, título, encabezado de sección, nota al pie y bloque de fórmulas.

Ejemplo JSON:

{
  "paragraphs": [
    {
      "role": "title",
      "content": "Example Document",
      "source": "D(1,1.264,1.0836,4.1584,1.0795,4.1589,1.4083,1.2644,1.4124)",
      "span": {
        "offset": 0,
        "length": 18
      }
    }
  ]
}

Líneas

Una línea es una secuencia ordenada de elementos de contenido consecutivos, que a menudo están separados por espacios visuales. Los elementos de contenido del mismo plano horizontal (fila), pero que están separados por más de un solo espacio visual se dividen con más frecuencia en varias líneas. Esta característica a veces divide el contenido semánticamente contiguo en líneas independientes. También permite la representación del contenido textual dividido en varias columnas o celdas. Las líneas en escritura vertical se detectan en dirección vertical.

Ejemplo JSON:

{
  "lines": [
    {
      "content": "Example Document",
      "source": "D(1,1.264,1.0836,4.1583,1.0795,4.1589,1.4083,1.2645,1.4117)",
      "span": {
        "offset": 0,
        "length": 16
      }
    }
  ]
}

Tablas

Una tabla organiza el contenido en un grupo de celdas en un diseño de cuadrícula. Las filas y columnas pueden estar separadas visualmente por líneas de cuadrícula, bandas de color o un espaciado mayor. La posición de una celda de tabla se especifica mediante sus índices de fila y columna. Una celda puede abarcar varias filas y columnas.

En función de su posición y estilo, una celda se clasifica como contenido general, encabezado de fila, encabezado de columna, encabezado de código auxiliar o descripción:

Una celda de encabezado de fila suele ser la primera celda de una fila que describe las demás celdas de dicha fila.
Una celda de encabezado de columna suele ser la primera celda de una columna que describe las demás celdas de dicha columna.
Una fila o columna puede contener varias celdas de encabezado para describir contenido jerárquico.
Una celda de encabezamiento es normalmente la celda de la primera fila y la primera columna. La celda está vacía o describe los valores de las celdas de encabezado de la misma fila o columna.
Normalmente, una celda de descripción aparece en el área superior o inferior de una tabla y describe el contenido general de la tabla. A veces puede aparecer en medio de una tabla para dividirla en secciones. Por lo general, las celdas de descripción abarcan varias celdas de una sola fila.

El título de la tabla especifica el contenido que esta explica. Una tabla también puede tener un conjunto de notas al pie. A diferencia de una celda de descripción, un título suele estar fuera del diseño de cuadrícula. Las notas al pie de tabla anotan contenido dentro de la tabla y a menudo marcadas con símbolos de nota al pie. A menudo se encuentran debajo de la cuadrícula de la tabla.

Una tabla puede abarcar páginas consecutivas de un documento. En esta situación, las continuaciones de tabla en las páginas posteriores suelen mantener el mismo recuento de columnas, ancho y estilo. A menudo repiten los encabezados de columna. Normalmente, ningún contenido que intervenga entre la tabla inicial y sus continuaciones, excepto los encabezados de página, los pies de página y los números de página.

Una tabla puede abarcar páginas consecutivas de un documento. En esta situación, las continuaciones de tabla en las páginas posteriores suelen mantener el mismo recuento de columnas, ancho y estilo. A menudo repiten los encabezados de columna. Aparte de los encabezados de página, los pies de página y los números de página, generalmente no hay contenido intermedio entre la tabla inicial y sus continuaciones.

Nota:

El intervalo de las tablas abarcará tanto los títulos y notas al pie asociados como el texto principal.

Ejemplo JSON:

{
  "tables": [
    {
      "rowCount": 6,
      "columnCount": 2,
      "cells": [
        {
          "kind": "columnHeader",
          "rowIndex": 0,
          "columnIndex": 0,
          "rowSpan": 1,
          "columnSpan": 1,
          "content": "Category",
          "source": "D(2,1.1674,5.0483,4.1733,5.0546,4.1733,5.2358,1.1674,5.2358)",
          "span": {
            "offset": 798,
            "length": 8
          },
          "elements": [
            "/paragraphs/7"
          ]
        }
      ],
      "source": "D(2,1.1566,5.0425,7.1855,5.0428,7.1862,6.1853,1.1574,6.1858)",
      "span": {
        "offset": 781,
        "length": 280
      },
      "caption": {
        "content": "Table 1: This is a table",
        "source": "D(2,1.1566,5.0425,7.1855,5.0428,7.1862,6.1853,1.1574,6.1858)",
        "span": {
          "offset": 335,
          "length": 30
        }
      }
    }
  ]
}

Recorte de pantalla que muestra una tabla que usa la característica de diseño.

Secciones

Una sección es una agrupación lógica de elementos de contenido relacionados que forman una estructura jerárquica dentro del documento. A menudo comienza con un encabezado de sección como primer párrafo. Una sección puede contener subsecciones para crear una estructura de documentos anidada que conserve las relaciones semánticas.

Ejemplo JSON:

{
  "sections": [
    {
      "span": {
        "offset": 113,
        "length": 77
      },
      "elements": [
        "/paragraphs/3",
        "/paragraphs/4"
      ]
    }
  ]
}

Propiedades del elemento

Los documentos constan de varios componentes que se clasifican en elementos estructurales, textuales y relacionados con formularios. Estos elementos definen la organización y la presentación del documento. Puede identificar y extraer sistemáticamente los elementos para su posterior análisis o aplicación.

Intervalos

La span propiedad especifica la posición lógica del elemento en el documento a través del desplazamiento de caracteres y la longitud en la propiedad de cadena de nivel markdown superior. De forma predeterminada, los desplazamientos de caracteres y las longitudes se devuelven en puntos de código Unicode, que se usan en Python 3. Para dar cabida a diferentes entornos de desarrollo que usan unidades de caracteres diferentes, puede especificar el parámetro de consulta stringEncoding para devolver desplazamientos y longitudes de intervalo en unidades de código UTF16 (Java, JavaScript o .NET) o bytes UTF8 (Go, Rust, Ruby o PHP).

Fuente

La propiedad source describe la posición visual del elemento en el archivo mediante una cadena codificada. En el caso de los documentos, la cadena de origen tiene uno de los siguientes formatos:

Polígono delimitador: D({pageNumber},{x1},{y1},{x2},{y2},{x3},{y3},{x4},{y4})
Cuadro de límite alineado con eje: D({pageNumber},{left},{top},{width},{height})

Los números de página están indexados desde uno. El polígono delimitador describe una secuencia de puntos, en el sentido de las agujas del reloj desde la izquierda con respecto a la orientación natural del elemento. En los cuadriláteros, los puntos representan las esquinas superior izquierda, superior derecha, inferior derecha e inferior izquierda. Cada punto representa la coordenada x,y en la unidad de longitud especificada por la propiedad unit. En general, la unidad de medida de las imágenes es píxeles. Los archivos PDF usan pulgadas.

Recorte de pantalla que muestra las regiones de límite detectadas.

Nota:

Actualmente, Comprensión de contenidos devuelve solo un cuadrilátero de cuatro puntos como un polígono delimitador. Las versiones futuras pueden devolver un número diferente de puntos para describir formas más complejas, como líneas curvadas o imágenes no rectangulares. Actualmente, el origen solo se devuelve para los elementos de los archivos representados (PDF/imagen).

Pruebe a procesar el contenido del documento mediante Content Understanding Studio.
Consulte el inicio rápido de Content Understanding Studio.
Aprenda a analizar el contenido del documento mediante plantillas de analizador.
Revise los ejemplos de código con la búsqueda de documentos visuales.
Revise el código de ejemplo plantillas de analizador.

Ejemplo completo de JSON

En el ejemplo siguiente se muestra la estructura de respuesta JSON completa del análisis de un documento. Este JSON representa la salida completa de Comprensión de contenidos al procesar un documento PDF con varios tipos de elementos:

{
  "id": "10a01d32-e21e-46e3-bb5c-361375f184de",
  "status": "Succeeded",
  "result": {
    "analyzerId": "auto-labeling-model-1750287025291-104",
    "apiVersion": "2025-05-01-preview",
    "createdAt": "2025-06-18T22:50:34Z",
    "warnings": [],
    "contents": [
      {
        "markdown": "# Example Document\n\n\n## 1. Selection Marks (Checkboxes)\n\nEmployee Preferences Form\n☐\nRemote\n☒\nHybrid\n☐\nOn-site\n\n\n## 2. Barcodes\n\nGo check out Azure Content Understanding at the below link\n\n\n## 3. Formulas\n\nBayesian Inference (Posterior Probability):\n\n$$P \\left( \\theta \\mid D \\right) = \\frac { P \\left( D \\mid \\theta \\right) \\cdot P \\left( \\theta \\right) } { P \\left( D \\right) }$$\n\nWhere:\n\n$$P \\left( \\theta \\mid D \\right)$$\nis the posterior\n\n$P \\left( D \\mid \\theta \\right)$ is the likelihood\n$P \\left( \\theta \\right)$ is the prior\n\n$$P \\left( D \\right) i s \\quad t h e \\quad e v i d e n c e$$\n\n<!-- PageBreak -->\n\n\n## 4. Images\n\nSample Product Image\n\n\n<figure>\n\nContent\nUnderstanding\n\n</figure>\n\n\nImage Description: \"A ceramic coffee mug with company logo.\"\n\n\n## 5. Tables\n\n\n<table>\n<tr>\n<th>Category</th>\n<th>Amount ($)</th>\n</tr>\n<tr>\n<td>Rent</td>\n<td>1,200</td>\n</tr>\n<tr>\n<td>Utilities</td>\n<td>150</td>\n</tr>\n<tr>\n<td>Groceries</td>\n<td>300</td>\n</tr>\n<tr>\n<td>Transportation</td>\n<td>100</td>\n</tr>\n<tr>\n<td>Total</td>\n<td>1,750</td>\n</tr>\n</table>\n\n\n## 6. Paragraphs\n\nOur company is committed to fostering a productive and inclusive work environment. All\nemployees are expected to comply with the outlined policies and demonstrate mutual\nrespect in day-to-day operations. Regular reviews will ensure that these policies remain\nrelevant and effective.\n",
        "fields": {
          "EmployeePreferences": {
            "type": "string",
            "valueString": "Hybrid",
            "spans": [
              {
                "offset": 94,
                "length": 6
              }
            ],
            "confidence": 0.987,
            "source": "D(1,1.4104,2.7836,1.8760,2.7823,1.8760,2.9377,1.4110,2.9396)"
          },
          "ImageDescription": {
            "type": "string",
            "valueString": "\"A ceramic coffee mug with company logo.\"",
            "spans": [
              {
                "offset": 722,
                "length": 41
              }
            ],
            "confidence": 0.958,
            "source": "D(2,2.5222,4.2511,5.3236,4.2497,5.3237,4.4422,2.5223,4.4436)"
          }
        },
        "kind": "document",
        "startPageNumber": 1,
        "endPageNumber": 2,
        "unit": "inch",
        "pages": [
          {
            "pageNumber": 1,
            "angle": 0.0739153,
            "width": 8.5,
            "height": 11,
            "spans": [
              {
                "offset": 0,
                "length": 620
              }
            ],
            "words": [
              {
                "content": "Example",
                "span": {
                  "length": 7
                },
                "confidence": 0.992,
                "source": "D(1,1.265,1.0836,2.4972,1.0816,2.4964,1.4117,1.2645,1.4117)"
              },
              {
                "content": "Document",
                "span": {
                  "length": 8
                },
                "confidence": 0.996,
                "source": "D(1,2.6252,1.084,4.1615,1.0886,4.1615,1.3993,2.6241,1.4117)"
              },
              {
                "content": "☒",
                "span": {
                  "length": 1
                },
                "confidence": 0.983,
                "source": "D(1,1.258,2.7952,1.3705,2.7949,1.371,2.9098,1.2575,2.9089)"
              },
              {
                "content": "Hybrid",
                "span": {
                  "length": 6
                },
                "confidence": 0.996,
                "source": "D(1,1.4104,2.7836,1.876,2.7823,1.876,2.9377,1.411,2.9396)"
              }
            ],
            "lines": [
              {
                "content": "Example Document",
                "source": "D(1,1.264,1.0836,4.1583,1.0795,4.1589,1.4083,1.2645,1.4117)",
                "span": {
                  "offset": 0,
                  "length": 16
                }
              }
            ],
            "formulas": [
              {
                "confidence": 0.583
              },
              {
                "confidence": 0.708
              }
            ]
          },
          {
            "pageNumber": 2,
            "angle": 0.1008425,
            "width": 8.5,
            "height": 11,
            "spans": [
              {
                "offset": 620,
                "length": 744
              }
            ],
            "words": [
              {
                "content": "Images",
                "source": "D(2,1.4516,1.0434,2.0254,1.0463,2.0254,1.229,1.4506,1.224)"
              },
              {
                "content": "ceramic",
                "source": "D(2,2.5230,4.2539,2.6591,4.2543,2.6584,4.4392,2.5223,4.4407)"
              }
            ],
            "lines": [
              {
                "content": "4. Images",
                "source": "D(2,1.24,1.0409,2.0238,1.0463,2.0226,1.2284,1.2387,1.223)"
              }
            ]
          }
        ],
        "paragraphs": [
          {
            "role": "title",
            "content": "Example Document",
            "source": "D(1,1.264,1.0836,4.1584,1.0795,4.1589,1.4083,1.2644,1.4124)",
            "span": {
              "offset": 0,
              "length": 18
            }
          },
          {
            "role": "sectionHeading",
            "content": "1. Selection Marks (Checkboxes)",
            "source": "D(1,1.2461,1.8719,3.8532,1.8731,3.8531,2.065,1.246,2.0638)",
            "span": {
              "offset": 21,
              "length": 34
            }
          },
          {
            "content": "Employee Preferences Form ☐ Remote ☒ Hybrid ☐ On-site",
            "source": "D(1,1.246,2.0993,3.1019,2.1007,3.101,3.2724,1.2451,3.2709)",
            "span": {
              "offset": 57,
              "length": 53
            }
          }
        ],
        "sections": [
          {
            "span": {
              "offset": 0,
              "length": 1364
            },
            "elements": [
              "/paragraphs/0",
              "/sections/1",
              "/sections/2",
              "/sections/3",
              "/sections/4",
              "/sections/5",
              "/sections/6"
            ]
          },
          {
            "span": {
              "offset": 21,
              "length": 89
            },
            "elements": [
              "/paragraphs/1",
              "/paragraphs/2"
            ]
          }
        ],
        "tables": [
          {
            "rowCount": 6,
            "columnCount": 2,
            "cells": [
              {
                "kind": "columnHeader",
                "rowIndex": 0,
                "columnIndex": 0,
                "rowSpan": 1,
                "columnSpan": 1,
                "content": "Category",
                "source": "D(2,1.1674,5.0483,4.1733,5.0546,4.1733,5.2358,1.1674,5.2358)",
                "span": {
                  "offset": 798,
                  "length": 8
                }
              },
              {
                "kind": "columnHeader",
                "rowIndex": 0,
                "columnIndex": 1,
                "rowSpan": 1,
                "columnSpan": 1,
                "content": "Amount ($)",
                "source": "D(2,4.1733,5.0546,7.1668,5.0546,7.1668,5.2358,4.1733,5.2358)",
                "span": {
                  "offset": 816,
                  "length": 10
                }
              }
            ],
            "source": "D(2,1.1566,5.0425,7.1855,5.0428,7.1862,6.1853,1.1574,6.1858)",
            "span": {
              "offset": 781,
              "length": 280
            }
          }
        ],
        "figures": [
          {
            "source": "D(2,1.3465,1.8481,3.4788,1.8484,3.4779,3.8286,1.3456,3.8282)",
            "span": {
              "offset": 658,
              "length": 42
            },
            "elements": [
              "/paragraphs/14"
            ],
            "id": "2.1"
          }
        ]
      }
    ]
  }
}

En este ejemplo completo se muestra cómo Content Understanding extrae y estructura todos los tipos de elementos diferentes de un documento. Proporciona tanto el contenido sin procesar como la información posicional y estructural detallada que permite flujos de trabajo avanzados de procesamiento de documentos.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-11-19

Compartir a través de

Análisis de documentos: extracción de contenido estructurado

Información general

Estructura de respuesta JSON

Elementos de documento

Elementos de contenido de Markdown

Palabras

Marcas de selección

Códigos de barras

Fórmulas

Figuras

Hipervínculos

Annotations

Elementos de diseño

Páginas

Párrafos

Líneas

Tablas

Secciones

Propiedades del elemento

Intervalos

Fuente

Contenido relacionado

Ejemplo completo de JSON

Comentarios

Recursos adicionales