Modelo de documento de identificación de Document Intelligence

Este contenido se aplica a:v4.0 (GA) | Versiones anteriores:v3.1 (GA)v3.0 (GA)v2.1 (GA)

::: moniker-end

Este contenido se aplica a:v3.1 (GA) | Versión más reciente:v4.0 (GA) | Versiones anteriores:v3.0v2.1

Este contenido se aplica a:v3.0 (GA) | versiones más recientes:v4.0 (GA)v3.1 | versión anterior:v2.1

Este contenido se aplica a:v2.1 | Versión más reciente:v4.0 (GA)

Note

Document Intelligence v4.0 2024-11-30 (GA) API para el modelo de documento de identidad (ID) precompilado ahora admite documentos de identificación de todas las regiones de todo el mundo, incluida la cobertura ampliada en Norteamérica, América del Sur, Asia, Europa, África y Oceanía.

El modelo de documento de identificación (id.) de Document Intelligence combina el Reconocimiento óptico de caracteres (OCR) con modelos de aprendizaje profundo para analizar y extraer la información clave de los documentos de identificación. La API analiza los documentos de identidad (incluidos los siguientes) y devuelve una representación de datos JSON estructurada.

Region	Tipos de documento
Worldwide	Pasaporte
United States	Permiso de conducir, tarjeta de identificación, permiso de residencia (tarjeta verde), tarjeta de la Seguridad Social, identificación militar
India	Permiso de conducir, tarjeta PAN, tarjeta Aadhaar
Australia	Permiso de conducir, tarjeta con fotografía, documento de identificación con clave (incluida la versión digital)
Otros	Licencia de conducir, tarjeta de identificación, permiso de residencia

Document Intelligence puede analizar y extraer información de documentos de identificación (id.) expedidos por gobiernos mediante sus modelos de id. compilados previamente. Combina nuestras eficaces funcionalidades de Reconocimiento óptico de caracteres (OCR) con capacidades de reconocimiento de ID para extraer información clave de pasaportes de todo el mundo y de licencias de conducir de EE. UU. (de los 50 estados y del D.C.). La API de ID extrae información clave de estos documentos de identidad, como el nombre, el apellido, la fecha de nacimiento, el número del documento, etc. Esta API está disponible en Document Intelligence v2.1 como un servicio en la nube.

Procesamiento de documentos de identidad

El procesamiento de documentos de identidad implica extraer datos de documentos de identidad manualmente o mediante la tecnología basada en OCR. El procesamiento de documentos de identidad es un paso importante en cualquier operación empresarial en la que se necesite prueba de identidad. Entre los ejemplos se incluyen la verificación de clientes en bancos y otras instituciones financieras, aplicaciones hipotecas, visitas médicas, procesamiento de reclamaciones, industria de la hospitalidad, etc. Las personas proporcionan alguna prueba de su identidad a través de licencias de conducir, pasaportes y otros documentos similares para que la empresa pueda verificarlos de forma eficaz antes de proporcionar servicios y beneficios.

Licencia de conducir de EE. UU. de ejemplo procesada con Document Intelligence Studio

Imagen de un permiso de conducir de ejemplo.

Extracción de datos

El servicio de identificaciones precompiladas extrae los principales valores de pasaportes de todo el mundo y licencias de conducir de EE. UU. y los devuelve en una respuesta JSON estructurada organizada.

Ejemplo de permiso de conducir

Permiso de conducir de ejemplo

Ejemplo de Passport

Opciones de desarrollo

Documento de inteligencia v4.0: 2024-11-30 (GA) es compatible con las siguientes herramientas, aplicaciones y bibliotecas:

Feature	Resources	Id. de modelo
Id. de modelo de documentación	• Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript	prebuilt-idDocument

Documento de inteligencia v3.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Feature	Resources	Id. de modelo
Id. de modelo de documentación	• Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript	prebuilt-idDocument

Documento de inteligencia v3.0 admite las siguientes herramientas, aplicaciones y bibliotecas:

Feature	Resources	Id. de modelo
Id. de modelo de documentación	• Document Intelligence Studio • API REST • SDK de C# • SDK de Python • SDK de Java • SDK de JavaScript	prebuilt-idDocument

Documento de inteligencia v2.1 admite las siguientes herramientas, aplicaciones y bibliotecas:

Feature	Resources
Id. de modelo de documentación	● Herramienta de etiquetado de Documento de inteligencia ● API REST ● SDK de biblioteca cliente ● Contenedor Docker de Documento de inteligencia

Requisitos de entrada

Se admiten los siguientes formatos de archivo.

Model	PDF	Imagen: JPEG/JPG, PNG, BMP, TIFF, HEIF	Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Read	✔	✔	✔
Layout	✔	✔	✔
Documento general	✔	✔
Prebuilt	✔	✔
Extracción personalizada	✔	✔
Clasificación personalizada	✔	✔	✔

Fotos y escaneos: Para obtener mejores resultados, proporcione una foto clara o un escaneo de alta calidad por documento.
ARCHIVOS PDF y TIFF: para archivos PDF y TIFF, se pueden procesar hasta 2000 páginas. (Con una suscripción de nivel gratuito, solo se procesan las dos primeras páginas).
Tamaño del archivo: el tamaño de archivo para analizar documentos es de 500 MB para el nivel de pago (S0) y 4 MB para el nivel gratis (F0).
Dimensiones de imagen: las dimensiones deben estar entre 50 píxeles x 50 píxeles y 10 000 píxeles x 10 000 píxeles.
Bloqueos de contraseña: si los archivos PDF están bloqueados con contraseña, debe quitar el bloqueo antes del envío.
Alto del texto: el alto mínimo del texto que se va a extraer es de 12 píxeles para una imagen de 1024 x 768 píxeles. Esta dimensión corresponde aproximadamente a un texto de 8 puntos a 150 puntos por pulgada.
Entrenamiento de modelos personalizados: el número máximo de páginas para los datos de entrenamiento es 500 para el modelo de plantilla personalizado y 50 000 para el modelo neuronal personalizado.
Entrenamiento del modelo de extracción personalizada: el tamaño total de los datos de entrenamiento es de 50 MB para el modelo de plantilla y 1 GB para el modelo neuronal.
Entrenamiento del modelo de clasificación personalizada: el tamaño total de los datos de entrenamiento es de 1 GB con un máximo de 10 000 páginas. Para 2024-11-30 (GA), el tamaño total de los datos de entrenamiento es de 2 GB con un máximo de 10 000 páginas.
Tipos de archivo de Office (DOCX, XLSX, PPTX): el límite máximo de longitud de cadena es de 8 millones de caracteres.

Formatos de archivo admitidos: JPEG, PNG, PDF y TIFF.
Número admitido de páginas para archivos PDF y TIFF hasta 2000 páginas o solo las dos primeras páginas para suscriptores de nivel gratuito.
Tamaño de archivo admitido: menos de 50 MB TOTAL; píxeles mínimos: 50 x 50 px; píxeles máximos de 10 000 x 10 000 px.

Extracción de datos del modelo de documento de identificación

Extracción de datos, incluidos el nombre, la fecha de nacimiento y la fecha de expiración, de los documentos de identificación. Necesita los siguientes recursos:

Una suscripción a Azure (se puede crear de forma gratuita).
Una instancia de Document Intelligence en el Azure Portal. Puede usar el plan de tarifa gratuito (F0) para probar el servicio. Después de implementar el recurso, seleccione Ir al recurso para obtener la clave y el punto de conexión.

Recorte de pantalla de ubicación de las claves y el punto de conexión en Azure Portal.

Note

Document Intelligence Studio está disponible con las API v3.1 y v3.0 y versiones posteriores.

En la página principal de Estudio de Documento de inteligencia, seleccione documentos de identidad.
Puede analizar la factura de muestra o cargar sus propios archivos.
Seleccione el botón Ejecutar análisis y, si es necesario, configure las Opciones de Análisis:

Pruebe Document Intelligence Studio.

Herramienta de etiquetado de ejemplo de Inteligencia de documentos

Vaya a Herramienta de ejemplo de Document Intelligence.
En la página principal de la herramienta de ejemplo, seleccione el icono Use prebuilt model to get data (Usar un modelo precompilado para obtener datos).
Seleccione el Tipo de formulario que quiere analizar en el menú desplegable.
Elija una dirección URL para el archivo que quiere analizar entre las opciones siguientes:
En el campo Origen, seleccione URL en el menú desplegable, pegue la dirección URL seleccionada y seleccione el botón Capturar.
En el campo Punto de conexión de Inteligencia de documentos, pegue el punto de conexión que obtuvo con la suscripción de Inteligencia de documentos.
En el campo clave, pegue la clave que obtuvo del recurso de Document Intelligence.
Seleccione Run analysis (Ejecutar análisis). La herramienta de etiquetado de ejemplo de Document Intelligence llama a la API Analyze Prebuilt y analiza el documento.
Vea los resultados: consulte los pares clave-valor extraídos, los elementos de línea, el texto resaltado extraído y las tablas detectadas.
Descargue el archivo de salida JSON para ver los resultados detallados.
- El nodo "readResults" contiene cada línea de texto con su posición de cuadro de límite correspondiente en la página.
- El nodo "selectionMarks" muestra todas las marcas de selección (casilla, botón de opción) y si su estado es seleccionado o no seleccionado.
- En la sección "pageResults" se incluyen las tablas extraídas. Para cada tabla, Document Intelligence extrae el texto, el índice de filas y columnas, la separación de filas y columnas, el cuadro de límite, etc.
- El campo "documentResults" contiene información de pares clave-valor y de elementos de línea para las partes más importantes del documento.

Note

La herramienta de etiquetado de ejemplo no admite el formato de archivo BMP. Esta restricción es una limitación de la herramienta, no del servicio Documento de inteligencia.

Extracciones de campos

Para ver los campos de extracción de documentos admitidos, consulte la página esquema del modelo de documento de identificador en nuestro repositorio de ejemplo de GitHub.

Tipos de documento admitidos

El modelo de documento de identificación admite actualmente la extracción de licencias de conducir de EE. UU. y la página biográfica de pasaportes internacionales (excepto visas y otros documentos de viaje).

Campos extraídos

Name	Type	Description	Value
Country	country	Código de país conforme con la norma ISO 3166 estándar.	"USA"
DateOfBirth	date	Fecha de nacimiento en formato AAAA-MM-DD.	"1980-01-01"
DateOfExpiration	date	Fecha de expiración en formato AAAA-MM-DD.	"2019-05-05"
DocumentNumber	string	Número de pasaporte, número de permiso de conducir, etc. pertinente.	"340020013"
FirstName	string	Nombre extraído e inicial del segundo nombre, si procede.	"JENNIFER"
LastName	string	Apellido extraído	"BROOKS"
Nationality	country	Código de país conforme con la norma ISO 3166 estándar.	"USA"
Sex	gender	Los valores extraídos posibles son "M", "F", "X"	"F"
MachineReadableZone	object	`MRZ` del pasaporte extraída, incluidas dos líneas de 44 caracteres cada una	"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307 715816<"
DocumentType	string	Tipo de documento, por ejemplo, pasaporte o permiso de conducir.	"passport"
Address	string	Dirección extraída (solo permiso de conducir)	"123 STREET ADDRESS YOUR CITY WA 99999-1234"
Region	string	Valor extraído de región, estado, provincia, etc. (solo licencia de conducir)	"Washington"

Guía de migración

Siga la Guía de migración de Document Intelligence v3.1 para obtener información sobre cómo usar la versión v3.0 en las aplicaciones y flujos de trabajo.

Pasos siguientes

Pruebe a procesar sus propios formularios y documentos con Document Intelligence Studio.
Complete una guía de Inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Encuentre más ejemplos en GitHub.

Encuentre más ejemplos en GitHub.

Pruebe a procesar sus propios formularios y documentos con la Herramienta de etiquetado de ejemplo de Inteligencia de documentos.
Complete una guía de Inicio rápido de Document Intelligence y empiece a crear una aplicación de procesamiento de documentos en el lenguaje de desarrollo que prefiera.

Comentarios

¿Le ha resultado útil esta página?

Last updated on 2025-11-18

Compartir a través de

Modelo de documento de identificación de Document Intelligence

Procesamiento de documentos de identidad

Extracción de datos

Ejemplo de permiso de conducir

Ejemplo de Passport

Opciones de desarrollo

Requisitos de entrada

Extracción de datos del modelo de documento de identificación

Herramienta de etiquetado de ejemplo de Inteligencia de documentos

Extracciones de campos

Tipos de documento admitidos

Campos extraídos

Guía de migración

Pasos siguientes

Comentarios

Recursos adicionales