Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Ideas de solución
En este artículo se describe una idea de solución. El arquitecto de la nube puede usar esta guía para ayudar a visualizar los componentes principales de una implementación típica de esta arquitectura. Use este artículo como punto de partida para diseñar una solución bien diseñada que se adapte a los requisitos específicos de la carga de trabajo.
Esta solución de procesamiento de contenido extrae datos y aplica esquemas a través de contenido multimodal a través de la puntuación de confianza y la validación del usuario. Procesa notificaciones, facturas, contratos y otros documentos mediante la extracción de información del contenido no estructurado y su asignación a formatos estructurados.
La arquitectura usa Microsoft Foundry, Azure Content Understanding, Azure OpenAI en Foundry Models y otros servicios de Azure para transformar grandes volúmenes de contenido no estructurado a través de canalizaciones de procesamiento controladas por eventos. Controla texto, imágenes, tablas y gráficos, y proporciona comprobaciones de calidad automatizadas y funcionalidades de revisión humana para flujos de trabajo de documentos empresariales.
Arquitectura
Descargue un archivo de Visio de esta arquitectura.
Flujo de trabajo
El siguiente flujo de trabajo corresponde al diagrama anterior:
Los usuarios cargan contenido bidireccional, como documentos, imágenes, contratos y facturas, a través de la interfaz front-end web. Los usuarios envían el contenido con requisitos de procesamiento específicos y esquemas de destino.
El sitio web de Azure Container Apps recibe la solicitud de carga de contenido e invoca la API de procesamiento hospedada en Container Apps. El equipo de software desarrolla código personalizado para ambos componentes para adaptarlos a este escenario. La API selecciona la canalización de procesamiento adecuada e inicia flujos de trabajo de análisis de contenido.
Container Apps administra el flujo de trabajo de procesamiento y conecta Content Understanding a Azure OpenAI.
Content Understanding realiza el reconocimiento óptico de caracteres (OCR) basado en aprendizaje automático y extrae texto de varios formatos de contenido, incluidas imágenes, tablas y gráficos.
Azure OpenAI con GPT Vision procesa el contenido extraído, lo asigna a esquemas personalizados o definidos por el sector y genera una salida JSON estructurada que incluye la puntuación de confianza.
El código de orquestación de Container Apps almacena resultados procesados, puntuaciones de confianza, asignaciones de esquemas y datos históricos de procesamiento para seguimientos de auditoría y mejora continua en Azure Cosmos DB.
El código de orquestación de Container Apps usa Azure Blob Storage para almacenar documentos de origen, artefactos de procesamiento intermedios y salidas estructuradas finales para la persistencia y recuperación de datos confiables.
Azure Queue Storage administra flujos de trabajo de procesamiento controlados por eventos entre los servicios de esta solución. Esta administración garantiza un control confiable de mensajes y la coordinación del procesamiento en los componentes de la canalización.
El sitio web del monitor de procesador de contenido muestra los resultados procesados a los usuarios a través de la interfaz web. Los usuarios pueden revisar la salida JSON estructurada, corregir cualquier inexactitud, agregar comentarios para contexto o comentarios y guardar los resultados validados finales en el sistema.
El procesador de contenido supervisa el sitio web que alimenta las métricas de procesamiento y los datos de comentarios de los usuarios directamente en los paneles de Power BI. Los datos procesados y los metadatos almacenados en Azure Cosmos DB proporcionan análisis sobre la canalización de procesamiento de contenido, incluida la información siguiente:
- Indicadores clave de rendimiento (KPI)
- Tasas de éxito
- Distribuciones de tipo de documento
- Tendencias de puntuación de confianza
- Patrones de corrección de usuarios
- Otras métricas operativas que admiten la optimización controlada por datos de la canalización de procesamiento de contenido
Componentes
Container Apps es una plataforma de contenedor sin servidor que ejecuta microservicios y aplicaciones en contenedores. En esta arquitectura, Container Apps hospeda la API de canalización de procesamiento que organiza el análisis de contenido, las coordenadas entre los servicios de inteligencia artificial y administra los flujos de trabajo de extracción y transformación. El equipo de ingeniería de software desarrolla el código personalizado.
Foundry es un servicio de inteligencia artificial administrado que proporciona acceso a modelos de lenguaje avanzados para el procesamiento y la generación de lenguaje natural. En esta arquitectura, Foundry proporciona la base para implementar y administrar modelos de IA usados en la canalización de procesamiento de contenido. También actúa como puerta de enlace a los servicios de inteligencia artificial conectados, como Content Understanding.
Azure OpenAI es un componente de Foundry que proporciona modelos de lenguaje, incluidos GPT-4o y GPT-4o mini. En esta arquitectura, Foundry hospeda los modelos como servicio. Estos modelos realizan la transformación de datos basada en esquemas, asignan contenido extraído a formatos estructurados y calculan las puntuaciones de confianza para la precisión de la extracción.
Content Understanding es un servicio de inteligencia artificial horizontal que analiza varios tipos de contenido multimedia, como audio, vídeo, texto e imágenes. Transforma el contenido en datos estructurados y buscables. En esta arquitectura, Content Understanding realiza OCR avanzado y extracción de contenido de documentos multimodales.
Azure Cosmos DB es un servicio de base de datos de varios modelos distribuido globalmente que proporciona una baja latencia garantizada y escalabilidad elástica. En esta arquitectura, Azure Cosmos DB almacena resultados procesados, puntuaciones de confianza, resultados de validación y datos históricos de procesamiento para seguimientos de auditoría y optimización del rendimiento.
Blob Storage es una solución de almacenamiento de objetos optimizada para almacenar grandes cantidades de datos no estructurados. En esta arquitectura, Blob Storage mantiene documentos de origen, artefactos de procesamiento intermedios y salidas estructuradas finales. Proporciona almacenamiento duradero y disponible globalmente.
Azure Container Registry es un servicio de Registro de Docker administrado que almacena y administra imágenes de contenedor. En esta arquitectura, Container Registry administra imágenes de contenedor con versiones para los componentes de canalización de procesamiento. Este sistema garantiza funcionalidades de implementación y reversión coherentes.
Power BI es una colección de servicios de software, aplicaciones y conectores que funcionan conjuntamente para ayudarle a crear, compartir y consumir información empresarial. En esta arquitectura, Power BI se conecta a Azure Cosmos DB y recibe métricas de procesamiento en tiempo real de la aplicación web de supervisión para ofrecer análisis sobre el rendimiento del procesamiento de documentos, los patrones de comentarios de los usuarios y los KPI operativos.
Alternativas
Esta arquitectura incluye varios componentes que puede sustituir por otros servicios o enfoques de Azure, en función de los requisitos funcionales y no funcionales de la carga de trabajo. Tenga en cuenta las siguientes alternativas y desventajas.
Enfoque de extracción de contenido
Enfoque actual: Esta solución usa Content Understanding para la extracción avanzada de contenido y OCR, combinada con Azure OpenAI para la asignación y transformación de esquemas. Este enfoque proporciona alta precisión para contenido multifase complejo y admite la personalización de esquema flexible.
Enfoque alternativo: Use Azure Document Intelligence para el procesamiento de documentos mediante modelos creados previamente para tipos de documentos comunes, como facturas, recibos y formularios. Este enfoque proporciona una implementación más rápida para los tipos de documento estándar, pero menos flexibilidad para esquemas personalizados.
Considere esta alternativa si la carga de trabajo tiene las siguientes características:
Los tipos de documento estándar se procesan principalmente con formatos bien definidos.
Necesita lograr un tiempo de comercialización más rápido mediante modelos de extracción preconfigurados.
Los requisitos de esquema se alinean con los modelos de inteligencia de documentos estándar.
Tiene recursos de desarrollo personalizado limitados para la asignación de esquemas.
Orquestación de procesamiento
Enfoque actual: Esta solución usa Container Apps para hospedar lógica de procesamiento personalizada que organiza la canalización de análisis de contenido. Este enfoque proporciona un control máximo sobre los flujos de trabajo de procesamiento, el control de errores y la integración de lógica de negocios personalizada.
Enfoque alternativo: Use Azure Logic Apps o Azure Functions para la orquestación de flujos de trabajo con conectores integrados a servicios de IA. Este enfoque proporciona ventajas de diseño de flujo de trabajo visual y servicio administrado, pero menos control sobre la lógica de procesamiento.
Considere esta alternativa si la carga de trabajo tiene las siguientes características:
Prefiere el diseño de flujo de trabajo visual sobre el desarrollo de código personalizado.
Los flujos de trabajo de procesamiento son relativamente simples y usan lógica condicional estándar.
Quiere minimizar la sobrecarga de administración de la infraestructura.
Su equipo tiene más experiencia en soluciones de código bajo y sin código que en aplicaciones en contenedor.
Detalles del escenario
Algunas organizaciones extraen datos significativos diariamente de grandes volúmenes de contenido uniestructurado y replicado. El procesamiento manual tradicional de documentos, como contratos, facturas, notificaciones e informes de cumplimiento, es lento, propenso a errores y no se escala con el crecimiento empresarial. Como resultado, las organizaciones se enfrentan a una calidad de datos incoherente, a la falta de estandarización y a la dificultad de integrar la información extraída en procesos empresariales descendentes. Esta solución de procesamiento de contenido soluciona esos problemas.
La solución usa servicios avanzados de inteligencia artificial para extraer, transformar y validar automáticamente el contenido de varios tipos de documentos. El sistema proporciona puntuación de confianza para habilitar el procesamiento automatizado para extracciones de alta confianza, al tiempo que marca los resultados de menor confianza para la revisión humana. Este enfoque garantiza la velocidad y la precisión al tiempo que mantiene la flexibilidad de controlar diversos formatos de contenido y esquemas empresariales personalizados.
Casos de uso potenciales
Tenga en cuenta los siguientes casos de uso potenciales.
Procesamiento de servicios financieros
Automatización del procesamiento de notificaciones: Extraiga los detalles de la póliza, las evaluaciones de daños y las estimaciones de costos de los documentos de reclamaciones de seguros, las fotos y los informes del ajustador mediante comprobaciones automatizadas de validación y cumplimiento.
Procesamiento de facturas y contratos: Extraiga automáticamente la información del proveedor, los elementos de línea, los términos y las condiciones de las facturas y los contratos, y asígnelos a sistemas empresariales mediante la puntuación de confianza para los flujos de trabajo de aprobación.
Análisis de documentos normativos: Procese los archivos normativos, los informes de cumplimiento y la documentación de auditoría para extraer métricas clave y garantizar el cumplimiento de las normativas financieras y los requisitos de informes.
Documentación de atención sanitaria
Procesamiento clínico de documentos: Extraiga información de pacientes, diagnósticos, planes de tratamiento e información de medicamentos de registros médicos, informes de laboratorio y notas clínicas para la integración electrónica de registros sanitarios.
Automatización de facturación médica: Procese reclamaciones médicas, declaraciones de facturación y formularios de seguro para extraer códigos de procedimiento, detalles de pacientes e información de cobertura para flujos de trabajo de facturación automatizados.
Extracción de datos de investigación: Analice documentos de ensayos clínicos, documentos de investigación y formularios de consentimiento de pacientes para extraer parámetros de estudio, resultados y datos de cumplimiento para flujos de trabajo de investigación médica.
Legal y cumplimiento
Análisis y extracción de contratos: Procesar contratos legales, acuerdos y modificaciones para extraer términos clave, obligaciones, fechas y partes para la gestión de contratos y la supervisión del cumplimiento.
Detección de documentos legales: Analice los resúmenes legales, las deposiciones y los archivos de casos para extraer hechos, citas y pruebas pertinentes para la preparación del caso y el soporte de litigios.
Documentación de cumplimiento: Procese envíos normativos, informes de auditoría y certificados de cumplimiento para extraer los requisitos, los resultados y las acciones correctivas para los flujos de trabajo de gobernanza.
Cadena de fabricación y suministro
Procesamiento de documentación de calidad: Extraiga los resultados de inspección, los datos de prueba y los detalles de certificación de los documentos y certificados de control de calidad. Use los datos extraídos para el seguimiento de cumplimiento y la mejora del proceso.
Documentación del proveedor: Procese certificaciones de proveedores, especificaciones de materiales y documentos de envío para extraer datos de cumplimiento e información de la cadena de suministro para los flujos de trabajo de adquisición.
Análisis de registros de mantenimiento: Extraiga los datos de equipos, las programaciones de mantenimiento y los historiales de reparación de la documentación técnica para el mantenimiento predictivo y los sistemas de administración de activos.
Consideraciones
Estas consideraciones implementan los pilares del Azure Well-Architected Framework, que es un conjunto de principios rectores que puede utilizar para mejorar la calidad de una carga de trabajo. Para obtener más información, vea Well-Architected Framework.
Optimización de costos
La optimización de costos se centra en formas de reducir los gastos innecesarios y mejorar las eficiencias operativas. Para obtener más información, consulte Lista de comprobación de revisión de diseño para la optimización de costes.
Para más información sobre los costos para ejecutar este escenario, consulte la estimación preconfigurada en la calculadora de precios de Azure.
Los precios varían según la región y el uso, por lo que no puede predecir los costos exactos de la implementación. La mayoría de los recursos de Azure de esta infraestructura siguen los planes de tarifa basados en el uso. Pero Container Registry incurre en un costo fijo diario para cada registro.
Implementación de este escenario
Para implementar una implementación de esta arquitectura, siga los pasos del repositorio de GitHub.
Colaboradores
Microsoft mantiene este artículo. Los colaboradores siguientes escribieron este artículo.
Autor principal:
- Salomón Pickett | Ingeniero de software II
Otros colaboradores:
- Anish Arora | Ingeniero sénior de software
- Todd Herman | Ingeniero principal de software
- Malory Rose | Ingeniero sénior de software
Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.