Compartir a través de


Utilizar un agente autónomo en Copilot Studio para el procesamiento de documentos

El agente de procesamiento de documentos es un agente autónomo que utiliza IA generativa para procesar documentos. Copilot Studio

Propina

El agente administrado Procesador de documentos es una solución empaquetada para el procesamiento de documentos de extremo a extremo. Se encarga de la extracción, la validación, la supervisión humana y la exportación a aplicaciones posteriores. Este artículo muestra la arquitectura de referencia para utilizar un agente autónomo para procesar documentos. Copilot Studio Puede adaptar el ejemplo de arquitectura para diferentes escenarios e industrias.

Diagrama de arquitectura

Diagrama que muestra el flujo de trabajo para utilizar un agente autónomo para el procesamiento de documentos. Copilot Studio

Instrucciones del agente

Las siguientes instrucciones crean el agente autónomo:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

Flujos de trabajo

Hay dos flujos de trabajo importantes relacionados con el agente:

  • Procesamiento de documentos: Este flujo de trabajo explica cómo el agente procesa los documentos.
  • Configuración: este flujo de trabajo detalla los pasos para configurar el agente para el procesamiento autónomo de documentos.

Flujo de procesamiento de documentos

El flujo de procesamiento de documentos funciona como una máquina de estados. El agente actúa como un orquestador y el estado actual se almacena en la tabla Eventos de procesamiento de datos en Dataverse. Así es como funciona el proceso:

  1. Un disparador identifica cuándo un nuevo documento está listo para ser procesado. Esto se muestra en el área Fuentes de datos del diagrama de arquitectura. Los flujos del agente escanean directorios como buzones de correo o carpetas de Outlook. SharePoint Cuando se agrega un documento a cualquier directorio, el flujo del agente almacena el documento en la tabla Eventos de procesamiento de datos con el estado Nuevo y envía un mensaje al agente: Process the document: {ID}.

    • Todos los intentos de agregar documentos o actualizar estados en la tabla Eventos de procesamiento de datos siguen la Default configuración en Power Automate. El flujo vuelve a intentarlo hasta cuatro veces con un intervalo exponencial en las solicitudes que devuelven los estados 408, 429 o 5xx y en cualquier excepción de conectividad.
    • Si todos los intentos de reintento fallan, depure y verifique el historial de ejecución en Power Automate para encontrar la acción que no se ejecutó.
  2. Las instrucciones del agente le indican que llame a la acción cuando se le solicita procesar un documento. Document Extraction La acción se ejecuta y se transmite el ID del mensaje.

  3. La acción es un flujo de agente que recibe un ID de evento de procesamiento de datos como entrada y: Document Extraction

    • Obtiene el documento almacenado en Dataverse.
    • Lo envía a un indicador de IA para que lo procese. AI Builder Este mensaje utiliza GPT 4.o para:
      • Extraer toda la información relevante del documento.
      • Formatee esta información como un documento JSON.
    • Almacena la información extraída en la misma fila de evento de procesamiento de datos.
    • Actualiza el estado del documento a Processed.
  4. Un disparador (flujo de agente) monitorea el estado de todos los documentos en eventos de procesamiento de datos y notifica al agente cuando un estado cambia con el mensaje: Dataverse The status of document {ID} changed to {Status}

  5. Las instrucciones del agente le indican que llame a la acción Document Validation cuando el estado de un documento cambia a Procesado. La acción se ejecuta y se transmite el ID del mensaje.

  6. La acción es un flujo de agente que recibe un ID de evento de procesamiento de datos como entrada y: Document Validation

    • Obtiene los datos extraídos almacenados en Dataverse.
    • Lo envía a un indicador de IA para validarlo. AI Builder Este mensaje utiliza GPT 4.o para:
      • Verifique el JSON extraído con reglas de formato como dates must be in X format.
      • Verifique el JSON extraído con reglas comerciales como the author of the document must be in the Accounts table in Dataverse.
    • Si la validación tiene éxito, actualiza el estado del documento a Validated.
    • De lo contrario, actualiza el estado del documento a Manual Review.
  7. Si el estado del documento cambia a Validated, las instrucciones le indican al agente que llame a la Document Export acción. La acción se ejecuta y se transmite el ID del mensaje.

  8. La acción Exportar documento es un flujo de agente que recibe un ID de evento de procesamiento de datos como entrada y:

    • Obtiene los datos extraídos almacenados en Dataverse.
    • Exporta estos datos al sistema de destino, como la tabla Facturas en Dataverse.
  9. Si el estado del documento cambia a Manual Review, las instrucciones le indican al agente que llame a la Manual Review acción. La acción se ejecuta y se transmite el ID del mensaje.

  10. La acción es un flujo de agente que recibe un ID de evento de procesamiento de datos como entrada y: Manual Review

    • Obtiene los datos extraídos almacenados en Dataverse.
    • Crea una solicitud de aprobaciones para el administrador del agente y comparte un enlace a una aplicación de Validation Station donde el usuario puede editar los datos extraídos y validarlos manualmente. Esta validación manual establece el estado del documento en Validated.
  11. Después de la revisión manual, si el estado del documento es Validated, se ejecuta el paso 7.

Los usuarios también pueden enviar documentos manualmente para que el agente los procese utilizando la página de chat o cualquier canal donde hayan publicado al agente. Copilot Studio

Cuando hagas esto:

  • El documento se carga en la tabla de Eventos de procesamiento de datos.
  • El agente se notifica a sí mismo que se importó un nuevo documento.
  • El mensaje de extracción se ejecuta para brindarle una vista previa de lo que se exporta en el panel de chat.
  • El documento se procesa como se describe en este flujo, comenzando desde el paso 2.

Flujo de trabajo de configuración

El agente necesita varias configuraciones para operar de forma autónoma. Para que esto sea más fácil, existe una experiencia de configuración integral. Estos son los pasos que se deben seguir:

  1. Instalar el agente de procesamiento de documentos en Copilot Studio. La solución del agente tiene:
    • Una tabla de configuración de procesamiento de documentos.
    • Una aplicación Canvas de Validation Station para monitoreo.
    • Referencias de conexión utilizadas por el agente (Dataverse, Copilot Studio, PowerApps for Admins).
    • Referencias de conexión utilizadas por los desencadenadores que inician el flujo de trabajo del agente (Outlook, SharePoint).
    • Variables de entorno utilizadas por los activadores.
  2. Inicie el asistente de configuración del agente. Este es el último paso del asistente de instalación Copilot Studio. Te guía a través de este flujo:
    1. Sube un documento de muestra.
    2. El sistema envía el documento cargado al aviso de extracción del agente.
    3. Aparecen el contenido extraído y el tipo de documento. Seleccione qué partes de los datos extraídos desea exportar al sistema. Esto crea un esquema que se almacena en la tabla de configuración de procesamiento de documentos y se utiliza durante la acción de exportación del documento. Puede ingresar al modo avanzado para cambiar el mensaje de IA utilizado en la acción de extracción de documentos para personalizarlo.
    4. Defina reglas de validación utilizando una interfaz de usuario simple que agrega reglas al mensaje utilizado en la acción de validación del documento. También puedes ingresar al modo avanzado para cambiar el mensaje de IA directamente.
    5. Ingrese la dirección de correo electrónico del administrador del agente cuando se le solicite. Esto se utiliza en la acción de revisión manual al crear la solicitud de aprobación. También puede agregar un mensaje personalizado para el aprobador. Esta información se guarda en las variables de entorno que vienen con la solución.
    6. Seleccione una fuente de documento de una lista. Estos activadores inician el flujo de procesamiento del documento y, generalmente, necesitan una referencia de conexión y algunas variables de entorno (como el nombre del buzón o la dirección de la carpeta), según la fuente del documento que seleccione.
    7. Finalizar la configuración. Esto crea una tabla en el sistema con las columnas que seleccionó anteriormente y exporta el documento que utilizó en el asistente a esta tabla. Dataverse

Componentes

Estos son los componentes clave involucrados en la construcción e implementación de un agente autónomo para el procesamiento de documentos en Copilot Studio.

  • Copilot Studio es parte de soluciones sin código o de código bajo. Microsoft Power Platform Copilot Studio es una herramienta gráfica de bajo código para crear un agente, incluida la automatización de edificios con flujos de agentes, y ampliar un Copilot con sus datos y escenarios empresariales. Microsoft 365
  • Power Apps es parte de soluciones sin código o de código bajo. Microsoft Power Platform Power Apps es un conjunto de aplicaciones, servicios, conectores y una plataforma de datos que le brinda un entorno de desarrollo rápido para crear aplicaciones personalizadas para su negocio. Con Power Apps, cree rápidamente aplicaciones empresariales personalizadas que se conecten a sus datos en la plataforma de datos subyacente (Microsoft Dataverse) o en muchas fuentes de datos locales y en línea, como SharePoint, Microsoft 365, Dynamics 365 y SQL Server.
  • Dataverse Es una base de datos operativa para escenarios multiagente. Proporciona a los agentes una plataforma segura y escalable para almacenar datos de estado, historial y datos de conversaciones. Este almacenamiento centralizado permite a los agentes interactuar y compartir datos, para que puedan realizar tareas de forma autónoma o semiautónoma. Dataverse También permite que los agentes se conecten y actualicen datos comerciales en diferentes aplicaciones comerciales, como sistemas CRM, para que los datos se mantengan consistentes y actualizados en toda la organización. Con Dataverse, las organizaciones administran y gobiernan los flujos de trabajo de los agentes para lograr confiabilidad, seguridad y excelencia operativa.

Detalles del escenario

Las organizaciones trabajan con documentos estructurados, como formularios, facturas, recibos y documentos de identidad, y con documentos no estructurados, como memorandos, contratos y solicitudes de comentarios de clientes. Uno de los desafíos clave que enfrentan las organizaciones es automatizar el procesamiento de documentos para optimizar los procesos de negocio. Puede automatizar varios pasos, incluida la recopilación, clasificación, extracción, validación, transformación y exportación de documentos. El uso de un agente de procesamiento de documentos ofrece muchos beneficios sobre el procesamiento de documentos tradicional. El agente de procesamiento de documentos funciona como una solución empaquetada, por lo que no necesita realizar un etiquetado de datos que consume mucho tiempo durante la configuración. Su diseño interactivo le permite procesar grandes volúmenes de documentos con supervisión humana.

Consideraciones

Estas consideraciones implementan los pilares de Power Platform Well-Architected, un conjunto de principios rectores que mejoran la calidad de una carga de trabajo. Obtenga más información en Microsoft Power Platform Well-Architected.

Confiabilidad

El agente de procesamiento de documentos está diseñado para la resiliencia, la recuperación y las operaciones mediante el uso de componentes alojados en Azure. Power Platform

Seguridad

El agente de procesamiento de documentos está diseñado para proteger la confidencialidad, la integridad y la disponibilidad de los datos mediante el uso de componentes alojados en Azure. Power Platform Los documentos importados en la tabla Eventos de procesamiento de datos solo son visibles para los administradores del sistema. No se almacenan datos adicionales, como el cuerpo o el asunto del correo electrónico, aparte de los documentos adjuntos Dataverse. Toda la información relacionada con el cliente asociada a un documento se almacena en la columna Datos procesados de la tabla Eventos de procesamiento de datos. Puede gestionar solicitudes GDPR consultando esta columna.

Excelencia operativa

El agente de procesamiento de documentos está diseñado para mejorar las operaciones con supervisión y conocimientos, y automatizar para lograr eficiencia mediante el uso de componentes alojados en Azure. Power Platform

Eficiencia en el rendimiento

El agente de procesamiento de documentos está diseñado para lograr rendimiento a través de la optimización mediante el uso de componentes alojados en Azure. Power Platform El agente de procesamiento de documentos admite el procesamiento de documentos de hasta 20 MB de tamaño. Según el punto de referencia más reciente, se necesitan aproximadamente 48 segundos para procesar un solo documento de 2 MB de tamaño. El agente está diseñado para mantener esta duración de procesamiento para más de 1000 documentos, siempre que la fuente de documentos seleccionada tenga suficiente almacenamiento. Para conocer otras cuotas y limitaciones, consulte Límites - Power Automate.

Optimización de la experiencia

El agente de procesamiento de documentos está diseñado para usuarios de procesamiento de documentos al lograr simplicidad y eficiencia mediante el uso de componentes. Power Platform El agente proporciona una experiencia configurable para agregar fuentes de documentos y permite la extensibilidad para agregar fuentes de documentos adicionales.

IA responsable

El agente de procesamiento de documentos está diseñado para lograr estándares de IA responsables mediante el uso de componentes que incluyen funciones de IA generativa. Power Platform Copilot Studio Obtenga más información: Preguntas frecuentes sobre IA responsable para Copilot Studio.

Colaboradores

Microsoft mantiene este artículo. Los siguientes colaboradores escribieron este artículo.

Autores principales:

Pasos siguientes

  • Mejore el flujo de configuración para permitir que los usuarios personalicen su experiencia de exportación. Por ejemplo, agregue conectores prediseñados para exportar a sistemas como SAP o Salesforce y permita que los usuarios personalicen el esquema para que se ajuste a las entradas de las tablas de SAP o Salesforce. Power Platform
  • Mejore el flujo de configuración para permitir que los usuarios se conecten a múltiples fuentes de documentos al mismo tiempo, como Outlook y SharePoint.
  • Permita que el agente maneje múltiples tipos de documentos al mismo tiempo cambiando dinámicamente el esquema utilizado en la exportación según el tipo de documento.