Partilhar via


Utilizar um agente autónomo no Copilot Studio para processamento de documentos

O agente de Processamento de Documentos é um agente autônomo que Copilot Studio usa IA generativa para processar documentos.

Sugestão

O agente gerenciado pelo processador de documentos é uma solução empacotada para processamento de documentos de ponta a ponta. Ele lida com extração, validação, monitoramento humano e exportação para aplicativos downstream. Este artigo mostra a arquitetura de referência para usar um agente autônomo para Copilot Studio processar documentos. Você pode adaptar o exemplo de arquitetura para diferentes cenários e setores.

Diagrama da arquitetura

Diagrama que mostra o fluxo de trabalho para usar um agente autônomo no Copilot Studio processamento de documentos.

Instruções do agente

As instruções a seguir criam o agente autônomo:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

Fluxos de Trabalho

Há dois fluxos de trabalho importantes relacionados ao agente:

  • Processamento de documentos: este fluxo de trabalho explica como o agente processa documentos.
  • Configuração: este fluxo de trabalho detalha as etapas para configurar o agente para processamento autônomo de documentos.

Fluxo de processamento de documentos

O fluxo de processamento de documentos funciona como uma máquina de estado. O agente atua como um orquestrador e o estado atual é armazenado na tabela Dataverse Eventos de Processamento de Dados. Veja como funciona o processo:

  1. Um gatilho identifica quando um novo documento está pronto para processamento. Isso é mostrado na área Fontes de dados no diagrama de arquitetura. Os fluxos de agente verificam diretórios como caixas de correio ou SharePoint pastas do Outlook. Quando um documento é adicionado a qualquer diretório, o fluxo do agente armazena o documento na tabela Eventos de Processamento de Dados com o estatuto Novo e envia uma mensagem ao agente: Process the document: {ID}.

    • Todas as tentativas de adicionar documentos ou atualizar estatuto na tabela Eventos de Processamento de Dados seguem a Default configuração em Power Automate. O fluxo tenta novamente até quatro vezes com um intervalo exponencial em solicitações que retornam estatuto 408, 429 ou 5xx e em quaisquer exceções de conectividade.
    • Se todas as tentativas de repetição falharem, depure e verifique o histórico de execução para Power Automate a ação que não foi executada.
  2. As instruções do agente dizem-lhe para chamar a Document Extraction ação quando lhe for pedido para processar um documento. A ação é executada e a ID da mensagem é passada.

  3. A Document Extraction ação é um fluxo de agente que recebe uma ID de Evento de Processamento de Dados como entrada e:

    • Obtém o documento armazenado Dataverse.
    • Envia-o para um prompt de IA para AI Builder processar. Este prompt usa.o GPT 4 para:
      • Extraia todas as informações relevantes do documento.
      • Formate essas informações como um documento JSON.
    • Armazena as informações extraídas na mesma linha de Evento de Processamento de Dados.
    • Atualiza o estatuto do documento para Processed.
  4. Um Dataverse gatilho (fluxo de agente) monitora o estatuto de todos os documentos em Eventos de Processamento de Dados e notifica o agente quando um estatuto muda com a mensagem: The status of document {ID} changed to {Status}

  5. As instruções do agente dizem a ele para chamar a Document Validation ação quando o estatuto de um documento for alterado para Processado. A ação é executada e a ID da mensagem é passada.

  6. A Document Validation ação é um fluxo de agente que recebe uma ID de Evento de Processamento de Dados como entrada e:

    • Obtém os dados extraídos armazenados em Dataverse.
    • Envia-o para um prompt de IA para AI Builder validar. Este prompt usa.o GPT 4 para:
      • Verifique o JSON extraído em relação a regras de formato como dates must be in X format.
      • Verifique o JSON extraído em relação às regras de negócios como the author of the document must be in the Accounts table in Dataverse.
    • Se a validação for bem-sucedida, ele atualizará o estatuto do documento para Validated.
    • Caso contrário, ele atualiza o estatuto do documento para Manual Review.
  7. Se o estatuto do documento mudar para Validated, as instruções dizem ao agente para chamar a Document Export ação. A ação é executada e a ID da mensagem é passada.

  8. A ação Exportação de Documento é um fluxo de agente que recebe uma ID de Evento de Processamento de Dados como entrada e:

    • Obtém os dados extraídos armazenados em Dataverse.
    • Exporta esses dados para o sistema de destino, como a tabela Dataverse Faturas.
  9. Se o estatuto do documento mudar para Manual Review, as instruções dizem ao agente para chamar a Manual Review ação. A ação é executada e a ID da mensagem é passada.

  10. A Manual Review ação é um fluxo de agente que recebe uma ID de Evento de Processamento de Dados como entrada e:

    • Obtém os dados extraídos armazenados em Dataverse.
    • Cria uma solicitação de Aprovações para o administrador do agente, compartilhando um link para um aplicativo da Estação de Validação onde o utilizador pode editar os dados extraídos e validar manualmente. Esta validação manual define o estado do documento Validated.
  11. Após a revisão manual, se o estatuto do documento for Validated, a etapa 7 é executada.

Os usuários também podem enviar manualmente documentos para o agente processar usando a página de bate-papo ou Copilot Studio qualquer canal onde publicaram o agente.

Quando você fizer isso:

  • O documento é carregado na tabela Eventos de processamento de dados.
  • O agente notifica a si mesmo que um novo documento foi importado.
  • O prompt de extração é executado para fornecer uma visualização do que é exportado no painel de chat.
  • O documento é processado conforme descrito neste fluxo, a partir da etapa 2.

Fluxo de trabalho de configuração

O agente precisa de várias definições para operar de forma autônoma. Para facilitar isso, há uma experiência de configuração abrangente. Eis os passos:

  1. Instale o Agente de Processamento de Documentos em Copilot Studio. A solução do agente tem:
    • Uma tabela de Configuração de Processamento de Documentos.
    • Um aplicativo Validation Station Canvas para monitoramento.
    • Referências de conexão usadas pelo agente (Dataverse, Copilot Studio, PowerApps for Admins).
    • Referências de conexão usadas pelos gatilhos que iniciam o fluxo de trabalho do agente (Outlook, SharePoint).
    • Variáveis de ambiente utilizadas pelos gatilhos.
  2. Inicie o assistente de configuração do agente. Esta é a última etapa do assistente de instalação Copilot Studio. Ele orienta você através deste fluxo:
    1. Carregue um documento de exemplo.
    2. O sistema envia o documento carregado para o prompt de extração do agente.
    3. O conteúdo extraído e o tipo de documento são exibidos. Selecione quais partes dos dados extraídos você deseja exportar para o sistema. Isso cria um esquema que é armazenado na tabela Configuração de Processamento de Documentos e usado durante a ação de exportação de documentos. Você pode entrar no modo avançado para alterar o prompt de IA usado na ação de extração de documentos para personalizá-lo.
    4. Defina regras de validação usando uma interface do utilizador simples que adiciona regras ao prompt usado na ação de validação do documento. Você também pode entrar no modo avançado para alterar o prompt de IA diretamente.
    5. Digite o endereço de e-mail do administrador do agente quando solicitado. Isso é usado na ação de revisão manual ao criar a solicitação de aprovação. Você também pode adicionar uma mensagem personalizada para o aprovador. Essas informações são salvas nas variáveis de ambiente que acompanham a solução.
    6. Escolha uma fonte de documento em uma lista. Esses gatilhos iniciam o fluxo de processamento de documentos e geralmente precisam de uma referência de conexão e algumas variáveis de ambiente (como nome da caixa de correio ou endereço da pasta), dependendo da fonte do documento selecionada.
    7. Conclua a configuração. Isso cria uma Dataverse tabela no sistema com as colunas selecionadas anteriormente e exporta o documento usado no assistente para essa tabela.

Componentes

Aqui estão os principais componentes envolvidos na criação e implantação de um agente autônomo para processamento de Copilot Studio documentos.

  • Copilot Studio faz parte de soluções no-code Microsoft Power Platform ou low-code. Copilot Studio é uma ferramenta gráfica de baixo código para criar um agente, incluindo automação de edifícios com fluxos de agentes, e estender um Microsoft 365 Copilot com seus dados e cenários corporativos.
  • Power Apps faz parte de soluções no-code Microsoft Power Platform ou low-code. Power Apps é um conjunto de aplicativos, serviços, conectores e uma plataforma de dados que oferece um ambiente de desenvolvimento rápido para criar aplicativos personalizados para sua empresa. Com Power Apps isso, crie rapidamente aplicativos de negócios personalizados que se conectam aos seus dados na plataforma de dados subjacente (Microsoft Dataverse) ou em muitas fontes de dados online e locais, como SharePoint Microsoft 365 o Dynamics 365 e o SQL Server.
  • Dataverse é um banco de dados operacional para cenários multiagentes. Ele oferece aos agentes uma plataforma segura e escalável para armazenar dados de estatuto, histórico e dados de conversa. Esse armazenamento centralizado permite que os agentes interajam e compartilhem dados, para que possam executar tarefas de forma autônoma ou semiautônoma. Dataverse também permite que os agentes se conectem e atualizem dados corporativos em diferentes aplicativos de negócios, como sistemas de CRM, para que os dados permaneçam consistentes e atualizados em toda a organização. Com Dataverse isso, as organizações gerenciam e governam os fluxos de trabalho dos agentes para obter fiabilidade, segurança e excelência operacional.

Detalhes do cenário

As organizações trabalham com documentos estruturados, como formulários, faturas, recibos e documentos de identidade, e documentos não estruturados, como memorandos, contratos e solicitações de feedback de clientes. Um dos principais desafios que as organizações enfrentam é automatizar o processamento de documentos para otimizar os processos de negócios. Você pode automatizar várias etapas, incluindo coleta, classificação, extração, validação, transformação e exportação de documentos. O uso de um Agente de Processamento de Documentos oferece muitos benefícios em relação ao processamento tradicional de documentos. O Agente de Processamento de Documentos funciona imediatamente como uma solução empacotada, portanto, você não precisa fazer etiquetagem de dados demorada durante a configuração. Seu design interativo permite processar grandes volumes de documentos com supervisão humana.

Considerações

Estas considerações implementam os pilares do Well-Architected do Power Platform, um conjunto de princípios orientadores que melhoram a qualidade de uma carga de trabalho. Mais informações em Well-Architected do Microsoft Power Platform.

Fiabilidade

O agente de Processamento de Documentos foi projetado para resiliência, recuperação e operações usando Power Platform componentes hospedados no Azure.

Segurança

O agente de Processamento de Documentos foi projetado para proteger a confidencialidade, a integridade e a disponibilidade de dados usando Power Platform componentes hospedados no Azure. Os documentos importados na tabela Eventos de Processamento de Dados são visíveis apenas para administradores de sistema. Nenhum dado adicional, como corpo do e-mail ou assunto, além dos documentos anexados é armazenado Dataverse. Todas as informações relacionadas ao cliente associadas a um documento são armazenadas na coluna Dados processados da tabela Eventos de processamento de dados. Você pode lidar com solicitações do GDPR consultando esta coluna.

Excelência Operacional

O agente de Processamento de Documentos foi projetado para melhorar as operações com monitoramento e insights, automatizando para obter eficiência usando Power Platform componentes hospedados no Azure.

Eficiência de Desempenho

O agente de Processamento de Documentos foi projetado para alcançar o desempenho por meio da otimização usando Power Platform componentes hospedados no Azure. O agente de processamento de documentos suporta o processamento de documentos de até 20MB de tamanho. A partir do benchmark mais recente, leva aproximadamente 48 segundos para processar um único documento de 2 MB de tamanho. O agente foi projetado para sustentar essa duração de processamento para mais de 1.000 documentos, dado que a fonte de documentos selecionada tem armazenamento suficiente. Para outras cotas e limitações, consulte Limites - Power Automate.

Otimização da Experiência

O agente de processamento de documentos é projetado para usuários de processamento de documentos, alcançando simplicidade e eficiência usando Power Platform componentes. O agente fornece experiência configurável para adicionar fontes de documentos, permitir extensibilidade para adicionar fontes de documentos adicionais.

IA responsável

O agente de processamento de documentos é projetado para alcançar padrões de IA responsáveis usando Power Platform componentes, incluindo Copilot Studio o que é projetado para recursos generativos de IA. Saiba mais: Perguntas frequentes Copilot Studio sobre IA responsável.

Contribuidores

A Microsoft mantém este artigo. Este artigo foi escrito pelos contribuidores a seguir.

Principais autores:

Próximos passos

  • Aprimore o fluxo de configuração para permitir que os usuários personalizem sua experiência de exportação. Por exemplo, adicione conectores pré-criados Power Platform para exportar para sistemas como SAP ou Salesforce e permita que os usuários personalizem o esquema para ajustar as entradas da tabela SAP ou Salesforce.
  • Aprimore o Fluxo de Configuração para permitir que os usuários se conectem a várias fontes de documentos ao mesmo tempo, como o Outlook e SharePoint.
  • Permita que o agente manipule vários tipos de documentos ao mesmo tempo, alterando dinamicamente o esquema usado na exportação com base no tipo de documento.