Partilhar via


Ações e padrões de utilização de ferramentas

Ao construir agentes, decida como o seu agente interage com sistemas externos e realiza ações para além da simples recuperação de informação. Este artigo descreve três padrões-chave para implementar capacidades de utilização e ação de ferramentas na arquitetura do seu agente:

Cada padrão responde a diferentes necessidades arquitetónicas, desde a conectividade básica da API até à sofisticada orquestração multi-agente. Compreender estas abordagens ajuda-o a escolher a estratégia certa de utilização de ferramentas para os seus requisitos e restrições específicos.

Integração com plugins API

Os plugins de API utilizam especificações OpenAPI para fornecer interfaces padronizadas para integração de serviços externos. Estes plugins oferecem configurações simples e estáticas, adequadas para cenários simples de integração de serviços.

Diagrama da arquitetura dos plugins API mostrando integração baseada em especificações OpenAPI com configuração estática e capacidades limitadas de múltiplas voltas.

Os plugins de API não gerem por defeito interações multi-rodadas ou conscientes do contexto sem a intervenção do programador para armazenar e manter o histórico de pedidos. Definições pré-definidas da API estabelecidas durante a criação do plugin determinam o corte da carga útil de resposta ou o tratamento incompatível dos dados.

Esta abordagem funciona bem para integrações simples de serviços sem estado, onde padrões consistentes de pedido-resposta cumprem os requisitos do agente sem necessidades complexas de orquestração.

Implementação do Protocolo de Contexto do Modelo

O Protocolo de Contexto do Modelo (MCP) é um protocolo open source otimizado para a utilização de ferramentas por agentes. Pressupõe-se a existência de camadas de orquestração para selecionar ferramentas apropriadas durante os processos de descoberta. Os servidores MCP apresentam ferramentas sem negociar ou adaptar-se à invocação de limitações de agentes.

Diagrama da arquitetura MCP que mostra a descoberta e integração de ferramentas baseadas em protocolos com conjuntos dinâmicos de ferramentas e manutenção independente de servidores.

O MCP permite que conjuntos dinâmicos de ferramentas sejam expostos a agentes, reduzindo a sobrecarga dos programadores para atualizar ou adicionar APIs às capacidades dos agentes. Esta arquitetura suporta modelos de propriedade separados onde diferentes programadores podem manter servidores MCP e ferramentas incluídas independentemente das equipas de desenvolvimento de agentes.

O agente invocador é responsável por aceitar ou descartar esquemas ou respostas de ferramentas incompatíveis. Esta abordagem proporciona flexibilidade, mas requer mecanismos robustos de gestão de erros e verificação de compatibilidade.

Comunicação entre agentes

Os protocolos agente-a-agente (A2A) permitem interações entre múltiplas entidades melhoradas por IA, onde ambos os participantes podem negociar e adaptar as interações de forma dinâmica. O A2A da Linux Foundation representa uma implementação open source otimizada para cenários complexos entre agentes.

Esta arquitetura suporta padrões de agente líder-equipa onde múltiplas entidades podem negociar tarefas dinamicamente, incluindo mudanças de modalidade, como imagens ou processamento de vídeo. O protocolo permite uma coordenação sofisticada entre agentes especializados para realizar fluxos de trabalho complexos que requerem capacidades diversas.

Os protocolos A2A funcionam melhor para cenários que requerem distribuição dinâmica de tarefas, acesso a capacidades especializadas ou orquestração complexa de fluxos de trabalho que beneficie de múltiplas entidades de IA a trabalharem em colaboração.

Saiba mais: padrões de orquestração de agentes de IA