Partilhar via


Melhores práticas para melhorar o desempenho dos agentes conversacionais

Evite problemas de desempenho em agentes conversacionais compreendendo os pontos de falha comuns e seguindo as melhores práticas.

Quotas e limites

Compreenda quotas e limites, como RPM (pedido por minuto, onde o pedido é uma mensagem enviada a um agente) e o número de pedidos Power Platform permitidos num prazo de 24 horas.

As quotas aplicam-se aos seus agentes, juntamente com as limitações de capacidade associadas a um plano Microsoft Copilot Studio.

Otimize o seu agente para desempenho

Para otimizar o desempenho do seu agente, considere as seguintes melhores práticas:

  • Coloque chamadas de API e invocações de conectores estrategicamente nos seus fluxos de conversa para evitar que os utilizadores esperem por múltiplas conclusãos.
  • Quando aplicável, a cache recolhia informação usando variáveis, em vez de fazer múltiplas chamadas de API ou invocações de fluxo.
  • Os fluxos de cloud invocados pelos agentes do Copilot Studio podem introduzir latência. Considere usar chamadas diretas de conector ou o nó Send HTTP Request em vez disso.
  • Compreenda o equilíbrio entre desempenho e complexidade do NLU clássico e da orquestração generativa no Copilot Studio. Os modelos NLU funcionam bem para intenções específicas, mas têm dificuldades com consultas complexas. Os modelos de IA generativa lidam com uma gama mais ampla de entradas, mas podem introduzir latência.
  • Liga o modo expresso.

Otimize o seu fluxo na cloud para desempenho

Se o seu agente chamar o fluxo Power Automate, certifique-se de que os fluxos na nuvem estão otimizados.