Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Evite problemas de desempenho em agentes conversacionais compreendendo os pontos comuns de falha e seguindo as melhores práticas.
Cotas e limites
Entenda cotas e limites, como RPM (solicitação por minuto, onde a solicitação é uma mensagem enviada a um agente) e o número de requisições Power Platform permitidas em um período de 24 horas.
As cotas se aplicam aos seus agentes, junto com as limitações de capacidade que acompanham um plano Microsoft Copilot Studio.
Otimize seu agente para desempenho
Para otimizar seu corretor em desempenho, considere as seguintes melhores práticas:
- Coloque chamadas de API e invocações de conectores estrategicamente nos fluxos de conversa para evitar que os usuários esperem por múltiplas conclusãos.
- Quando aplicável, armazene em cache as informações usando variáveis, em vez de fazer múltiplas chamadas de API ou invocações de fluxo.
- Fluxos de nuvem invocados pelos agentes do Copilot Studio podem introduzir latência. Considere usar chamadas diretas de conector ou o nó Send HTTP Request em vez disso.
- Entenda a troca de desempenho e complexidade entre NLU Clássico e orquestração generativa no Copilot Studio. Modelos de NLU funcionam bem para intenções específicas, mas têm dificuldade com consultas complexas. Modelos de IA generativa lidam com uma gama maior de entradas, mas podem introduzir latência.
- Ative o modo expresso.
Otimize seu fluxo de nuvem para desempenho
Se seu agente chamar o fluxo do Power Automate, certifique-se de que os fluxos na nuvem estejam otimizados.
Certifique-se de entender os limites de limitação e capacidade dentro do Power Automate e da Power Platform. Cumprir esses limites melhora a escalabilidade do fluxo e o desempenho.
Aprenda sobre como solucionar problemas de fluxos lentos.