Partager via


Meilleures pratiques pour améliorer la performance des agents conversationnels

Évitez les problèmes de performance chez les agents conversationnels en comprenant les points de défaillance courants et en suivant les meilleures pratiques.

Quotas et limites

Comprenez les quotas et les limites, comme le RPM (demande par minute, où la demande est un message envoyé à un agent) et le nombre de requêtes Power Platform autorisées dans un délai de 24 heures.

Des quotas s’appliquent à vos agents, ainsi que les contraintes de capacité associées à un plan Microsoft Copilot Studio.

Optimisez votre agent pour la performance

Pour optimiser la performance de votre agent, considérez les meilleures pratiques suivantes :

  • Placez stratégiquement les appels API et les invocations de connecteurs dans vos flux de conversation pour éviter que les utilisateurs attendent plusieurs complétions.
  • Lorsque cela est applicable, il a récupéré en cache les informations en utilisant des variables, au lieu d’effectuer plusieurs appels API ou invocations de flux.
  • Les flux cloud invoqués par les agents de Copilot Studio peuvent introduire de la latence. Envisagez plutôt d’utiliser des appels directs de connecteurs ou le nœud Send HTTP Request .
  • Comprenez le compromis entre performance et complexité entre le NLU classique et l’orchestration générative dans Copilot Studio. Les modèles NLU fonctionnent bien pour des objectifs spécifiques mais ont du mal avec des requêtes complexes. Les modèles d’IA générative gèrent une gamme plus large d’entrées mais peuvent introduire de la latence.
  • Activez le mode express.

Optimisez votre flux cloud pour les performances

Si votre agent appelle un flux Power Automate, assurez-vous que les flux cloud sont optimisés.