Compartir a través de


Mejores prácticas para mejorar el rendimiento de los agentes conversacionales

Evita problemas de rendimiento en agentes conversacionales comprendiendo los puntos de fallo comunes y siguiendo las mejores prácticas.

Cuotas y límites

Entiende cuotas y límites, como RPM (solicitud por minuto, cuando la solicitud es un mensaje enviado a un agente) y el número de solicitudes de Power Platform permitidas en un plazo de 24 horas.

Se aplican cuotas a tus agentes junto con las limitaciones de capacidad que conlleva un plan Microsoft Copilot Studio.

Optimiza a tu agente para el rendimiento

Para optimizar el rendimiento de tu agente, considera las siguientes mejores prácticas:

  • Coloca llamadas a API e invocaciones de conectores estratégicamente en tus flujos de conversación para evitar que los usuarios esperen múltiples completaciones.
  • Cuando corresponde, la caché recupera la información usando variables, en lugar de realizar múltiples llamadas a API o invocaciones de flujo.
  • Los flujos en la nube invocados por agentes de Copilot Studio pueden introducir latencia. Considera usar llamadas directas a conectores o el nodo Send HTTP Request en su lugar.
  • Entiende el equilibrio entre rendimiento y complejidad entre el NLU clásico y la orquestación generativa en Copilot Studio. Los modelos NLU funcionan bien para propósitos específicos pero tienen dificultades con consultas complejas. Los modelos de IA generativa gestionan una gama más amplia de entradas pero pueden introducir latencia.
  • Activa el modo exprés.

Optimiza tu flujo en la nube para mejorar el rendimiento

Si tu agente llama a Power Automate flow, asegúrate de que los flows en la nube estén optimizados.