Compartir a través de


Mejora las pruebas de los agentes con Copilot Studio Kit

Power CAT Copilot Studio Kit es una aplicación fácil de usar que permite comprobar las respuestas del agente. También incluye funcionalidades nativas, como la exportación e importación de Excel para la creación y las actualizaciones masivas.

Configuración, ejecución y análisis

Configure y ejecute pruebas en las API de Copilot Studio (Direct Line API) para evaluar las respuestas del agente con los resultados esperados.

Para enriquecer los resultados, recupere puntos de datos adicionales de Azure Application Insights y Dataverse mediante el análisis de registros de transcripción de conversación (como el nombre exacto del tema desencadenado y las puntuaciones de reconocimiento de intenciones).

Para las respuestas generadas por IA, que no son deterministas por naturaleza, use indicaciones para comparar la respuesta generada con una respuesta de muestra o instrucciones de validación.

Diagrama que muestra los componentes de Azure y Power Platform implicados en las pruebas y el análisis de las API de Direct Line de Copilot Studio, incluidos Azure Application Insights, AI Builder y Dataverse.

Tipos de prueba

La herramienta admite estos tipos de pruebas:

  • Coincidencia de respuesta
  • Datos adjuntos, como tarjetas adaptables
  • Coincidencia de tema (requiere Dataverse)
  • Respuestas generativas (requiere AI Builder para el análisis de respuesta y Application Insights para obtener más información sobre por qué no se generó una respuesta).
  • El tipo de prueba multiturno es un tipo de prueba especial. Consta de un conjunto de casos de prueba de tipos normales que se ejecutan en un orden especificado en el mismo contexto de conversación. Use pruebas de múltiples turnos para probar escenarios de principio a fin y para probar agentes personalizados con orquestación generativa.
  • La validación del plan permite a los creadores validar que sus agentes personalizados que usan orquestación generativa incluyen las herramientas esperadas. En lugar de evaluar lo que dice el agente, este tipo de prueba comprueba que el plan dinámico del agente incluye las herramientas esperadas (herramientas, acciones y agentes conectados) a un umbral determinado previamente.

Obtenga más información sobre los tipos de prueba en Configurar pruebas en Copilot Studio Kit.

Captura de pantalla de los detalles del resultado de la ejecución de pruebas, incluido un gráfico que muestra la tasa de éxito y la latencia de todas las ejecuciones de pruebas.

Paso siguiente