Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Power CAT Copilot Studio Kit es una aplicación fácil de usar que permite comprobar las respuestas del agente. También incluye funcionalidades nativas, como la exportación e importación de Excel para la creación y las actualizaciones masivas.
Configuración, ejecución y análisis
Configure y ejecute pruebas en las API de Copilot Studio (Direct Line API) para evaluar las respuestas del agente con los resultados esperados.
Para enriquecer los resultados, recupere puntos de datos adicionales de Azure Application Insights y Dataverse mediante el análisis de registros de transcripción de conversación (como el nombre exacto del tema desencadenado y las puntuaciones de reconocimiento de intenciones).
Para las respuestas generadas por IA, que no son deterministas por naturaleza, use indicaciones para comparar la respuesta generada con una respuesta de muestra o instrucciones de validación.
Tipos de prueba
La herramienta admite estos tipos de pruebas:
- Coincidencia de respuesta
- Datos adjuntos, como tarjetas adaptables
- Coincidencia de tema (requiere Dataverse)
- Respuestas generativas (requiere AI Builder para el análisis de respuesta y Application Insights para obtener más información sobre por qué no se generó una respuesta).
- El tipo de prueba multiturno es un tipo de prueba especial. Consta de un conjunto de casos de prueba de tipos normales que se ejecutan en un orden especificado en el mismo contexto de conversación. Use pruebas de múltiples turnos para probar escenarios de principio a fin y para probar agentes personalizados con orquestación generativa.
- La validación del plan permite a los creadores validar que sus agentes personalizados que usan orquestación generativa incluyen las herramientas esperadas. En lugar de evaluar lo que dice el agente, este tipo de prueba comprueba que el plan dinámico del agente incluye las herramientas esperadas (herramientas, acciones y agentes conectados) a un umbral determinado previamente.
Obtenga más información sobre los tipos de prueba en Configurar pruebas en Copilot Studio Kit.