Compartir a través de


Supervisión humana del uso de equipos (versión preliminar)

[Este artículo es documentación preliminar y está sujeto a modificaciones].

La característica de supervisión humana permite que la herramienta de uso del equipo se escale al revisor que configure en Configuración de supervisión humana cuando detecta posibles problemas de seguridad, actualmente dentro de la categoría de instrucciones maliciosas.

Nota

Esta característica se está implementando gradualmente en entornos de ciclo de lanzamiento temprano en la región de Estados Unidos y es posible que aún no esté disponible en su entorno.

Importante

Este artículo contiene la documentación de la versión preliminar de Microsoft Copilot Studio y está sujeto a modificaciones.

Las vistas previas de características no se han diseñado para un uso de producción y pueden tener una funcionalidad restringida. Estas características están disponibles antes del lanzamiento oficial para que pueda tener acceso anticipado y proporcionar comentarios.

Si está creando un agente listo para producción, consulte Información general sobre Microsoft Copilot Studio.

El modelo de IA realiza la detección evaluando las capturas de pantalla en busca de contenido adversario que pueda alterar el comportamiento del modelo. Cuando el modelo detecta este tipo de instrucciones durante la ejecución (lo que antes provocaba una parada inmediata), ahora reenvía la solicitud a una persona para su validación. El revisor humano decide si el problema de seguridad señalado es real y debe detener la ejecución, o si el modelo lo ha señalado erróneamente y el proceso puede continuar con seguridad. En estos eventos, el sistema genera una solicitud de revisión a los revisores humanos configurados por correo electrónico (Outlook). Si no se recibe ninguna respuesta dentro del periodo de tiempo especificado, el uso del ordenador se detiene una vez alcanzado ese límite de tiempo.

Importante

  • Los agentes que utilizan equipos pueden sufrir ataques de inyección rápida, en los que instrucciones ocultas en capturas de pantalla, páginas web u otras entradas intentan influir en las acciones de forma no deseada. Para minimizar este riesgo, opere estos agentes dentro de entornos aislados de confianza y aplique comprobaciones de validación sólidas antes de ejecutar las instrucciones. La habilitación de la supervisión humana agrega visibilidad y control adicionales, ya que permite a revisores humanos autorizados validar las acciones señaladas cuando el modelo detecta instrucciones potencialmente dañinas o maliciosas, lo que podría reducir la posibilidad de comportamientos no deseados.
  • Las comprobaciones de seguridad realizadas por el agente de uso del equipo pueden desencadenarse mediante una respuesta, entrada o captura de pantalla, o por varias partes de este contexto. Las comprobaciones de seguridad tienen por objeto solicitar una revisión humana antes de que el agente de uso informático realice acciones potencialmente irreversibles o no permitidas, pero el agente de uso informático puede cometer errores al realizar las comprobaciones. Por ejemplo, es posible que el agente de uso del equipo no detecte determinadas acciones o que solicite una revisión en la que la seguridad no es un problema. Las comprobaciones de seguridad no son un sustituto del diseño y la guía responsables del agente.
  • La característica de supervisión humana solicita la revisión de acciones potencialmente irreversibles o no confirmadas, pero actualmente no admite solicitudes de confirmación generales, peticiones de información que faltan u otros tipos de comprobaciones de seguridad.

Revisión del agente y la actividad de uso del equipo

Cuando el agente de uso del ordenador detecta instrucciones potencialmente maliciosas o dañinas, los revisores configurados reciben un correo electrónico de Outlook. Antes de responder, es fundamental confirmar de qué actividad del agente se trata y a qué actividad de uso del ordenador se refiere la solicitud.

Nota

Cada ejecución del agente y su actividad están vinculadas al usuario que las inicia. Si elige un revisor que no sea la persona que ejecuta el agente de uso del equipo, es probable que no vea la actividad porque no fue él quien inició la ejecución. Si configura varios revisores humanos, cada uno recibe un correo electrónico, pero solo el iniciador de la ejecución tiene acceso a los detalles de la actividad.

La siguiente tabla muestra la información principal que se incluye en una solicitud de revisión humana por correo electrónico:

Campo Descripción
Agente que utiliza la herramienta Nombre del agente de Copilot Studio.
Herramienta de uso de equipos Nombre de la herramienta de uso del equipo que desencadenó la solicitud.
Id. de la conversación Identificador de conversación que puede usar para buscar una determinada actividad.
Tiempo de espera de solicitud Fecha y hora de expiración de la solicitud.
Solicitado por El creador (propietario de la conexión) de la herramienta de uso del equipo.
Enviar (con opciones) La decisión o No del revisor final para continuar o detener la ejecución del uso del equipo.

Revisión de las solicitudes de revisión humana de uso del equipo

Nota

Para revisar las solicitudes de revisión humana en el panel del lado de acción de uso del equipo en el mapa de actividad del agente, debe habilitar la característica de Actividad del uso del equipo avanzada en su entorno. Si la experiencia de actividad de uso avanzado del ordenador no aparece en el mapa de actividades, es posible que su administrador haya desactivado esta función para su entorno. Obtenga más información en actividad avanzada de uso de equipos.

Para revisar las solicitudes de revisión humana:

  1. Copie el identificador de conversación (GUID) del cuerpo de la solicitud de revisión humana.
  2. Seleccione el vínculo Agente que utiliza la herramienta en el correo electrónico para abrir la página de información general del agente en Microsoft Copilot Studio.
  3. Vaya a Actividades.
  4. En la parte superior de la lista de actividades, seleccione Buscar ejecución por id. y escriba el id. de conversación copiado.
  5. Localice la acción de uso del ordenador con el nombre de la herramienta de uso del ordenador configurada y abra su panel lateral.
  6. En la sección Actividad del panel lateral, revise la lista de actividades. Las actividades en espera de revisión humana muestran un símbolo en espera junto al texto de respuesta del modelo. Las comprobaciones de seguridad realizadas por el agente de uso del equipo pueden desencadenarse mediante una única respuesta, entrada o captura de pantalla, o por varias partes de este contexto. Por lo tanto, la captura de pantalla mostrada en una solicitud de revisión humana podría no contener ningún contenido potencialmente malintencionado.
  7. Revise cuidadosamente el historial de actividad y las capturas de pantalla para determinar si la comprobación de seguridad del modelo de uso del equipo es válida.
  8. Cuando haya terminado, vuelva a la notificación por correo electrónico en Outlook y realice la acción adecuada en función de sus conclusiones.

Preguntas frecuentes sobre la herramienta de uso del equipo