Compartilhar via


Supervisão humana de uso do computador (versão preliminar)

[Este artigo faz parte da documentação de pré-lançamento e está sujeito a alterações.]

O recurso da supervisão humana permite que a ferramenta de uso do computador escalone para o revisor configurado nas configurações de supervisão humana quando detecta preocupações de segurança em potencial, atualmente dentro da categoria de instruções mal-intencionadas.

Observação

Este recurso está sendo implementado gradualmente em ambientes do ciclo de lançamento antecipado na região dos Estados Unidos e ainda talvez não esteja disponível no ambiente.

Importante

Este artigo contém a documentação da versão preliminar do Microsoft Copilot Studio e está sujeito a alterações.

A versão prévia dos recursos não foi criada para uso em ambientes de produção e pode ter funcionalidade restrita. Esses recursos são disponibilizados antes de um lançamento oficial para que você possa ter acesso antecipado e fornecer comentários.

Se você estiver criando um agente preparado para produção, consulte Visão geral do Microsoft Copilot Studio.

O modelo de IA realiza a detecção avaliando imagens da captura de tela para conteúdos adversos que possam alterar o comportamento do modelo. Quando sinaliza essas instruções durante a execução (que antes causava uma parada imediata), o modelo agora encaminha a solicitação a um humano para validação. O revisor humano decide se o problema de segurança sinalizado é genuíno e deverá interromper a execução ou, se o modelo o tiver sinalizado incorretamente e o processo poderá continuar em segurança. Nesses casos, o sistema envia uma solicitação de revisão aos revisores humanos configurados por email (Outlook). Se nenhuma resposta for recebida dentro do período especificado, a execução de uso do computador vai parar assim que esse limite de tempo for atingido.

Importante

  • Agentes de uso do computador podem encontrar ataques de injeção da solicitação, nos quais instruções ocultas em capturas de tela, páginas web ou outras entradas tentam influenciar ações de maneiras não intencionais. Para minimizar esse risco, opere esses agentes em ambientes confiáveis e isolados e aplique verificações de validação robustas antes de executar qualquer instrução. A habilitação da supervisão humana dá visibilidade e controle extras permitindo a revisores humanos autorizados validar ações sinalizadas quando o modelo detecta instruções potencialmente perigosas ou mal-intencionadas, o que pode reduzir a chance de comportamento não intencional.
  • As verificações de segurança realizadas pelo agente de uso do computador podem ser disparadas por uma resposta, entrada ou captura de tela, ou por vários detalhes desse contexto. As verificações de segurança devem solicitar a revisão humana antes que ações potencialmente irreversíveis ou não permitidas sejam realizadas pelo agente usuário do computador, mas o agente usuário pode cometer erros ao realizar as verificações. Por exemplo, o agente de uso do computador pode não detectar determinadas ações, ou pode solicitar uma revisão na qual a segurança não é uma preocupação. As verificações de segurança não são um substituto do design e da orientação responsáveis do agente.
  • O recurso de supervisão humana solicita a revisão de ações potencialmente irreversíveis ou não autorizadas, mas atualmente não dá suporte a solicitações de confirmação gerais, solicitações de informações não encontradas ou outros tipos de verificações de segurança.

Revisar a atividade de uso do agente e do computador

Quando o agente de uso do computador detecta instruções potencialmente mal-intencionadas ou perigosas, os revisores configurados recebem um email do Outlook. Antes de responder, é crítico confirmar qual atividade de agente é e a qual atividade de uso do computador a solicitação se relaciona.

Observação

Cada agente é executado, e a atividade está vinculada ao usuário que a inicia. Se você escolher um revisor diferente da pessoa que está usando o agente de uso do computador, provavelmente ele não verá a atividade porque não iniciou a execução. Se você configurar vários revisores humanos, cada um receberá um email, mas apenas o iniciador da execução terá acesso aos detalhes da atividade.

A tabela a seguir mostra as principais informações incluídas em uma solicitação de email de revisão humana:

Campo Descrição
Agente usando a ferramenta O nome do agente do Copilot Studio.
Ferramenta de uso do computador O nome da ferramenta de uso do computador que disparou a solicitação.
ID da conversa A ID de conversa que você pode usar para encontrar uma determinada atividade.
Tempo limite da solicitação A data e hora do tempo limite da solicitação.
Solicitado por O criador (proprietário da conexão) da ferramenta de uso de computador.
Enviar (com opções) A decisão Sim ou Não do revisor final de avançar ou interromper a execução de uso do computador.

Revisar solicitações da revisão humana de uso do computador

Observação

Para revisar as solicitações de revisão humana no painel lateral de ação de uso do computador no mapa de atividade do agente, você precisa habilitar o recurso Atividade de uso do computador avançada no ambiente. Se a experiência da atividade de uso do computador avançada não for exibida no mapa de atividade, o administrador poderá ter desativado esse recurso para o ambiente. Saiba mais em atividade de uso do computador avançada.

Para revisar solicitações de revisão humana:

  1. Copie a ID da conversa (GUID) do corpo do email da solicitação de revisão humana.
  2. Selecione o link Agente usando a ferramenta no email para abrir a página de visão geral do agente no Microsoft Copilot Studio.
  3. Vá para Atividades.
  4. No topo da lista de atividades, selecione Encontrar execução por ID e insira a ID da conversa copiada.
  5. Localize a ação de uso do computador com o nome da ferramenta configurada e abra o painel lateral.
  6. Na seção Atividade do painel lateral, revise a lista de atividades. Atividades aguardando revisão humana exibem um símbolo de espera ao lado do texto de resposta do modelo. As verificações de segurança realizadas pelo agente de uso do computador podem ser disparadas por uma única resposta, entrada ou captura de tela, ou por vários detalhes desse contexto. Consequentemente, a captura de tela exibida em uma solicitação de revisão humana talvez não tenha conteúdo potencialmente mal-intencionado.
  7. Revise cuidadosamente o histórico de atividades e as capturas de tela para determinar se a verificação de segurança do modelo de uso de computador é válida.
  8. Quando terminar, retorne à notificação por e-mail no Outlook e tome a medida indicada com base nas descobertas.

Perguntas frequentes da ferramenta de uso do computador