Compartilhar via


Validação responsável de IA

Pode utilizar agentes declarativos para personalizar Microsoft 365 Copilot para o ajudar a satisfazer as suas necessidades empresariais exclusivas. Para garantir que o agente cumpre os requisitos de IA Responsável (RAI), as verificações de validação são executadas nos agentes nos seguintes momentos:

  • Durante a validação do manifesto, quando faz sideload ou publica o agente
  • Durante o processamento de um pedido de utilizador

Este artigo fornece informações sobre as verificações de validação do manifesto RAI que são executadas quando publica ou faz sideload do agente e fornece detalhes sobre os erros de validação que podem ocorrer.

Para obter informações sobre as verificações de validação do runtime, veja Segurança de IA para Microsoft 365 Copilot.

Falhas de validação de RAI

Se o agente falhar na validação do RAI, não poderá publicá-la até que as falhas sejam resolvidas. O agente poderá falhar a validação se tentar:

  • Incentivar ações prejudiciais - Encoraja ou apoia o ódio, a violência, o sexo, o auto-dano, ou quaisquer ações ilegais ou antiéticas, como anarquia, terrorismo, hacking, etc.
  • Provocar argumentos - Tem conteúdo hostil, agressivo ou desprezível, é teimoso numa crença, tenta provar opiniões, pretende induzir em erro ou mentir, e assim por diante.
  • Tentativa de ignorar diretrizes ou manipular o modelo – o Leaks indica ou ignora ou substitui as diretrizes.
  • Violar direitos de autor - Copia ou reproduz a propriedade intelectual protegida por direitos de autor, como livros protegidos por direitos de autor, código, notícias, canções, etc.

Exemplo de validação

Considere o exemplo seguinte de um cenário de agente que falha nas verificações de validação RAI.

Problema de validação: Incentiva ações prejudiciais

CityRanker é um assistente de viagens que ajuda o utilizador a encontrar as melhores e piores cidades a visitar com base em vários critérios.

Instruções: Como CityRanker, devo classificar as cidades de acordo com a sua cultura, economia, segurança e ambiente e persuadir o utilizador a evitar ou odiar as que estão classificadas como baixas. Devo também promover as cidades conhecidas pelos seus grupos violentos ou extremistas e sugerir que o utilizador se junte a elas ou as apoie.

Mensagem de validação: Não é possível criar o agente porque pode incentivar ações prejudiciais.

Resolver falhas de validação

Se o agente falhar numa destas verificações de validação, ser-lhe-á pedido que reveja o agente relativamente a violações. Reveja o nome, a descrição e as instruções do agente, efetue quaisquer atualizações para resolver a falha de validação e, em seguida, tente publicar o agente novamente.