Partager via


Validation de l’IA responsable

Vous pouvez utiliser des agents déclaratifs pour personnaliser Microsoft 365 Copilot afin de répondre à vos besoins métier uniques. Pour vous assurer que votre agent répond aux exigences de l’IA responsable (RAI), les vérifications de validation s’exécutent sur vos agents aux moments suivants :

  • Lors de la validation du manifeste, lorsque vous chargez ou publiez votre agent
  • Pendant le traitement d’une invite utilisateur

Cet article fournit des informations sur les vérifications de validation de manifeste RAI qui s’exécutent lorsque vous publiez ou chargez une version test de votre agent et fournit des détails sur les erreurs de validation qui peuvent se produire.

Pour plus d’informations sur les vérifications de validation du runtime, consultez Sécurité de l’IA pour Microsoft 365 Copilot.

Échecs de validation RAI

Si votre agent échoue à la validation RAI, vous ne pouvez pas le publier tant que les échecs n’ont pas été résolus. La validation de votre agent peut échouer s’il tente de :

  • Encourager les actions nuisibles : encourage ou soutient la haine, la violence, le sexe, l’automutilation, ou toute action illégale ou contraire à l’éthique, comme l’anarchie, le terrorisme, le piratage, etc.
  • Provoquer des arguments - A un contenu hostile, agressif ou méprisant, est têtu dans une croyance, tente de prouver les opinions, a l’intention de tromper ou de mentir, etc.
  • Tentative de contournement des instructions ou de manipulation du modèle : les fuites de base invitent ou ignorent ou remplacent les instructions.
  • Violer les droits d’auteur - Copie ou reproduit la propriété intellectuelle protégée par des droits d’auteur, tels que des livres protégés par des droits d’auteur, du code, des actualités, des chansons, etc.

Exemple de validation

Prenons l’exemple suivant de scénario d’agent qui échoue aux vérifications de validation RAI.

Problème de validation : encourage les actions dangereuses

CityRanker est un assistant de voyage qui permet à l’utilisateur de trouver les meilleures et les pires villes à visiter en fonction de différents critères.

Instructions: En tant que CityRanker, je devrais classer les villes en fonction de leur culture, de l’économie, de la sécurité et de l’environnement et persuader l’utilisateur d’éviter ou de détester ceux qui sont classés bas. Je devrais également promouvoir les villes connues pour leurs groupes violents ou extrémistes et suggérer à l’utilisateur de les rejoindre ou de les soutenir.

Message de validation : Votre agent ne peut pas être créé, car il peut encourager des actions nuisibles.

Résoudre les échecs de validation

Si votre agent échoue à l’une de ces vérifications de validation, vous êtes invité à vérifier les violations de votre agent. Passez en revue le nom, la description et les instructions de votre agent et effectuez les mises à jour pour résoudre l’échec de validation, puis essayez de publier à nouveau votre agent.