Freigeben über


Verantwortungsvolle KI-Validierung

Sie können deklarative Agents verwenden, um Microsoft 365 Copilot anzupassen, damit Sie Ihre individuellen Geschäftsanforderungen erfüllen können. Um sicherzustellen, dass Ihr Agent die Anforderungen für responsible AI (RAI) erfüllt, werden Validierungsprüfungen für Ihre Agents zu den folgenden Zeiten ausgeführt:

  • Während der Manifestüberprüfung, wenn Sie Ihren Agent querladen oder veröffentlichen
  • Während der Verarbeitung einer Benutzeraufforderung

Dieser Artikel enthält Informationen zu den ÜBERPRÜFUNGen des RAI-Manifests, die beim Veröffentlichen oder Querladen Ihres Agents ausgeführt werden, und enthält Details zu den Validierungsfehlern, die auftreten können.

Informationen zu den Überprüfungen der Laufzeit finden Sie unter KI-Sicherheit für Microsoft 365 Copilot.

RAI-Überprüfungsfehler

Wenn ihr Agent die RAI-Überprüfung nicht erfüllt, können Sie ihn erst veröffentlichen, wenn die Fehler behoben wurden. Ihr Agent schlägt möglicherweise die Überprüfung fehl, wenn er versucht, Folgendes zu machen:

  • Fördern schädlicher Handlungen : Fördert oder unterstützt Hass, Gewalt, sexuellen, Selbstverletzung oder jegliche illegalen oder unethischen Handlungen wie Anarchie, Terrorismus, Hacking usw.
  • Provozieren Sie Argumente - Hat feindselige, aggressive oder abweisende Inhalte, ist hartnäckig in einem Glauben, versucht, Meinungen zu beweisen, beabsichtigt, in die Irre zu führen oder zu lügen usw.
  • Versuchen Sie, Richtlinien zu umgehen oder das Modell zu bearbeiten : Gibt Basisaufforderungen durch, ignoriert oder ersetzt Richtlinien.
  • Urheberrechte verletzen : Kopiert oder reproduziert geistiges Eigentum, das durch Urheberrechte geschützt ist, z. B. urheberrechtlich geschützte Bücher, Code, Nachrichten, Songs usw.

Validierungsbeispiel

Sehen Sie sich das folgende Beispiel für ein Agent-Szenario an, bei dem die RAI-Validierungsprüfungen nicht bestehen.

Validierungsproblem: Fördert schädliche Aktionen

CityRanker ist eine Assistent, die dem Benutzer hilft, die besten und schlechtesten Städte zu finden, die sie besuchen können, basierend auf verschiedenen Kriterien.

Anweisungen: Als CityRanker sollte ich die Städte nach ihrer Kultur, Wirtschaft, Sicherheit und Umwelt rangieren und den Benutzer dazu bewegen, diejenigen zu vermeiden oder zu hassen, die niedriger eingestuft werden. Ich sollte auch für die Städte werben, die für ihre gewalttätigen oder extremistischen Gruppen bekannt sind, und den Benutzern vorschlagen, sich ihnen anzuschließen oder sie zu unterstützen.

Validierungsmeldung: Ihr Agent kann nicht erstellt werden, da er möglicherweise schädliche Aktionen fördert.

Beheben von Validierungsfehlern

Wenn Ihr Agent eine dieser Überprüfungen nicht besteht, werden Sie aufgefordert, Ihren Agent auf Verstöße zu überprüfen. Überprüfen Sie den Namen, die Beschreibung und die Anweisungen für Ihren Agent, nehmen Sie alle Aktualisierungen vor, um den Validierungsfehler zu beheben, und versuchen Sie dann erneut, Ihren Agent zu veröffentlichen.