Compartir a través de


Validación de IA responsable

Puede usar agentes declarativos para personalizar Microsoft 365 Copilot para ayudarle a satisfacer sus necesidades empresariales únicas. Para asegurarse de que el agente cumple los requisitos de IA responsable (RAI), las comprobaciones de validación se ejecutan en los agentes en los siguientes momentos:

  • Durante la validación del manifiesto, al transferir localmente o publicar el agente
  • Durante el procesamiento de un mensaje de usuario

En este artículo se proporciona información sobre las comprobaciones de validación de manifiestos RAI que se ejecutan al publicar o transferir localmente el agente y se proporcionan detalles sobre los errores de validación que pueden producirse.

Para obtener información sobre las comprobaciones de validación en tiempo de ejecución, consulte Seguridad de IA para Microsoft 365 Copilot.

Errores de validación de RAI

Si el agente produce un error en la validación de RAI, no podrá publicarla hasta que se solucione el error. El agente podría producir un error en la validación si intenta:

  • Fomentar acciones dañinas : fomenta o apoya el odio, la violencia, el sexo, el autolesión o cualquier acción ilegal o no ética, como anarquía, terrorismo, piratería, etc.
  • Provocar argumentos : tiene contenido hostil, agresivo o despreociable, es obstinado en una creencia, intenta probar opiniones, pretende engañar o mentir, etc.
  • Intentar omitir directrices o manipular el modelo : filtra las indicaciones base o omite o reemplaza las directrices.
  • Infringir los derechos de autor : copia o reproduce la propiedad intelectual protegida por derechos de autor, como libros con derechos de autor, código, noticias, canciones, etc.

Ejemplo de validación

Tenga en cuenta el ejemplo siguiente de un escenario de agente que produce un error en las comprobaciones de validación de RAI.

Problema de validación: fomenta acciones dañinas

CityRanker es un viaje asistente que ayuda al usuario a encontrar las mejores y peores ciudades para visitar en función de diversos criterios.

Instrucciones: Como CityRanker, debería clasificar las ciudades según su cultura, economía, seguridad y medio ambiente y persuadir al usuario de evitar o odiar a las que están clasificadas bajo. También debería promover las ciudades que son conocidas por sus grupos violentos o extremistas y sugerir al usuario unirse a ellos o apoyarlos.

Mensaje de validación: No se puede crear el agente porque podría fomentar acciones dañinas.

Resolución de errores de validación

Si el agente produce un error en una de estas comprobaciones de validación, se le pedirá que revise si hay infracciones en el agente. Revise el nombre, la descripción y las instrucciones del agente y realice las actualizaciones necesarias para solucionar el error de validación y vuelva a intentar publicar el agente.