Partager via


Principaux défis liés à la création d’applications GenAI

Malgré la puissance des modèles GenAI modernes, les applications d’IA générative de niveau production sont souvent difficiles à créer. Trois défis clés peuvent être résumés comme suit :

  • Gouvernance : de nombreuses plateformes ont du mal à fournir une gouvernance unifiée, une confidentialité des données et une sécurité pour les données et les ressources IA.
  • Qualité : Le comportement flexible et imprévisible des modèles GenAI ajoute de la complexité à l’évaluation.
  • Contrôle : les plateformes doivent fournir une flexibilité, un choix de modèle et une personnalisation.

Gouvernance pour les données et l’IA

Les applications GenAI nécessitent diverses ressources de données et d’IA : tables, index vectoriels, modèles IA, outils, etc. Une plateforme GenAI doit fournir un accès précis à ces ressources aux développeurs, tout en fournissant une gouvernance conjointe aux administrateurs. Sans gouvernance complète, les organisations sont confrontées à des risques tels que :

  • Fuite de données : les données sensibles du client ou de l’entreprise peuvent être utilisées de manière incorrecte sans suivi et contrôle d’accès appropriés, et les données peuvent s’écouler par inadvertance dans les sorties du modèle si les garde-fous appropriés ne sont pas appliqués.
  • Restrictions de conformité : de nombreuses organisations ont des exigences de conformité telles que SOC2 ou HIPAA, et l’intégration de modèles GenAI dans des plateformes héritées conformes peut être complexe, ce qui entraîne des retards ou des restrictions dans l’utilisation des meilleurs modèles.
  • Utilisation non autorisée ou coûts inattendus : sans contrôles d’accès et garde-fous d’utilisation, les modèles IA peuvent être utilisés par des équipes non autorisées ou entraîner des coûts d’utilisation élevés.

Azure Databricks simplifie la gouvernance unifiée des données et de l’IA via :

  • Catalogue Unity, qui gère les fichiers, les tables, les index vectoriels, les magasins de fonctionnalités, les modèles et les outils sous un modèle de gouvernance unifié
  • Passerelle IA, qui fournit une gouvernance et une surveillance unifiées pour les points de terminaison de modèle IA, y compris les garde-fous de sécurité et les limites d’utilisation
  • Databricks AI Security Framework, qui fournit un guide complet de la gestion des risques d’IA
  • Databricks AI Governance Framework, qui complète le Framework de sécurité en fournissant une vue de la gouvernance couvrant à la fois la sécurité et l’intégrité opérationnelle

Qualité des modèles, des agents et des applications

Les modèles GenAI produisent des sorties stochastiques ouvertes et sont souvent appliquées aux problèmes ouverts avec de nombreuses réponses « bonnes ». Même la définition de « haute qualité » peut être difficile et nécessite souvent des commentaires itératifs provenant d’experts de domaine ou d’utilisateurs. Sans processus d’évaluation robustes, les organisations sont confrontées à des risques tels que :

  • Expériences utilisateur incorrectes : si les applications GenAI ne sont pas évaluées en fonction des métriques alignées sur les besoins de l’utilisateur, les utilisateurs peuvent trouver des réponses inutiles, inexactes, voire dangereuses ou offensives. Les réputations de marque peuvent souffrir dans des cas extrêmes.
  • Limbe de développement : si la qualité ne peut pas être définie ou mesurée de manière à autoriser la signature des parties prenantes, les projets GenAI peuvent être retardés ou annulés pour l’absence de « preuve » de qualité.

Azure Databricks simplifie la mesure et l’optimisation de la qualité de l’IA via :

  • Évaluation et supervision MLflow, avec des évaluateurs intégrés et personnalisables pour mesurer la qualité, utilisables tant dans le développement que dans la supervision de la production
  • Suivi MLflow, avec traçage automatique et manuel pour fournir une visibilité pour le développement et la production
  • Collecte de commentaires humains, avec une application intégrée pour les commentaires d’experts lors du développement et des API pour les commentaires des utilisateurs à partir d’applications de production
  • Méthodes d’optimisation des compromis entre la qualité, le coût et la latence. Agent Bricks offre une expérience d’optimisation guidée pour les applications IA clés, et Agent Framework et un choix flexible de modèles IA offrent des options de compromis pour les agents entièrement personnalisés.

Contrôle des données et des modèles

Les modèles GenAI de pointe sont fournis par de nombreux fournisseurs de modèles, ainsi que des options open source auto-hébergées. En raison des complications liées à la confidentialité et aux licences des données, de nombreuses plateformes luttent pour prendre en charge cet écosystème diversifié et permettre une itération et une personnalisation rapides. Les organisations doivent maintenir le contrôle de leurs données et choisir des modèles pour éviter les risques tels que :

  • Restrictions de confidentialité des données : les exigences de conformité ou d’intégration peuvent empêcher les organisations d’accéder aux principaux modèles GenAI de plusieurs fournisseurs, de sacrifier la flexibilité et les compromis de qualité-coût.
  • Manque de compétitivité : si les modèles, les données, les agents et les applications ne sont pas personnalisables en fonction des données propriétaires d’une organisation, il est difficile de créer une propriété intellectuelle.

Azure Databricks offre un contrôle et une flexibilité pour les données et les modèles via :

  • Les API Foundation Model, qui servent des modèles frontière provenant de principaux fournisseurs de modèles dans votre propre environnement Azure Databricks, ainsi que vos modèles et agents personnalisés dans Model Serve.
  • Applications, agents, modèles, outils et sources de données personnalisés basés sur vos données propriétaires. Tous ces niveaux d’IA prennent en charge Data Intelligence, de la création d’applications et d’agents, à la fourniture de données par le biais d’outils, à l’évaluation et à l’optimisation des agents en fonction de vos données.

Learn more