Partager via


Open source et MLflow managé sur Azure Databricks

Cette page est destinée à aider les utilisateurs MLflow open source à se familiariser avec l’utilisation de MLflow sur Databricks. Le MLflow géré par Databricks utilise les mêmes API, mais fournit des fonctionnalités supplémentaires via des intégrations avec la plateforme Azure Databricks plus large.

Avantages de MLflow managé sur Azure Databricks

MLflow open source fournit le modèle de données de base, l’API et le SDK. Cela signifie que vos données et charges de travail sont toujours portables.

Managed MLflow sur Databricks ajoute :

  • Gouvernance et sécurité de niveau entreprise grâce à l’intégration à la plateforme Databricks, Lakehouse et Unity Catalog. Vos données IA et ML, outils, agents, modèles et autres ressources peuvent être régis et utilisés dans la même plateforme que le reste de vos données et charges de travail.
  • Hébergement entièrement managé sur des serveurs évolutifs prêts pour la production
  • Intégrations pour le développement et la production avec la plateforme d’IA Mosaïque plus large

Pour plus d’informations sur les avantages, consultez la page produit MLflow managée et consultez le reste de cette page pour en savoir plus sur les détails techniques.

Conseil / Astuce

Vos données sont toujours les vôtres : le modèle de données principal et les API sont entièrement open source. Vous pouvez exporter et utiliser vos données MLflow n’importe où.

Fonctionnalités supplémentaires sur Databricks

Cette section répertorie les fonctionnalités importantes activées sur MLflow managé par le biais d’intégrations avec la plateforme Azure Databricks plus large. Pour obtenir une vue d’ensemble de toutes les fonctionnalités de MLflow pour GenAI, consultez MLflow 3 pour GenAI et la documentation GenAI open source.

Gouvernance et sécurité de niveau entreprise

  • Gouvernance d’entreprise avec le catalogue Unity : modèles, tables de fonctionnalités, index vectoriels, outils, etc. sont régis de manière centralisée sous Catalogue Unity. Lors du déploiement d’agents, l’authentification pour l’accès à l’agent, aux données et aux outils peut être contrôlée avec précision à l’aide du passthrough d’authentification et de l’authentification au nom de l’utilisateur.
  • Intégration des données Lakehouse : tirez parti des espaces et tableaux de bord AI/BI Genie et Databricks SQL pour analyser les journaux et les traces des expériences MLflow.
  • Sécurité et gestion : les autorisations MLflow suivent les mêmes modèles de gouvernance que la plateforme Databricks plus large :
  • Audit : les tables système fournissent des journaux d’utilisation et d’audit pour le MLflow managé.

Hébergement entièrement managé sur des serveurs prêts pour la production

  • Entièrement managé : Azure Databricks fournit des serveurs MLflow avec des mises à jour automatiques, conçues pour la scalabilité et la production. Pour plus d’informations, consultez Limites des ressources.
  • Plateforme approuvée : Le MLflow managé est utilisé par des milliers de clients dans le monde entier.

Intégrations pour le développement et la production

Le développement de l’IA et du ML est simplifié par des intégrations telles que :

L’IA de production et ML sont facilités par des intégrations telles que :

Note

La collecte de données de télémétrie open source a été introduite dans MLflow 3.2.0 et est désactivée par défaut sur Databricks. Pour plus d’informations, reportez-vous à la documentation de suivi de l’utilisation de MLflow.

Étapes suivantes

Commencez avec MLflow sur Databricks :

Documents de référence connexes :