Freigeben über


Open Source im Vergleich zu verwaltetem MLflow in Azure Databricks

Diese Seite soll Benutzern von Open Source-MLflow helfen, sich mit der Verwendung von MLflow auf Databricks vertraut zu machen. Databricks-verwalteter MLflow verwendet dieselben APIs, bietet aber zusätzliche Funktionen durch Integrationen mit der umfassenderen Azure Databricks-Plattform.

Vorteile von verwaltetem MLflow auf Azure Databricks

Open Source MLflow stellt das Kerndatenmodell, die API und das SDK bereit. Dies bedeutet, dass Ihre Daten und Workloads immer portierbar sind.

Verwalteter MLflow für Databricks fügt Folgendes hinzu:

  • Governance und Sicherheit auf Unternehmensniveau durch Integration in die Databricks-Plattform, Lakehouse und Unity Catalog. Ihre KI- und ML-Daten, Tools, Agents, Modelle und andere Ressourcen können auf derselben Plattform wie die restlichen Daten und Workloads gesteuert und verwendet werden.
  • Vollständig verwaltetes Hosting auf produktionsfähigen, skalierbaren Servern
  • Integrationen für Entwicklung und Produktion mit der breiteren Mosaik AI-Plattform

Weitere Informationen zu den Vorteilen finden Sie auf der Seite "Verwaltetes MLflow-Produkt " und auf der restlichen Seite weitere Informationen zu technischen Details.

Tipp

Ihre Daten sind immer Ihre – Das Kerndatenmodell und die APIs sind vollständig open source. Sie können Ihre MLflow-Daten überall exportieren und verwenden.

Zusätzliche Funktionen für Databricks

In diesem Abschnitt werden wichtige Funktionen aufgeführt, die auf verwaltetem MLflow durch Integrationen mit der umfassenderen Azure Databricks-Plattform aktiviert sind. Übersichten über alle Funktionen von MLflow für GenAI finden Sie in der GenAI-Dokumentation zu MLflow 3 für GenAI und in der Open Source GenAI-Dokumentation.

Governance und Sicherheit auf Unternehmensniveau

  • Unternehmensgovernance mit Unity-Katalog: Modelle, Featuretabellen, Vektorindizes, Tools und vieles mehr werden zentral im Unity-Katalog gesteuert. Bei der Bereitstellung von Agents kann die Authentifizierung für Agent, Daten und Toolzugriff mithilfe von Authentifizierungsdurchlauf und benutzerinterner Authentifizierung präzise gesteuert werden.
  • Lakehouse-Datenintegration: Nutzen Sie AI/BI Genie Spaces und Dashboards und Databricks SQL , um Protokolle und Ablaufverfolgungen aus MLflow-Experimenten zu analysieren.
  • Sicherheit und Verwaltung: MLflow-Berechtigungen folgen den gleichen Governancemustern wie die breitere Databricks-Plattform:
    • Arbeitsbereichsobjekte wie Experimente folgen Arbeitsbereichsberechtigungen.
    • Unity-Katalogobjekte wie registrierte Modelle folgen Unity-Katalogprivilegien.
    • Die Authentifizierung und der Zugriff für Benutzeroberflächen und API stimmen mit der Databricks-Plattform und der REST-API überein.
  • Überwachung: Systemtabellen stellen Verwendungs - und Überwachungsprotokolle für verwalteten MLflow bereit.

Vollständig verwaltetes Hosting auf produktionsfähigen Servern

  • Vollständig verwaltet: Azure Databricks stellt MLflow-Server mit automatischen Updates bereit, die für Skalierbarkeit und Produktion konzipiert sind. Weitere Informationen finden Sie unter "Ressourcenbeschränkungen".
  • Vertrauenswürdige Plattform: Verwalteter MLflow wird von Tausenden von Kunden auf der ganzen Welt verwendet.

Integrationen für Entwicklung und Produktion

Die Entwicklung von KI und ML wird durch Integrationen wie: verbestert.

Produktions-KI und ML werden durch Integrationen wie die folgenden erleichtert:

Hinweis

Die Open-Source-Telemetrieerfassung wurde in MLflow 3.2.0 eingeführt und ist standardmäßig für Databricks deaktiviert. Weitere Informationen finden Sie in der Dokumentation zur MLflow-Verwendungsnachverfolgung.

Nächste Schritte

Erste Schritte mit MLflow auf Databricks:

Verwandtes Referenzmaterial: