Freigeben über


Legacy-Feature-Speicher des Arbeitsbereichs

Hinweis

In dieser Dokumentation wird der Feature Store des Arbeitsbereichs behandelt. "Der Feature Store des Arbeitsbereichs ist nur für Arbeitsbereiche verfügbar, die vor dem 19. August 2024, 16:00:00 Uhr (UTC) erstellt wurden."

Databricks empfiehlt die Verwendung von Feature Engineering in Unity Catalog. Der Arbeitsspeicher-Feature-Store wird in Zukunft nicht mehr unterstützt.

Warum den Feature Store des Arbeitsbereichs verwenden?

Der Feature Store im Arbeitsbereich ist vollständig in die anderen Komponenten von Azure Databricks integriert.

  • Erkennbarkeit. Über die Benutzeroberfläche des Featurespeichers, auf die Sie vom Databricks-Arbeitsbereich aus zugreifen können, können Sie nach vorhandenen Features suchen.
  • Herkunft. Wenn Sie eine Featuretabelle in Azure Databricks erstellen, werden die zur Erstellung der Featuretabelle verwendeten Datenquellen gespeichert und sind zugänglich. Für jedes Feature in einer Featuretabelle können Sie auch auf die Modelle, Notebooks, Aufträge und Endpunkte zugreifen, die das Feature verwenden.
  • Integration mit Modellbewertung und -bereitstellung. Wenn Sie Features aus dem Featurespeicher verwenden, um ein Modell zu trainieren, wird das Modell mit Featuremetadaten verpackt. Wenn Sie das Modell für Batchbewertungen oder Onlinerückschlüsse verwenden, ruft es automatisch Features aus dem Featurespeicher ab. Der Aufrufer muss diese nicht kennen oder eine Logik zum Suchen oder Verbinden von Features einfügen, um neue Daten zu bewerten. Das macht die Modellimplementierung und -aktualisierung viel einfacher.
  • Point-in-Time-Lookups. Der Featurespeicher unterstützt Zeitreihen und ereignisbasierte Anwendungsfälle, bei denen Point-in-Time-Genauigkeit erforderlich ist.

Wie funktioniert der Feature Store im Arbeitsbereich?

Der typische Machine Learning-Workflow mit Featurespeicher folgt diesem Muster:

  1. Schreiben Sie Code, um Rohdaten in Features zu konvertieren und einen Spark-DataFrame zu erstellen, der die gewünschten Features enthält.
  2. Schreiben Sie den DataFrame im Feature Store des Arbeitsbereichs als Featuretabelle.
  3. Trainieren Sie ein Modell mithilfe von Features aus dem Featurespeicher. Wenn Sie dies tun, speichert das Modell die Spezifikationen von Features, die für Trainings verwendet werden. Wenn das Modell für den Rückschluss verwendet wird, werden automatisch Features aus den entsprechenden Featuretabellen verknüpft.
  4. Registrieren des Modells in der Modellregistrierung.

Anschließend können Sie das Modell dazu nutzen, um Vorhersagen für neue Daten zu treffen. Für Batchanwendungsfälle ruft das Modell automatisch die benötigten Features aus dem Feature Store ab.

Feature Store-Workflow für Machine Learning-Batch-Anwendungsfälle

Veröffentlichen Sie die Features für echtzeitbasierte Anwendungsfälle in einem Onlinespeicher. Siehe Databricks Online Feature Stores.

Zum Zeitpunkt des Rückschlusses liest das Modell vorab berechnete Features aus dem Onlinespeicher aus und verknüpft sie mit den Daten, die in der Clientanforderung für den Modellbereitstellungsendpunkt bereitgestellt werden.

Feature Store-Workflow für bereitgestellte Machine Learning-Modelle

Starten Sie mit der Nutzung des Workspace Feature Stores

Probieren Sie zunächst diese Beispiel-Notebooks aus. Im grundlegenden Notebook erfahren Sie, wie Sie eine Feature-Tabelle erstellen, sie zum Trainieren eines Modells verwenden und anschließend Batchbewertungen mithilfe des automatischen Feature-Lookups durchführen. Außerdem wird die Feature Engineering-Benutzeroberfläche vorgestellt und gezeigt, wie Sie damit nach Features suchen und verstehen können, wie Features erstellt und verwendet werden.

Beispiel-Notebook für den Standardarbeitsbereich-Feature Store

Notebook abrufen

Das Beispielnotebook „Taxi“ veranschaulicht den Prozess der Erstellung von Features, deren Aktualisierung und deren Verwendung für das Modelltraining und den Batchrückschluss.

Taxibeispiel-Notebook für den Arbeitsbereich-Featurespeicher

Notebook abrufen

Unterstützte Datentypen

Unterstützte Typen finden Sie unter Unterstützte Datentypen.