Udostępnij przez


Notatki wydań dotyczące inżynierii cech Databricks i starszego magazynu cech przestrzeni roboczej.

Na tej stronie wymieniono wydania Databricks Feature Engineering w kliencie Unity Catalog oraz Databricks Workspace Feature Store. Oba klienty są dostępne w PyPI: databricks-feature-engineering i databricks-feature-store.

Biblioteki są używane do:

  • Tworzenie, odczytywanie i zapisywanie tabel funkcji.
  • Trenowanie modeli na danych funkcji.
  • Publikuj tabele funkcji w sklepach internetowych, aby zapewnić obsługę w czasie rzeczywistym.

Aby uzyskać dokumentację użycia, zobacz Magazyn funkcji usługi Databricks. Aby uzyskać dokumentację interfejsu API języka Python, zobacz Interfejs API języka Python.

Klient Unity Catalog do inżynierii cech działa na rzecz cech i tablic cech w Unity Catalog. Klient magazynu funkcji w obszarze roboczym obsługuje funkcje i tabele funkcji w tym magazynie. Oba klienci są wstępnie zainstalowani w środowisku Databricks Runtime na potrzeby uczenia maszynowego. Mogą również działać w środowisku Databricks Runtime po zainstalowaniu databricks-feature-engineering z biblioteki PyPI (pip install databricks-feature-engineering). Tylko w przypadku testów jednostkowych, oba klienci mogą działać lokalnie lub w środowiskach CI/CD.

Aby zapoznać się z tabelą przedstawiającą zgodność wersji klienta ze środowiskami Databricks Runtime i Databricks Runtime ML, zobacz macierz zgodności inżynierii funkcji. Starsze wersje biblioteki klienta Feature Store dla obszaru roboczego Databricks są dostępne w PyPI jako databricks-feature-store.

databricks-feature-engineering 0.12.1

  • Obsługa wartości domyślnych dla wyszukiwań funkcji.
  • Poprawki błędów i ulepszenia.

databricks-feature-engineering 0.11.0

  • Dodano obsługę mlflow wersji 3.0.
  • Poprawki błędów i ulepszenia.

databricks-feature-engineering 0.10.2

  • Dodano obsługę mlflow wersji 2.20.0 lub nowszej.
  • Dodano obsługę numpy wersji 2.x.
  • Poprawki błędów i ulepszenia.

databricks-feature-engineering 0.9.0

  • Obsługa używania prebuilt_env w wywołaniach score_batch.
  • Funkcja łączenia funkcji punktu w czasie z ulepszeniami wydajności za pomocą aplikacji Photon.
  • Poprawki błędów i ulepszenia.

databricks-feature-engineering 0.8.0

  • Obsługa używania params w wywołaniach score_batch, co umożliwia przekazywanie dodatkowych parametrów do modelu na potrzeby wnioskowania.
  • Poprawki błędów i ulepszenia.

Databricks Feature Engineering wersja 0.7.0

  • Niektóre widoki w Unity Catalog mogą być teraz używane jako tabele cech na potrzeby trenowania i oceny modelu offline. Zobacz Odczyt z tabeli cech w Unity Catalog.
  • Zestawy szkoleniowe można teraz tworzyć przy użyciu wyszukiwań funkcji lub specyfikacji funkcji. Zobacz dokumentację referencyjną SDK języka Python.

databricks-feature-engineering 0.6.0

  • Uruchamianie sprzężeń punkt-w czasie z natywną platformą Spark jest teraz obsługiwane poza istniejącą obsługą rozwiązania Tempo. Ogromne dzięki Semyon Sinchenko za sugerowanie pomysłu!
  • StructType Jest teraz obsługiwany jako typ danych PySpark. StructType nie jest obsługiwana w przypadku obsługi online.
  • write_table obsługuje teraz zapisywanie w tabelach, które mają włączoną płynne klastrowanie.
  • Nazwa parametru timeseries_columns dla create_table elementu została zmieniona na timeseries_column. Istniejące przepływy pracy mogą nadal używać parametru timeseries_columns .
  • score_batch teraz obsługuje env_manager parametr . Aby uzyskać więcej informacji, zobacz dokumentację platformy MLflow.

pakiet databricks-feature-engineering w wersji 0.5.0

  • Nowe API update_feature_spec w databricks-feature-engineering, które umożliwia użytkownikom aktualizację właściciela FeatureSpec w Unity Catalog.

databricks-opracowywanie-cech 0.4.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.3.0

databricks-feature-store 0.17.0

  • databricks-feature-store jest przestarzały. Wszystkie istniejące moduły w tym pakiecie są dostępne w databricks-feature-engineering wersji 0.2.0 lub nowszej. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.

databricks-feature-engineering 0.2.0

  • databricks-feature-engineering teraz zawiera wszystkie moduły z programu databricks-feature-store. Aby uzyskać szczegółowe informacje, zobacz Interfejs API języka Python.

databricks-feature-store 0.16.3

  • Naprawia błąd przekroczenia limitu czasu podczas korzystania z rozwiązania AutoML z tabelami funkcji.

Databricks Feature Engineering wersja 0.1.3

  • Małe ulepszenia komponentu UpgradeClient.

databricks-feature-store 0.16.2

  • Teraz możesz utworzyć punkty końcowe funkcji i obsługi funkcji. Aby uzyskać więcej informacji, zapoznaj się z Obsługą funkcji i cech.

databricks-feature-store 0.16.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.1.2 i databricks-feature-store 0.16.0

  • Małe poprawki błędów i ulepszenia.
    • Naprawiono nieprawidłowe adresy URL linii zadań zarejestrowane w niektórych konfiguracjach obszaru roboczego.

databricks-feature-engineering 0.1.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-engineering 0.1.0

  • Ogólnie dostępna wersja opracowywania funkcji w kliencie języka Python katalogu Unity w PyPI.

databricks-feature-store 0.15.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.15.0

  • Teraz możesz automatycznie wnioskować i rejestrować przykład danych wejściowych podczas rejestrowania modelu. W tym celu ustaw infer_model_example na True, gdy wywołujesz log_model. Przykład jest oparty na danych treningowych określonych w parametrze training_set .

databricks-feature-store 0.14.2

  • Naprawiono błąd w publikowaniu do Aurora MySQL z konektora MariaDB/J >=2.7.5.

databricks-feature-store 0.14.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.14.0

Począwszy od wersji 0.14.0, należy określić kolumny klucza znaczników czasu w argumencie primary_keys. Klucze sygnatury czasowej są częścią "kluczy podstawowych", które jednoznacznie identyfikują każdy wiersz w tabeli funkcji. Podobnie jak inne kolumny klucza podstawowego, kolumny klucza sygnatury czasowej nie mogą zawierać wartości NULL.

W poniższym przykładzie user_features_df DataFrame zawiera następujące kolumny: user_id, ts, purchases_30di is_free_trial_active.

0.14.0 i nowsze

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys=["user_id", "ts"],
timestamp_keys="ts",
features_df=user_features_df,
)

0.13.1 i poniżej

fs = FeatureStoreClient()

fs.create_table(
name="ads_team.user_features",
primary_keys="user_id",
timestamp_keys="ts",
features_df=user_features_df,
)

databricks-feature-store 0.13.1

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.13.0

  • Minimalna wymagana mlflow-skinny wersja to teraz 2.4.0.
  • Tworzenie zestawu szkoleniowego kończy się niepowodzeniem, jeśli podana ramka danych nie zawiera wszystkich wymaganych kluczy wyszukiwania.
  • Podczas rejestrowania modelu korzystającego z tabel cech w Unity Catalog, podpis MLflow jest automatycznie rejestrowany razem z modelem.

databricks-feature-store 0.12.0

  • Teraz możesz usunąć sklep online przy użyciu interfejsu drop_online_table API.

databricks-feature-store 0.11.0

  • W przestrzeniach roboczych z obsługą wykazu Unity można teraz publikować tabele funkcjonalności zarówno obszaru roboczego, jak i wykazu Unity do sklepów online usługi Cosmos DB. Wymaga to środowiska Databricks Runtime 13.0 ML lub nowszego.

databricks-feature-store 0.10.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.9.0

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.8.0 (najnowsza wersja)

  • Małe poprawki błędów i ulepszenia.

databricks-feature-store 0.7.1

  • Dodaj flask jako zależność, aby rozwiązać problem z brakującą zależnością podczas oceniania modeli za pomocą polecenia score_batch.

databricks-feature-store 0.7.0

  • Małe poprawki błędów i ulepszenia.

repozytorium funkcji Databricks 0.6.1

  • Pierwsza publiczna wersja klienta Databricks Feature Store na PyPI.