Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ta strona zawiera linki do dokumentacji interfejsu API języka Python usługi Databricks Feature Engineering and Databricks legacy Workspace Feature Store oraz informacji o pakietach klienta databricks-feature-engineering i databricks-feature-store.
Uwaga
Od wersji 0.17.0 databricks-feature-store zostało oznaczone jako przestarzałe. Wszystkie istniejące moduły z tego pakietu są teraz dostępne w databricks-feature-engineering wersji 0.2.0 lub nowszej. Aby uzyskać informacje na temat migracji do databricks-feature-engineering, zapoznaj się z Migracja do databricks-feature-engineering.
Macierz zgodności
Pakiet i klient, którego należy użyć, zależą od tego, gdzie znajdują się tabele funkcji, oraz od używanej wersji usługi Databricks Runtime ML, jak pokazano w poniższej tabeli.
Aby zidentyfikować wersję pakietu wbudowaną w wersję uczenia maszynowego środowiska Databricks Runtime, zobacz macierz zgodności inżynierii funkcji.
| Wersja środowiska Databricks Runtime | W przypadku tabel funkcji w programie | Korzystanie z pakietu | Korzystanie z klienta języka Python |
|---|---|---|---|
| Databricks Runtime 14.3 ML i późniejsze wersje | Katalog Unity | databricks-feature-engineering |
FeatureEngineeringClient |
| Databricks Runtime 14.3 ML i późniejsze wersje | Obszar roboczy | databricks-feature-engineering |
FeatureStoreClient |
| Środowisko Databricks Runtime 14.2 ML i starsze | Katalog Unity | databricks-feature-engineering |
FeatureEngineeringClient |
| Środowisko Databricks Runtime 14.2 ML i starsze | Obszar roboczy | databricks-feature-store |
FeatureStoreClient |
Uwaga
-
databricks-feature-engineering<=0.7.0nie jest zgodny zmlflow>=2.18.0. Aby użyćdatabricks-feature-engineeringz platformą MLflow w wersji 2.18.0 lub nowszej, przeprowadź uaktualnienie do wersjidatabricks-feature-engineeringw wersji 0.8.0 lub nowszej.
Informacje o wersji
Dokumentacja interfejsu API języka Python inżynierii funkcji
Zobacz dokumentację interfejsu API języka Python inżynierii funkcji.
Dokumentacja interfejsu API języka Python (przestarzałe) dla Sklepu Funkcji Obszaru Roboczego
Uwaga
- Od wersji 0.17.0
databricks-feature-storezostało oznaczone jako przestarzałe. Wszystkie istniejące moduły z tego pakietu są teraz dostępne wdatabricks-feature-engineeringwersji 0.2.0 lub nowszej.
Aby uzyskać informacje o databricks-feature-store wersji v0.17.0, zobacz Dokumentacja interfejsu API Databricks FeatureStoreClient w języku Python do inżynierii funkcji, aby zapoznać się z najnowszymi informacjami o interfejsie API magazynu funkcji obszaru roboczego.
W przypadku wersji 0.16.3 i starszych użyj linków w tabeli, aby pobrać lub wyświetlić dokumentację interfejsu API języka Python Feature Store. Aby określić preinstalowaną wersję środowiska Databricks Runtime ML, zapoznaj się z macierzą zgodności.
| Wersja | Pobierz plik PDF | Referencja API online |
|---|---|---|
| z wersji 0.3.5 do wersji 0.16.3 | Pdf z dokumentacją interfejsu API języka Python w sklepie Feature Store 0.16.3 | Dokumentacja interfejsu API online |
| wersja 0.3.5 i starsze | Plik PDF z dokumentacją interfejsu API języka Python w sklepie Feature Store 0.3.5 | Dokumentacja referencyjna API online jest niedostępna |
Pakiet języka Python
W tej sekcji opisano sposób instalowania pakietów języka Python w celu korzystania z usługi Databricks Feature Engineering i Databricks Workspace Feature Store.
Inżynieria cech
Uwaga
- Począwszy od wersji 0.2.0,
databricks-feature-engineeringzawiera moduły do pracy z tabelami cech w Unity Catalog i Workspace Feature Store.databricks-feature-engineeringwersja poniżej 0.2.0 działa tylko z tabelami funkcji w katalogu Unity.
Interfejsy API tworzenia cech usługi Databricks są dostępne za pośrednictwem pakietu klienta języka Python databricks-feature-engineering. Klient jest dostępny w PyPI i jest wstępnie zainstalowany w środowisku Databricks Runtime 13.3 LTS ML i nowszych wersjach.
Aby uzyskać informacje o wersji klienta odpowiadającej wersji środowiska uruchomieniowego, zobacz macierz zgodności.
Aby zainstalować klienta w środowisku Databricks Runtime:
%pip install databricks-feature-engineering
Aby zainstalować klienta w lokalnym środowisku języka Python:
pip install databricks-feature-engineering
Magazyn funkcji przestrzeni roboczej (przestarzałe)
Uwaga
- Od wersji 0.17.0
databricks-feature-storezostało oznaczone jako przestarzałe. Wszystkie istniejące moduły z tego pakietu są teraz dostępne wdatabricks-feature-engineeringwersji 0.2.0 lub nowszej. - Więcej informacji można znaleźć w Migrate to databricks-feature-engineering.
Interfejsy API repozytorium funkcji Databricks są dostępne za pośrednictwem pakietu klienta Python databricks-feature-store. Pakiet jest dostępny na platformie PyPI i jest wstępnie zainstalowany w środowisku uruchomieniowym Databricks dla uczenia maszynowego. Aby uzyskać informacje o tym, które środowisko uruchomieniowe zawiera wersję klienta, zobacz macierz zgodności.
Aby zainstalować klienta w środowisku Databricks Runtime:
%pip install databricks-feature-store
Aby zainstalować klienta w lokalnym środowisku języka Python:
pip install databricks-feature-store
Migrowanie do databricks-feature-engineering
Aby zainstalować databricks-feature-engineering pakiet, użyj polecenia pip install databricks-feature-engineering zamiast pip install databricks-feature-store. Wszystkie moduły w databricks-feature-store zostały przeniesione do databricks-feature-engineering, więc nie trzeba zmieniać żadnego kodu. Instrukcje importu, takie jak from databricks.feature_store import FeatureStoreClient będą nadal działać po zainstalowaniu programu databricks-feature-engineering.
Aby pracować z tabelami cech w Unity Catalog, użyj polecenia FeatureEngineeringClient. Aby użyć magazynu funkcji Workspace, należy użyć FeatureStoreClient.
Obsługiwane scenariusze
W przypadku usługi Databricks, w tym środowiska Databricks Runtime i środowiska Databricks Runtime na potrzeby uczenia maszynowego, można wykonywać następujące czynności:
- Tworzenie, odczytywanie i zapisywanie tabel funkcji.
- Trenowanie i ocenianie modeli na danych cech.
- Publikuj tabelę cech w sklepach internetowych na potrzeby serwowania w czasie rzeczywistym.
Ze środowiska lokalnego lub środowiska zewnętrznego do usługi Databricks można wykonywać następujące czynności:
- Opracowywanie kodu przy użyciu lokalnej obsługi środowiska IDE.
- Test jednostkowy korzystający ze struktur makiety.
- Napisz testy integracyjne do uruchomienia w usłudze Databricks.
Ograniczenia
Bibliotekę klienta można uruchamiać tylko w usłudze Databricks, w tym w środowisku Databricks Runtime i Databricks Runtime for Machine Learning. Nie obsługuje wywoływania inżynierii cech w katalogu Unity ani interfejsów API sklepu cech z lokalnego środowiska lub ze środowiska innego niż Databricks.
Używanie klientów do testowania jednostkowego
Możesz zainstalować klienta Unity Catalog dla inżynierii funkcji lub klienta Feature Store lokalnie, aby umożliwić łatwiejsze przeprowadzanie testów jednostkowych.
Aby na przykład potwierdzić, że metoda update_customer_features poprawnie wywołuje metodę FeatureEngineeringClient.write_table (lub dla Magazynu Funkcji Obszaru Roboczego, FeatureStoreClient.write_table), możesz napisać:
from unittest.mock import MagicMock, patch
from my_feature_update_module import update_customer_features
from databricks.feature_engineering import FeatureEngineeringClient
@patch.object(FeatureEngineeringClient, "write_table")
@patch("my_feature_update_module.compute_customer_features")
def test_something(compute_customer_features, mock_write_table):
customer_features_df = MagicMock()
compute_customer_features.return_value = customer_features_df
update_customer_features() # Function being tested
mock_write_table.assert_called_once_with(
name='ml.recommender_system.customer_features',
df=customer_features_df,
mode='merge'
)
Używanie klientów do testowania integracji
Testy integracji można uruchamiać za pomocą Feature Engineering w kliencie Unity Catalog lub kliencie Feature Store na platformie Databricks. Aby uzyskać szczegółowe informacje, zobacz Narzędzia deweloperskie i wskazówki: użyj CI/CD.