Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página fornece links para a documentação da API Python do Databricks Feature Engineering e do Databricks legacy Workspace Feature Store, além de informações sobre os pacotes de cliente databricks-feature-engineering e databricks-feature-store.
Nota
A partir da versão 0.17.0, databricks-feature-store foi preterido. Todos os módulos existentes deste pacote estão agora disponíveis na databricks-feature-engineering versão 0.2.0 e posterior. Para obter informações sobre como migrar para o databricks-feature-engineering, consulte Migrar para databricks-feature-engineering.
Matriz de compatibilidade
O pacote e o cliente que você deve usar dependem de onde suas tabelas de recursos estão localizadas e qual versão do Databricks Runtime ML você está executando, conforme mostrado na tabela a seguir.
Para identificar a versão do pacote incorporada à versão do Databricks Runtime ML, consulte a matriz de compatibilidade do Feature Engineering.
| Versão do Databricks Runtime | Para tabelas de funcionalidades em | Utilizar pacote | Usar cliente Python |
|---|---|---|---|
| Databricks Runtime 14.3 ML ou superior | Catálogo Unity | databricks-feature-engineering |
FeatureEngineeringClient |
| Databricks Runtime 14.3 ML ou superior | Área de trabalho | databricks-feature-engineering |
FeatureStoreClient |
| Databricks Runtime 14.2 ML ou abaixo | Catálogo Unity | databricks-feature-engineering |
FeatureEngineeringClient |
| Databricks Runtime 14.2 ML ou abaixo | Área de trabalho | databricks-feature-store |
FeatureStoreClient |
Nota
-
databricks-feature-engineering<=0.7.0não é compatível commlflow>=2.18.0. Para usardatabricks-feature-engineeringcom MLflow 2.18.0 e superior, atualize paradatabricks-feature-engineeringversão 0.8.0 ou superior.
Notas de versão
Consulte Engenharia de Funcionalidades do Databricks e notas de versão do Workspace Feature Store legadas.
Referência da API Python de Engenharia de Recursos
Consulte a referência da API Python de Engenharia de Características.
Referência da API Python do Armazenamento de Funcionalidades de Espaço de Trabalho (descontinuada)
Nota
- A partir da versão 0.17.0,
databricks-feature-storefoi preterido. Todos os módulos existentes deste pacote estão agora disponíveis nadatabricks-feature-engineeringversão 0.2.0 e posterior.
Para databricks-feature-store v0.17.0, consulte Databricks FeatureStoreClient em Feature Engineering Python API reference para obter a referência mais recente da API do Workspace Feature Store.
Para v0.16.3 e abaixo, use os links na tabela para baixar ou exibir a referência da API Python do Feature Store. Para determinar a versão pré-instalada para sua versão do Databricks Runtime ML, consulte a matriz de compatibilidade.
| Versão | Transferir PDF | Referência da API online |
|---|---|---|
| v0.3.5 a v0.16.3 | Repositório de recursos Python API 0.16.3 referência PDF | Referência da API online |
| v0.3.5 e inferior | Repositório de Funcionalidades Python API 0.3.5 PDF de Referência | Referência de API on-line não disponível |
Pacote Python
Esta seção descreve como instalar os pacotes Python para usar o Databricks Feature Engineering e o Databricks Workspace Feature Store.
Engenharia de Características
Nota
- A partir da versão 0.2.0,
databricks-feature-engineeringcontém módulos para trabalhar com tabelas de recursos no Unity Catalog e no Workspace Feature Store.databricks-feature-engineeringabaixo a versão 0.2.0 só funciona com tabelas de recursos no Unity Catalog.
As APIs de engenharia de recursos do Databricks estão disponíveis através do pacote databricks-feature-engineeringdo cliente Python . O cliente está disponível no PyPI e está pré-instalado no Databricks Runtime 13.3 LTS ML e superior.
Para obter uma referência de qual versão do cliente corresponde a qual versão de tempo de execução, consulte a matriz de compatibilidade.
Para instalar o cliente no Databricks Runtime:
%pip install databricks-feature-engineering
Para instalar o cliente em um ambiente Python local:
pip install databricks-feature-engineering
Repositório de recursos do espaço de trabalho (preterido)
Nota
- A partir da versão 0.17.0,
databricks-feature-storefoi preterido. Todos os módulos existentes deste pacote estão agora disponíveis nadatabricks-feature-engineeringversão 0.2.0 e posterior. - Consulte Migrar para databricks-feature-engineering para obter mais informações.
As APIs do Databricks Feature Store estão disponíveis através do pacote databricks-feature-storedo cliente Python . O cliente está disponível no PyPI e está pré-instalado no Databricks Runtime for Machine Learning. Para obter uma referência de qual tempo de execução inclui qual versão do cliente, consulte a matriz de compatibilidade.
Para instalar o cliente no Databricks Runtime:
%pip install databricks-feature-store
Para instalar o cliente em um ambiente Python local:
pip install databricks-feature-store
Migrar para databricks-feature-engineering
Para instalar o databricks-feature-engineering pacote, use pip install databricks-feature-engineering em vez de pip install databricks-feature-store. Todos os módulos em databricks-feature-store foram movidos para databricks-feature-engineering, portanto, não é necessário alterar nenhum código. Instruções de importação, como from databricks.feature_store import FeatureStoreClient, continuarão a funcionar após a instalação de databricks-feature-engineering.
Para trabalhar com tabelas de recursos no Unity Catalog, use FeatureEngineeringClient. Para usares o Repositório de Recursos do Espaço de Trabalho, deves usar FeatureStoreClient.
Cenários suportados
No Databricks, incluindo Databricks Runtime e Databricks Runtime for Machine Learning, você pode:
- Crie, leia e escreva tabelas de funcionalidades.
- Treine e pontue modelos em dados de características.
- Publique tabelas de funcionalidades em lojas online para disponibilização em tempo real.
A partir de um ambiente local ou externo ao Databricks, você pode:
- Desenvolva código com suporte IDE local.
- Teste de unidade usando estruturas simuladas.
- Escreva testes de integração para serem executados no Databricks.
Limitações
A biblioteca de cliente só pode ser executada em Databricks, incluindo Databricks Runtime e Databricks Runtime for Machine Learning. Não suporta chamar o Feature Engineering no Unity Catalog ou as APIs do Feature Store a partir de um ambiente local ou de um ambiente diferente do Databricks.
Utilize os clientes para testes de unidade
Você pode instalar o Feature Engineering no cliente Unity Catalog ou o cliente Feature Store localmente para ajudar na execução de testes de unidade.
Por exemplo, para validar que um método update_customer_features chama FeatureEngineeringClient.write_table corretamente (ou para o Workspace Feature Store, FeatureStoreClient.write_table), você pode escrever:
from unittest.mock import MagicMock, patch
from my_feature_update_module import update_customer_features
from databricks.feature_engineering import FeatureEngineeringClient
@patch.object(FeatureEngineeringClient, "write_table")
@patch("my_feature_update_module.compute_customer_features")
def test_something(compute_customer_features, mock_write_table):
customer_features_df = MagicMock()
compute_customer_features.return_value = customer_features_df
update_customer_features() # Function being tested
mock_write_table.assert_called_once_with(
name='ml.recommender_system.customer_features',
df=customer_features_df,
mode='merge'
)
Use os clientes para testes de integração
Você pode executar testes de integração com o cliente Feature Engineering no Unity Catalog ou o cliente Feature Store no Databricks. Para obter detalhes, consulte Developer Tools and Guidance: Use CI/CD.