Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página é uma visão geral dos recursos disponíveis quando você usa o Databricks Feature Store com o Unity Catalog.
O Databricks Feature Store fornece um registro central para recursos usados em seus modelos de IA e ML. As tabelas e modelos de recursos são registrados no Unity Catalog, fornecendo governança integrada, linhagem e compartilhamento e descoberta de recursos entre espaços de trabalho. Com o Databricks, todo o fluxo de trabalho de treinamento do modelo ocorre em uma única plataforma, incluindo:
- Pipelines de dados que ingerem dados brutos, criam tabelas de características, treinam modelos e executam inferência em lote.
- Modelo e recurso servindo pontos de extremidade que estão disponíveis com um único clique e que fornecem milissegundos de latência.
- Monitorização de dados e modelos.
Quando você usa recursos da loja de recursos para treinar modelos, o modelo rastreia automaticamente a linhagem para os recursos que foram usados no treinamento. No momento da inferência, o modelo procura automaticamente os valores de recurso mais recentes. A loja de recursos também fornece computação sob demanda de recursos para aplicativos em tempo real. O repositório de recursos lida com todas as tarefas de computação de recursos. Isso elimina a distorção de treinamento/serviço, garantindo que os cálculos de recursos usados na inferência sejam os mesmos usados durante o treinamento do modelo. Ele também simplifica significativamente o código do lado do cliente, já que todas as pesquisas de recursos e computação são manipuladas pelo repositório de recursos.
Observação
Esta página aborda a engenharia de características e as capacidades de serviço para espaços de trabalho ativados para o Unity Catalog. Se o seu espaço de trabalho não estiver habilitado para o Catálogo Unity, consulte Workspace Feature Store (legado).
Descrição geral conceptual
Para uma visão geral de como funciona a Databricks Feature Store e um glossário de termos, consulte a visão geral e o glossário da Feature store.
Engenharia de recursos
| Característica | Description |
|---|---|
| Trabalhar com tabelas de recursos no Catálogo Unity | Crie e trabalhe com tabelas de recursos. |
Descubra e partilhe funcionalidades
| Característica | Description |
|---|---|
| Explore os recursos do Catálogo Unity | Explore e gerencie tabelas de recursos usando o Catalog Explorer e a interface do usuário de recursos. |
| Usar tags com tabelas de recursos e recursos no Unity Catalog | Use pares chave-valor simples para categorizar e gerenciar suas tabelas e recursos de recursos. |
Usar recursos em fluxos de trabalho de treinamento
| Característica | Description |
|---|---|
| Usar recursos para treinar modelos | Use recursos para treinar modelos. |
| O recurso point-in-time se junta | Use a correção point-in-time para criar um conjunto de dados de treinamento que reflita os valores do recurso a partir do momento em que uma observação de rótulo foi registrada. |
| Python API | Referência da API Python |
Servir funcionalidades
| Característica | Description |
|---|---|
| Lojas de recursos on-line Databricks | Forneça dados de recursos para aplicativos on-line e modelos de aprendizado de máquina em tempo real. Desenvolvido por Databricks Lakebase. |
| Apresentação de modelos com pesquisa automática de funcionalidades | Pesquise automaticamente valores de recursos de uma loja online. |
| Pontos de extremidade de serviço de recursos | Forneça recursos para modelos e aplicativos fora do Databricks. |
| Computação de recursos sob demanda | Calcule os valores do recurso no momento da inferência. |
Governança e linhagem de funcionalidades
| Característica | Description |
|---|---|
| Governança e linhagem de recursos | Use o Unity Catalog para controlar o acesso a tabelas de recursos e exibir a linhagem de uma tabela de recursos, modelo ou função. |
Tutoriais
| Tutorial | Description |
|---|---|
| Exemplos de blocos de notas para começar |
Caderno básico. Mostra como criar uma tabela de recursos, usá-la para treinar um modelo e executar a pontuação em lote usando a pesquisa automática de recursos. Também mostra a interface do usuário de engenharia de recursos para pesquisar recursos e exibir linhagem. Exemplo de táxi caderno. Mostra o processo de criação de recursos, atualizando-os e usando-os para treinamento de modelo e inferência em lote. |
| Exemplo: implantar e consultar um ponto de extremidade de serviço de recurso | Tutorial e bloco de anotações de exemplo mostrando como implantar e consultar um ponto de extremidade de serviço de recurso. |
| Exemplo: usar recursos com aplicativos RAG estruturados | Tutorial mostrando como usar tabelas on-line Databricks e pontos de extremidade de serviço de recursos para aplicativos de geração aumentada (RAG) de recuperação. |
Requisitos
- Seu espaço de trabalho deve estar habilitado para o Catálogo Unity.
- A engenharia de características no Unity Catalog requer o Databricks Runtime 13.3 LTS ou posterior.
Se o seu espaço de trabalho não atender a esses requisitos, consulte Repositório de Recursos de Espaço de Trabalho (legado) para saber como usar o Repositório de Recursos de Espaço de Trabalho herdado.
Tipos de dados suportados:
A engenharia de recursos no Unity Catalog e no Workspace Feature Store herdado suporta os seguintes tipos de dados PySpark:
IntegerTypeFloatTypeBooleanTypeStringTypeDoubleTypeLongTypeTimestampTypeDateTypeShortTypeArrayType-
BinaryType[1] -
DecimalType[1] -
MapType[1] -
StructType[2]
[1] BinaryType, DecimalTypee MapType são suportados em todas as versões do Feature Engineering no Unity Catalog e no Workspace Feature Store v0.3.5 ou superior.
[2] StructType é suportado no Feature Engineering v0.6.0 ou superior.
Os tipos de dados listados acima suportam tipos de recursos que são comuns em aplicativos de aprendizado de máquina. Por exemplo:
- Você pode armazenar vetores densos, tensores e incorporações como
ArrayType. - Você pode armazenar vetores, tensores e incorporações esparsos como
MapType. - Você pode armazenar texto como
StringType.
Quando publicado em lojas online, os recursos ArrayType e MapType são armazenados no formato JSON.
A interface do usuário do Feature Store exibe metadados sobre tipos de dados de recursos:
Mais informações
Para obter mais informações sobre práticas recomendadas, baixe o Guia abrangente para lojas de recursos.