Partilhar via


Migrar de tabelas online herdadas e de terceiros

Esta página descreve como migrar as suas tabelas online existentes. Você pode migrar para o seguinte:

  • Uma loja de recursos online
  • Uma tabela sincronizada Lakebase

Importante

As tabelas online Databricks já não são suportadas.

Databricks Online Feature Store (powered by Lakebase) é a abordagem recomendada para o serviço de recursos online.

Listar todas as tabelas online existentes

Para ver todas as tabelas online existentes em seu espaço de trabalho, use uma consulta SQL ou um script Python.

SQL

Substitua <workspace_url> e <workspace_id> com as informações do seu espaço de trabalho.

SELECT
  CONCAT("https://<workspace_url>/pipelines/", usage_metadata.dlt_pipeline_id, "?o=<workspace_id>"),
  SUM(usage_quantity)
FROM
  system.billing.usage
WHERE
  usage_date > DATE_SUB(NOW(), 7)
  AND billing_origin_product = 'ONLINE_TABLES'
GROUP BY
  ALL;

Python

from databricks.sdk import *
from databricks.sdk.service.catalog import *

w = WorkspaceClient()

result = []
for catalog in w.catalogs.list():
    for schema in w.schemas.list(catalog_name=catalog.name):
        for table in w.tables.list(catalog_name=catalog.name, schema_name=schema.name):
            if table.table_type == TableType.FOREIGN and table.data_source_format == DataSourceFormat.MYSQL_FORMAT and table.pipeline_id is not None:
                result.append((table.full_name, table.comment))

print(result)

Migrar tabelas online para a loja de recursos online para pontos de extremidade de serviço de modelo ou recurso

Importante

Esta funcionalidade está na Pré-visualização Pública e está disponível nas seguintes regiões:

westus, westus2, , eastus, , eastus2northeuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiacentralussouthcentralussoutheastasiauksouth

Etapa 1: criar uma loja de recursos online e publicar as tabelas de recursos

A Databricks recomenda a criação de uma única loja online por espaço de trabalho para testes e provas de conceito. Para casos de uso de produção ou requisitos de isolamento, você pode provisionar lojas adicionais.

from databricks.feature_engineering import FeatureEngineeringClient

fe = FeatureEngineeringClient()

# Create a single online store that can support multiple feature tables
fe.create_online_store(
    name="online-feature-store",
    capacity="CU_1"
)

Para obter detalhes sobre a publicação de tabelas de recursos, consulte Databricks Online Feature Stores.

Etapa 2: atualizar o ponto de extremidade que depende desses recursos online

Use o SDK Databricks para Python ou a interface para atualizar o endpoint com uma nova variável MIGRATE_FEATURE_STORE de ambiente com a data atual como valor.

from databricks.sdk import WorkspaceClient
from databricks.sdk.service.serving import EndpointCoreConfigInput, ServedEntityInput

workspace = WorkspaceClient()

workspace.serving_endpoints.update_config(
  name="my-serving-endpoint",
  served_entities=[
    ServedEntityInput(
      entity_name="main.default.customer_features",
      workload_size="Small",
      scale_to_zero_enabled=True,
      environment_vars={
        # Set to the current date (optional time) to indicate migration to online store
        # This environment variable can be removed after January 15, 2026.
        "MIGRATE_FEATURE_STORE": "2025-11-13"
      }
    )
  ]
)

Para obter detalhes, consulte Atualizar um ponto de extremidade.

Passo 3: Limpe as suas mesas online

Verifique se o ponto de extremidade está usando a nova loja online verificando se os eventos do ponto de extremidade contêm mensagens como Linked to Online Feature Store table: "table name". Consulte Monitorar a qualidade do modelo e a integridade do ponto final.

Em seguida, exclua suas tabelas online herdadas. Consulte Excluir uma tabela online usando a interface do usuário ou Excluir uma tabela online usando APIs.

Migrar tabelas online para tabelas sincronizadas para OLTP

Importante

Esta funcionalidade está na Pré-visualização Pública nas seguintes regiões: westus, westus2, eastus, eastus2, centralussouthcentralusnortheuropewesteuropeaustraliaeastbrazilsouthcanadacentralcentralindiasoutheastasiauksouth.

Etapa 1: Criar uma instância de banco de dados

Para começar, crie uma instância de banco de dados Lakebase para armazenar suas tabelas sincronizadas. Consulte Criar e gerenciar uma instância de banco de dados.

Opcionalmente, você pode criar um catálogo de banco de dados para usar os privilégios do Unity Catalog para gerenciar o acesso aos dados. Consulte Registrar seu banco de dados no Catálogo Unity.

Etapa 2: Criar uma tabela sincronizada a partir da tabela de origem

Uma tabela sincronizada é uma tabela Postgres de leitura apenas do Unity Catalog que sincroniza automaticamente os dados de uma tabela do Unity Catalog para a sua instância de base de dados Lakebase.

Para migrar de tabelas online para tabelas sincronizadas, crie uma tabela sincronizada a partir da tabela de origem de uma tabela online:

  1. No ícone Dados.Catalogar, selecione a tabela online que deseja migrar para uma tabela sincronizada.
  2. Na guia Visão geral , na seção Descrição , clique no nome da tabela Origem.
  3. Crie uma tabela sincronizada a partir da tabela de origem selecionada. Veja Reverse ETL com Lakebase.
    • Você pode armazenar a tabela sincronizada no mesmo local do catálogo que a tabela online existente.
    • Você pode compartilhar um pipeline entre tabelas sincronizadas.
  4. Depois que a tabela sincronizada for criada, você poderá se conectar à instância do banco de dados e consultá-la diretamente. Consulte Conectar e consultar.

Passo 3: Limpe as suas mesas online

Depois de criar as tabelas sincronizadas, exclua as tabelas online. Consulte Excluir uma tabela online usando a interface do usuário ou Excluir uma tabela online usando APIs.

Excluir uma tabela online usando a interface do usuário

Na página da tabela online, selecione Excluir no ícone do menu Kebab.

Excluir uma tabela online usando APIs

Databricks SDK - Python

w.online_tables.delete('main.default.my_online_table')

API REST

curl --request DELETE \
  "https://xxx.databricks.com/api/2.0/online-tables/main.default.my_online_table" \
  --header "Authorization: Bearer xxx"

A exclusão da tabela online interrompe qualquer sincronização de dados em andamento e libera todos os seus recursos.