Partilhar via


Tabelas e vistas no Azure Databricks

Este artigo fornece uma visão geral de tabelas, modos de exibição, tabelas de streaming e exibições materializadas no Azure Databricks.

Tabela

Uma tabela é um conjunto de dados estruturado armazenado em um local específico. O tipo de tabela padrão criado no Azure Databricks é uma tabela gerenciada pelo Catálogo Unity. As tabelas podem ser consultadas e manipuladas usando comandos SQL ou APIs DataFrame, suportando operações como INSERT, UPDATE, DELETEe MERGE INTO. Consulte as tabelas do Azure Databricks

Visualizar

Uma exibição é uma tabela virtual definida por uma consulta que não armazena dados e pode apresentar dados de uma ou mais tabelas em um formato ou abstração específicos. As exibições são úteis para simplificar consultas complexas, encapsular a lógica de negócios e fornecer uma interface consistente para os dados subjacentes sem duplicar o armazenamento. Consulte O que é uma vista?

Visão materializada

Semelhante a uma vista, uma vista materializada é definida por uma consulta. No entanto, ao contrário de uma vista, uma vista materializada pré-calcula e armazena o resultado da consulta. As consultas podem ser executadas mais rapidamente nas vistas materializadas do que nas vistas, mas ocupam mais espaço de armazenamento. Você pode usar o Databricks SQL para criar e atualizar uma exibição materializada autônoma ou usar o Lakeflow Spark Declarative Pipelines para criar e atualizar uma ou mais exibições materializadas, tabelas de streaming e exibições. Consulte Usar exibições materializadas em Databricks SQL e Exibições materializadas.

Tabela de streaming

Uma tabela de streaming é um tipo de tabela gerenciada pelo Unity Catalog que inclui a lógica de processamento usando fluxos para defini-la. Você pode usar o Databricks SQL para criar e atualizar uma tabela de streaming independente ou usar o Lakeflow Spark Declarative Pipelines para criar e atualizar uma ou mais tabelas de streaming, vistas materializadas e vistas. Consulte Usar tabelas de streaming no Databricks SQL e Tabelas de Streaming.

Vista materializada vs. tabela de streaming

Visualizações materializadas e tabelas de streaming são dois objetos de dados comuns usados para engenharia de dados. As visualizações materializadas usam semântica em lote e as tabelas de streaming usam semântica de streaming. Para obter uma comparação entre lote e streaming e considerações para escolhê-los para suas cargas de trabalho de engenharia de dados, consulte Processamento de dados em lote versus streaming no Azure Databricks.