Compartir a través de


Tablas y vistas en Azure Databricks

En este artículo se proporciona información general sobre tablas, vistas, tablas de streaming y vistas materializadas en Azure Databricks.

Tabla

Una tabla es un conjunto de datos estructurado almacenado en una ubicación específica. El tipo de tabla predeterminado creado en Azure Databricks es una tabla administrada por el catálogo de Unity. Las tablas se pueden consultar y manipular mediante comandos SQL o API dataFrame, que admiten operaciones como INSERT, UPDATE, DELETEy MERGE INTO. Consulte Tablas de Azure Databricks.

Vista

Una vista es una tabla virtual definida por una consulta que no almacena datos y que puede presentar datos de una o varias tablas en un formato o abstracción específicos. Las vistas son útiles para simplificar consultas complejas, encapsular la lógica de negocios y proporcionar una interfaz coherente a los datos subyacentes sin duplicar el almacenamiento. Por favor, consulte ¿Qué es una vista?

Vista materializada

De forma similar a una vista, una consulta define una vista materializada. Sin embargo, a diferencia de una vista, una vista materializada precalcula y almacena el resultado de la consulta. Las consultas se pueden ejecutar más rápido en la vista materializada que las vistas, pero ocupan almacenamiento adicional. Puede usar Databricks SQL para crear y actualizar una vista materializada independiente o usar canalizaciones declarativas de Spark de Lakeflow para crear y actualizar una o varias vistas materializadas, tablas de streaming y vistas. Consulte Uso de vistas materializadas en Databricks SQL y vistas materializadas.

Tabla de flujo de datos

Una tabla de streaming es un tipo de tabla administrada de Unity Catalog que incluye la lógica de procesamiento mediante flujos para definirla. Puede usar Databricks SQL para crear y actualizar una tabla de streaming independiente o usar canalizaciones declarativas de Spark de Lakeflow para crear y actualizar una o varias tablas de streaming, vistas materializadas y vistas. Consulte Uso de tablas de streaming en Databricks SQL y Tablas de streaming.

Vista materializada versus tabla en streaming

Las vistas materializadas y las tablas de streaming son dos objetos de datos comunes que se usan para la ingeniería de datos. Las vistas materializadas usan la semántica por lotes y las tablas de streaming usan la semántica de streaming. Para obtener una comparación entre el procesamiento por lotes y el streaming y las consideraciones para elegirlas para las cargas de trabajo de ingeniería de datos, consulte Procesamiento de datos por lotes frente al procesamiento de datos de streaming en Azure Databricks.