Udostępnij przez


Tabele i widoki w usłudze Azure Databricks

Ten artykuł zawiera omówienie tabel, widoków, tabel przesyłania strumieniowego i zmaterializowanych widoków w usłudze Azure Databricks.

Stół

Tabela to ustrukturyzowany zestaw danych przechowywany w określonej lokalizacji. Domyślny typ tabeli utworzony w Azure Databricks to tabela zarządzana przez Unity Catalog. Tabele można zapytać i manipulować nimi przy użyciu poleceń SQL lub interfejsów API DataFrame, obsługujących operacje takie jak INSERT, UPDATE, DELETE i MERGE INTO. Zobacz tabele Azure Databricks

Widok

Widok to tabela wirtualna zdefiniowana przez zapytanie, które nie przechowuje danych i może przedstawiać dane z co najmniej jednej tabeli w określonym formacie lub abstrakcji. Widoki są przydatne do upraszczania złożonych zapytań, inkapsulacji logiki biznesowej i zapewnienia spójnego interfejsu do danych bazowych bez duplikowania przechowywania danych. Zobacz Co to jest widok?

Zmaterializowany widok

Podobnie jak w widoku, zmaterializowany widok jest definiowany przez zapytanie. Jednak w przeciwieństwie do widoku zmaterializowany widok wstępnie skompiluje i przechowuje wynik zapytania. Zapytania mogą działać szybciej na widokach zmaterializowanych niż tradycyjnych widokach, ale zajmują dodatkowe miejsce na dysku. Za pomocą usługi Databricks SQL można utworzyć i odświeżyć autonomiczny zmaterializowany widok lub użyć Lakeflow Spark Declarative Pipelines, aby utworzyć i odświeżyć jeden lub więcej zmaterializowanych widoków, tabel strumieniowych oraz widoków. Zobacz Używanie zmaterializowanych widoków w Databricks SQL i Zmaterializowane widoki.

Tabela przesyłania strumieniowego

Tabela strumieniowa jest typem tabeli zarządzanej w Unity Catalog, która zawiera logikę przetwarzania przy użyciu przepływów do jej zdefiniowania. SQL w Databricks umożliwia tworzenie i odświeżanie samodzielnej tabeli streamingu lub używanie Deklaratywnych Potoków Lakeflow Spark do tworzenia i odświeżania jednej lub więcej tabel streamingu, zmaterializowanych widoków oraz widoków. Zobacz Używaj tabel przesyłania strumieniowego w Databricks SQL i Tabele strumieniowe.

Zmaterializowany widok kontra tabela przesyłania strumieniowego

Zmaterializowane widoki i tabele przesyłania strumieniowego to dwa typowe obiekty danych używane do inżynierii danych. Zmaterializowane widoki używają semantyki wsadowej, a tabele strumieniowe - semantyki strumieniowej. Aby zapoznać się z porównaniem przetwarzania wsadowego i strumieniowego oraz kwestiami wyboru dla obciążeń związanych z inżynierią danych, zobacz Przetwarzanie danych wsadowych vs. strumieniowych w Azure Databricks.