Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ten artykuł zawiera omówienie tabel, widoków, tabel przesyłania strumieniowego i zmaterializowanych widoków w usłudze Azure Databricks.
Stół
Tabela to ustrukturyzowany zestaw danych przechowywany w określonej lokalizacji. Domyślny typ tabeli utworzony w Azure Databricks to tabela zarządzana przez Unity Catalog. Tabele można zapytać i manipulować nimi przy użyciu poleceń SQL lub interfejsów API DataFrame, obsługujących operacje takie jak INSERT, UPDATE, DELETE i MERGE INTO. Zobacz tabele Azure Databricks
Widok
Widok to tabela wirtualna zdefiniowana przez zapytanie, które nie przechowuje danych i może przedstawiać dane z co najmniej jednej tabeli w określonym formacie lub abstrakcji. Widoki są przydatne do upraszczania złożonych zapytań, inkapsulacji logiki biznesowej i zapewnienia spójnego interfejsu do danych bazowych bez duplikowania przechowywania danych. Zobacz Co to jest widok?
Zmaterializowany widok
Podobnie jak w widoku, zmaterializowany widok jest definiowany przez zapytanie. Jednak w przeciwieństwie do widoku zmaterializowany widok wstępnie skompiluje i przechowuje wynik zapytania. Zapytania mogą działać szybciej na widokach zmaterializowanych niż tradycyjnych widokach, ale zajmują dodatkowe miejsce na dysku. Za pomocą usługi Databricks SQL można utworzyć i odświeżyć autonomiczny zmaterializowany widok lub użyć Lakeflow Spark Declarative Pipelines, aby utworzyć i odświeżyć jeden lub więcej zmaterializowanych widoków, tabel strumieniowych oraz widoków. Zobacz Używanie zmaterializowanych widoków w Databricks SQL i Zmaterializowane widoki.
Tabela przesyłania strumieniowego
Tabela strumieniowa jest typem tabeli zarządzanej w Unity Catalog, która zawiera logikę przetwarzania przy użyciu przepływów do jej zdefiniowania. SQL w Databricks umożliwia tworzenie i odświeżanie samodzielnej tabeli streamingu lub używanie Deklaratywnych Potoków Lakeflow Spark do tworzenia i odświeżania jednej lub więcej tabel streamingu, zmaterializowanych widoków oraz widoków. Zobacz Używaj tabel przesyłania strumieniowego w Databricks SQL i Tabele strumieniowe.
Zmaterializowany widok kontra tabela przesyłania strumieniowego
Zmaterializowane widoki i tabele przesyłania strumieniowego to dwa typowe obiekty danych używane do inżynierii danych. Zmaterializowane widoki używają semantyki wsadowej, a tabele strumieniowe - semantyki strumieniowej. Aby zapoznać się z porównaniem przetwarzania wsadowego i strumieniowego oraz kwestiami wyboru dla obciążeń związanych z inżynierią danych, zobacz Przetwarzanie danych wsadowych vs. strumieniowych w Azure Databricks.