Delen via


Azure Databricks-tabellen

Azure Databricks biedt meerdere tabeltypen en opslagindelingen om te voldoen aan verschillende behoeften voor gegevensbeheer. In deze sectie worden beheerde, externe en refererende tabellen behandeld, samen met de Delta Lake- en Apache Iceberg-opslagindelingen die geavanceerde functies mogelijk maken, zoals Atomiciteit, Consistentie, Isolatie en Duurzaamheid (ACID) en tijdreizen.

Basisconcepten

Meer informatie over de basisprincipes van tabeltypen, opslagindelingen en Unity Catalog-integratie.

Onderwerp Description
Concepten van tabellen Basisconcepten en basisinformatie over tabeltypen, opslagindelingen en Integratie van Unity Catalog.

Tabeltypen

Verken verschillende tabeltypen en hun mogelijkheden voor verschillende scenario's voor gegevensbeheer.

Tabeltype Description
Unity Catalog-beheerde tabellen in Azure Databricks voor Delta Lake en Apache Iceberg Azure Databricks beheert metagegevens en gegevensbestanden. Wordt gebruikt voor nieuwe tabellen waarvoor geoptimaliseerde prestaties zijn vereist.
Tijdelijke tabellen Beheerde tabellen in Unity Catalog met sessiebereik voor tussenliggende gegevens. Alleen SQL-magazijnen.
Werken met externe tabellen Gegevens die zijn opgeslagen in externe systemen. Unity Catalog beheert alleen metagegevens.
Werken met externe tabellen Alleen-lezentoegang tot gegevens in externe systemen die zijn verbonden via Lakehouse Federation.

Opslagindelingen

Werk met open tabelindelingen die geavanceerde mogelijkheden voor gegevensbeheer bieden.

Formaat Description
Delta Lake Standaardopslagindeling die ACID-transacties, tijdreizen en schema afdwinging biedt voor beheerde en externe tabellen.
Apache Iceberg Open tabelindeling voor integratie met het Iceberg-ecosysteem, ter ondersteuning van geavanceerd metagegevensbeheer.

Tabelbeheer

Tabelgedrag, structuur en prestaties configureren en optimaliseren.

Eigenschap Description
Tabelbeperkingen Regels voor gegevenskwaliteit definiƫren en afdwingen met controlebeperkingen en niet null-beperkingen.
Schema afdwingen Bepalen hoe Azure Databricks schemawijzigingen verwerkt en afdwinging van gegevenstypen tijdens schrijfbewerkingen.
Tabelpartitionering Organiseer gegevens op partitiesleutels om queryprestaties en gegevensbeheer te verbeteren.
Bewaking van tabelgrootte Bewaak en analyseer tabelopslaggebruik en groeipatronen.
Extern converteren naar beheerd Externe tabellen migreren naar beheerde tabellen voor verbeterde prestaties en beheer.
Detectie van externe partities Automatisch partities detecteren en registreren in externe tabellen die zijn opgeslagen in cloudopslag.