Delen via


Een beheerde opslaglocatie opgeven in Unity Catalog

Een beheerde opslaglocatie geeft een locatie op in de opslag van cloudobjecten voor het opslaan van gegevens voor beheerde tabellen en beheerde volumes.

U kunt een beheerde opslaglocatie koppelen aan een metastore, catalogus of schema. Beheerde opslaglocaties op lagere niveaus in de hiƫrarchie overschrijven opslaglocaties die zijn gedefinieerd op hogere niveaus wanneer beheerde tabellen of beheerde volumes worden gemaakt.

Databricks raadt u aan beheerde opslag toe te wijzen op catalogusniveau voor logische gegevensisolatie, met metastore-niveau en schemaniveau als opties.

Nieuwe werkruimten die zijn ingeschakeld voor Unity Catalog, worden automatisch gemaakt zonder een beheerde opslaglocatie op metastoreniveau. Als u wilt bepalen of u opslag op metastoreniveau nodig hebt, raadpleegt u Automatische activering van Unity Catalog, hiƫrarchie van beheerde opslaglocatie en beheerde opslag toevoegen aan een bestaande metastore.

Wat is een beheerde opslaglocatie?

Beheerde opslaglocaties hebben de volgende eigenschappen:

  • Met beheerde tabellen en beheerde volumes worden gegevens- en metagegevensbestanden opgeslagen op beheerde opslaglocaties.
  • Beheerde opslaglocaties mogen niet overlappen met externe tabellen of externe volumes.

In de volgende tabel wordt beschreven hoe een beheerde opslaglocatie wordt gedeclareerd en gekoppeld aan Unity Catalog-objecten:

Gekoppeld Unity Catalog-object Hoe in te stellen Relatie tot externe locaties
Metastore Geconfigureerd door accountbeheerder tijdens het maken van de metastore. Kan een externe locatie niet overlappen.
Standaardcatalogus Opgegeven tijdens het maken van de catalogus met behulp van het MANAGED LOCATION trefwoord. Moet zich in een externe locatie bevinden.
Buitenlandse catalogus Opgegeven na het maken van de catalogus met behulp van Catalog Explorer. Moet zich in een externe locatie bevinden.
Schema Opgegeven tijdens het maken van het schema met behulp van het MANAGED LOCATION trefwoord. Moet zich in een externe locatie bevinden.

Opmerking

Wanneer Unity Catalog automatisch wordt ingeschakeld voor een werkruimte, maakt Azure Databricks een werkruimtecatalogus met een beheerde opslaglocatie. Alle werkruimtegebruikers kunnen beheerde tabellen en volumes maken in het default schema van de werkruimtecatalogus. Zie Automatische activering van Unity Catalog voor meer informatie over werkruimtecatalogussen.

De beheerde opslaglocatie waarin gegevens en metagegevens voor beheerde tabellen en beheerde volumes worden opgeslagen, gebruikt de volgende regels:

  • Als het schema een beheerde locatie heeft, worden de gegevens opgeslagen op de door het schema beheerde locatie.
  • Als het bevatde schema geen beheerde locatie heeft, maar de catalogus een beheerde locatie heeft, worden de gegevens opgeslagen in de beheerde cataloguslocatie.
  • Noch het schema, noch de catalogus bevatten een beheerde locatie, dan wordt de data opgeslagen in de beheerde locatie van de metastore.

Unity Catalog voorkomt overlapping van locatiebeheer. Zie padregels en toegang in Unity Catalog-volumes.

Beheerde opslaglocatie, opslagroot en opslaglocatie

Wanneer u een MANAGED LOCATION voor een catalogus of schema opgeeft, wordt de opgegeven locatie bijgehouden als de opslaghoofdmap in Unity Catalog. Om ervoor te zorgen dat alle beheerde entiteiten een unieke locatie hebben, voegt Unity Catalog gehashte submappen toe aan de opgegeven locatie met behulp van de volgende indeling:

Voorwerp Pad
Schema <storage-root>/__unitystorage/schemas/00000000-0000-0000-0000-000000000000
Catalogus <storage-root>/__unitystorage/catalogs/00000000-0000-0000-0000-000000000000

Het volledig gekwalificeerde pad voor de beheerde opslaglocatie wordt bijgehouden als de opslaglocatie in Unity Catalog.

U kunt dezelfde beheerde opslaglocatie opgeven voor meerdere schema's en catalogi.

Vereiste bevoegdheden

Gebruikers met de CREATE MANAGED STORAGE bevoegdheid op een externe locatie kunnen beheerde opslaglocaties configureren tijdens het maken van een catalogus of schema.

Accountbeheerders kunnen een optionele beheerde opslaglocatie toevoegen op metastoreniveau.

Gebruikers met de MANAGE en USE CATALOG bevoegdheden en cataloguseigenaren kunnen een beheerde opslaglocatie toevoegen aan een buitenlandse catalogus.

Een beheerde opslaglocatie instellen voor een metastore

Zie Beheerde opslag toevoegen aan een bestaande metastore om een beheerde opslaglocatie in te stellen voor een metastore.

Een beheerde opslaglocatie instellen voor een standaardcatalogus

Stel een beheerde opslaglocatie in voor een standaardcatalogus in door het MANAGED LOCATION trefwoord te gebruiken tijdens het maken van de catalogus, zoals in het volgende voorbeeld:

CREATE CATALOG <catalog-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';

U kunt Catalog Explorer ook gebruiken om de beheerde opslaglocatie voor een catalogus in te stellen. Zie Catalogussen maken.

Stel een beheerde opslaglocatie in voor een buitenlandse catalogus

U kunt een beheerde opslaglocatie voor een externe catalogus instellen met de Catalog Explorer.

  1. Meld u aan bij een werkruimte die is gekoppeld aan de metastore.
  2. Klik op het pictogram Gegevens.Catalogus.
  3. Zoek de catalogus in het deelvenster Catalogus en klik op de naam ervan.
  4. Klik onder Opslaglocatie op Opslaglocatie toevoegen.
  5. Selecteer in Externe locatie selecteren een externe locatie of maak een nieuwe locatie en geef het pad op.
  6. Klik op Opslaan.

Een beheerde opslaglocatie instellen voor een schema

Stel een beheerde opslaglocatie in voor een schema met behulp van het trefwoord tijdens het MANAGED LOCATION maken van het schema, zoals in het volgende voorbeeld:

CREATE SCHEMA <catalog>.<schema-name>
MANAGED LOCATION 'abfss://<container-name>@<storage-account>.dfs.core.windows.net/<path>/<directory>';

U kunt Catalog Explorer ook gebruiken om de beheerde opslaglocatie voor een schema in te stellen. Zie Schema's maken.

Volgende stappen

Unity Catalog maakt automatisch gebruik van beheerde opslaglocaties wanneer u beheerde tabellen en beheerde volumes maakt. Zie beheerde tabellen in Unity Catalog in Azure Databricks voor Delta Lake en Apache Iceberg en wat zijn Unity Catalog-volumes?