Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Deze pagina geeft een overzicht van het upgraden van een niet-Unity Catalog-werkruimte naar Unity Catalog. Het bevat ook instructies voor het migreren vanuit de verouderde werkruimte-lokale Hive-metastore.
Overzicht van upgradestappen
Als u wilt upgraden naar Unity Catalog, moet u het volgende doen:
- Richt identiteiten (gebruikers, groepen en service-principals) rechtstreeks in op uw Azure Databricks-account als u dit nog niet doet. Schakel identiteitsinrichting op werkruimteniveau uit.
- Converteer alle werkruimte-lokale groepen naar groepen op accountniveau. Unity Catalog centraliseert identiteitsbeheer op accountniveau.
- Koppel de werkruimte aan een Unity Catalog-metastore. Als er geen metastore bestaat voor uw werkruimteregio, moet een accountbeheerder er een maken.
- Voer een upgrade uit van tabellen en weergaven die worden beheerd in hive-metastore naar Unity Catalog.
- Gebruikers op accountniveau, groepen of serviceprincipals toegang verlenen tot de bijgewerkte tabellen.
- Werk query's en taken bij om te verwijzen naar de nieuwe Unity Catalog-tabellen in plaats van de oude Hive-metastore-tabellen.
- Schakel de Hive-metastore uit. Zie Toegang uitschakelen tot de Hive-metastore die wordt gebruikt door uw Azure Databricks-werkruimte.
UCX, een Databricks Labs-project, biedt hulpprogramma's waarmee u uw niet-Unity-Catalog-werkruimte kunt upgraden naar Unity Catalog. UCX is een goede keuze voor grootschalige migraties. Zie De UCX-hulpprogramma's gebruiken om uw werkruimte te upgraden naar Unity Catalog.
Voordat u begint
Voordat u begint, moet u vertrouwd raken met de basisconcepten van de Unity Catalog, waaronder metastores en beheerde opslag. Zie Wat is Unity Catalog?.
U moet ook bevestigen dat u voldoet aan de volgende vereisten:
Voor de meeste installatiestappen moet u een Azure Databricks-accountbeheerder zijn. Voor elke taak die volgt waarvoor andere machtigingsvereisten gelden, worden deze vermeld in de taakspecifieke documentatie.
De eerste azure Databricks-accountbeheerder moet een globale beheerder van Microsoft Entra ID zijn op het moment dat ze zich voor het eerst aanmelden bij de Azure Databricks-accountconsole. Bij de eerste aanmelding wordt die gebruiker een Azure Databricks-accountbeheerder en heeft deze de rol globale beheerder van Microsoft Entra ID niet meer nodig om toegang te krijgen tot het Azure Databricks-account. De eerste accountbeheerder kan gebruikers in de Microsoft Entra ID-tenant toewijzen als extra accountbeheerders (die zelf meer accountbeheerders kunnen toewijzen). Voor extra accountbeheerders zijn geen specifieke rollen in Microsoft Entra ID vereist.
De werkruimten die u aan de metastore koppelt, moeten zich in het Azure Databricks Premium-abonnement bevinden.
Upgrade uitvoeren naar demo's van Unity Catalog
Bekijk de volgende korte, begeleide demo's om belangrijke upgradetaken in actie te zien. Elke demo bevat een specifieke stap en koppelingen naar gedetailleerde documentatie, indien van toepassing.
- Werkruimte-lokale groepen converteren naar groepen op accountniveau
- Tabellen in uw Hive-metastore upgraden naar Unity Catalog-tabellen
- Rekenproces voor Unity Catalog bijwerken
- Query's en taken bijwerken om te werken met uw bijgewerkte tabellen
U kunt ook de demo UCX volgen om een upgrade uit te voeren naar Unity Catalog.
Richt gebruikers, groepen en service-principals in voor uw account
Unity Catalog verwijst naar identiteiten op accountniveau. Voordat u een metastore aan uw werkruimte koppelt, moet u het volgende doen:
Als u SCIM gebruikt om gebruikers, groepen en service-principals van uw IdP in te richten in uw werkruimte, schakelt u deze uit en stelt u het inrichten in voor uw Azure Databricks-account. Zie Identiteiten synchroniseren van uw id-provider en identiteiten.
Werk de automatiseringen bij die zijn geconfigureerd voor het beheren van gebruikers, groepen en service-verantwoordelijken, zoals SCIM-inrichtingsconnectors en Terraform-automatisering, zodat ze naar accounteindpunten verwijzen in plaats van naar werkruimte-eindpunten. Zie SCIM-inrichting op accountniveau en werkruimteniveau.
Werkruimte-lokale groepen converteren naar groepen op accountniveau
Zie Lokale werkruimtegroepen migreren naar accountgroepen.
Uw werkruimte koppelen aan een metastore
Als uw werkruimte niet is ingeschakeld voor Unity Catalog (gekoppeld aan een metastore), is de volgende stap afhankelijk van of u al een Unity Catalog-metastore hebt gedefinieerd voor uw werkruimteregio:
- Als voor uw account al een Unity Catalog-metastore is gedefinieerd voor uw werkruimteregio, kunt u uw werkruimte koppelen aan de bestaande metastore. Ga naar Een werkruimte inschakelen voor Unity Catalog.
- Als er geen Unity Catalog-metastore is gedefinieerd voor de regio van uw werkruimte, moet u een metastore maken en vervolgens de werkruimte koppelen. Ga naar Go om een Unity Catalog-metastore te maken.
tabellen in uw Hive-metastore upgraden naar Unity Catalog-tabellen
Als uw werkruimte in service was voordat deze was ingeschakeld voor Unity Catalog, heeft deze een Hive-metastore die waarschijnlijk gegevens bevat die u wilt blijven gebruiken. Databricks raadt u aan de tabellen die worden beheerd door de Hive-metastore te upgraden naar de Unity Catalog-metastore.
U kunt geleidelijk upgraden door uw Hive-metastore te federeren. Bekijk de volgende sectie.
U kunt tabellen rechtstreeks upgraden met behulp van de instructies in Hive-tabellen en -weergaven upgraden naar Unity Catalog.
(Optioneel) Uw Hive-metastore federeren om ermee te blijven werken
Als uw werkruimte een Hive-metastore bevat die gegevens bevat die u wilt blijven gebruiken en u ervoor kiest niet de aanbeveling te volgen om alle tabellen die worden beheerd door de Hive-metastore te upgraden naar de Unity Catalog-metastore, kunt u blijven werken met gegevens in de Hive-metastore door deze te federeren als een refererende catalogus in Unity Catalog. Zie De Hive-metastore-federatie: schakel Unity Catalog in om tabellen te beheren die zijn geregistreerd in een Hive-metastore.
Toegang verlenen tot bijgewerkte of federatieve tabellen
Geef gebruikers, groepen of service-principals op accountniveau toegang tot de nieuwe tabellen. Zie Bevoegdheden beheren in Unity Catalog.
Queries en jobs bijwerken om te werken met uw bijgewerkte tabellen en paden naar gegevens.
Terwijl u overstapt van de lokale Hive-metastore van de werkruimte naar Unity Catalog, kunt u query's en taken blijven gebruiken die verwijzen naar de gegevens die zijn geregistreerd in de Hive-metastore, met behulp van Hive-metastore federatie (aanbevolen) of de syntaxis die wordt beschreven in Werken met de verouderde Hive-metastore naast Unity Catalog. Uiteindelijk moet u echter alle query's en taken bijwerken om Unity Catalog-tabellen en -syntaxis te gebruiken.
Werk ook query's en taken bij die gebruikmaken van padgebaseerde toegang tot bestanden om in plaats daarvan Unity Catalog volumes te gebruiken.
Zie Taken bijwerken wanneer u verouderde werkruimten bijwerkt naar Unity Catalog voor gedetailleerde aanbevelingen.