Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Auf dieser Seite wird beschrieben, wie Sie die Delta-Freigabe für Azure Databricks für Datenanbieter einrichten (Organisationen, die Delta-Freigabe verwenden möchten, um Daten sicher freizugeben).
Wenn Sie eine Person, die Daten empfängt, sind (eine Organisation, die Daten empfängt, die mithilfe der Delta-Freigabe freigegeben werden), finden Sie weitere Informationen unter Lesen von per Databricks-zu-Databricks Delta Sharing freigegebenen Daten (für Empfänger).
Important
Delta Sharing erfordert einen Arbeitsbereich mit aktiviertem Unity Catalog. Sie können einen Unity Catalog-fähigen Arbeitsbereich für die Freigabeverwaltung erstellen. In einigen Konten werden neue Arbeitsbereiche automatisch für Unity Catalog aktiviert. Siehe Automatische Aktivierung des Unity Catalog.
Wenn das Erstellen eines neuen Unity-Katalog-aktivierten Arbeitsbereichs keine Option ist, können Sie das Open-Source-Delta-Freigabeprojekt verwenden, um Ihren eigenen Delta-Freigabeserver bereitzustellen, um Delta-Tabellen von einer beliebigen Plattform freizugeben.
Die Ersteinrichtung für Anbieter umfasst die folgenden Schritte:
- Aktivieren Sie Delta Sharing für einen Unity Catalog-Metastore.
- (Optional) Installieren Sie die Unity Catalog-CLI.
- Gewähren Sie Berechtigungen zum Erstellen und Verwalten von Freigaben und Empfangenden.
- Konfigurieren Sie Überwachungen der Delta Sharing-Aktivität.
- Konfigurieren Sie die Lebensdauer (TTL) der Datenmaterialisierung.
- Konfigurieren des Speichernetzwerkzugriffs.
Requirements
Als Datenanbieter, der Ihr Azure Databricks-Konto einrichtet, um Daten freigeben zu können, müssen Sie über Folgendes verfügen:
Mindestens ein Azure Databricks-Arbeitsbereich, der für Unity Catalog aktiviert ist.
Sie müssen nicht alle Ihre Arbeitsbereiche zu Unity Catalog migrieren, um die Datenbricks-Unterstützung für Delta Sharing-Anbieter zu nutzen. Weitere Informationen finden Sie unter Benötige ich Unity Catalog für die Verwendung von Delta Sharing?.
Empfänger benötigen keinen Unity Catalog-aktivierten Arbeitsbereich.
Kontoadministratorrolle, um die Delta-Freigabe für Ihren Unity-Catalog-Metastore zu aktivieren und die Überwachungsprotokollierung zu aktivieren.
Metastore-Administratorrolle oder die
CREATE SHARE- undCREATE RECIPIENT- Berechtigungen. Weitere Informationen finden Sie unter Administratorrollen.Note
Wenn Ihr Arbeitsbereich automatisch für Unity Catalog aktiviert wurde, verfügen Sie möglicherweise nicht über einen Metastore-Administrator. Arbeitsbereichsadministratoren in solchen Arbeitsbereichen verfügen jedoch standardmäßig über die
CREATE SHARE- undCREATE RECIPIENT-Berechtigungen für den Metastore.Weitere Informationen finden Sie unter Automatische Aktivierung von Unity Catalog und Arbeitsbereich-Administratorrechten, wenn Arbeitsbereiche automatisch für Unity Catalog aktiviert sind.
Eine Cloudspeicherkonfiguration, die den Netzwerkzugriff vom Empfänger ermöglicht.
Aktivieren von Delta Sharing für einen Metastore
Sie müssen Delta Sharing in Ihrem Metastore nicht aktivieren, wenn Sie die Lösung nur zum Freigeben von Daten für Benutzer in anderen Unity Catalog-Metastores in Ihrem Konto verwenden möchten. Die Freigabe von Metastore zu Metastore innerhalb eines einzelnen Azure Databricks-Kontos ist standardmäßig aktiviert.
Führen Sie andernfalls die folgenden Schritte für jeden Unity-Katalogmetastore aus, der Daten verwaltet, die Sie mithilfe der Delta-Freigabe freigeben möchten.
Melden Sie sich bei der Kontokonsole als Azure Databricks-Kontoadministrator an.
Klicken Sie in der Randleiste auf das
Katalog.
Klicken Sie auf den Namen eines Metastores, um die zugehörigen Details zu öffnen.
Klicken Sie auf das Kontrollkästchen neben " Delta-Freigabe für Parteien außerhalb Ihrer Organisation zulassen".
Konfigurieren Sie die Lebensdauer des Empfängertokens.
Diese Konfiguration legt die Zeitspanne fest, nach der alle Empfängertokens ablaufen und neu generiert werden müssen. Empfängertoken werden nur im Protokoll für offene Freigaben verwendet. Token sind maximal ein Jahr nach der Erstellung gültig.
Note
Wenn Sie die Standardgültigkeitsdauer eines Empfängertokens für einen Metastore ändern, wird die Gültigkeitsdauer des Empfängertokens für bereits vorhandene Empfänger nicht automatisch aktualisiert. Um eine neue Tokengültigkeitsdauer auf einen bestimmten Empfänger anzuwenden, müssen Sie dessen Token rotieren. Siehe Verwalten von Empfängertoken.
Führen Sie die folgenden Schritte aus, um die Standardgültigkeitsdauer eines Empfängertokens festzulegen:
- Vergewissern Sie sich, dass Ablaufdatum festlegen aktiviert ist (dies ist die Standardeinstellung).
- Geben Sie die Anzahl der Sekunden, Minuten, Stunden oder Tage ein, und wählen Sie eine Maßeinheit aus. Token sind maximal ein Jahr nach der Erstellung gültig.
- Klicken Sie auf "Aktivieren".
Weitere Informationen finden Sie unter Sicherheitsüberlegungen für Token.
Geben Sie beim Teilen mit einem Azure Databricks-Empfänger, der sich nicht in Ihrem Konto befindet, einen Organisationsnamen ein.
Note
Das Angeben eines lesbaren Organisationsnamens hilft Empfängern, ihre Freigabeanbieter und die entsprechenden Anbieterobjekte in der Anbieterliste des Empfängers zu identifizieren.
Klicken Sie auf "Aktivieren".
(Optional) Installieren der Unity Catalog-CLI
Zum Verwalten von Freigaben und Empfängern können Sie den Catalog Explorer, SQL-Befehle oder die Unity Catalog CLI verwenden. Die CLI wird in Ihrer lokalen Umgebung ausgeführt und erfordert keine Azure Databricks-Computeressourcen.
Informationen zum Installieren der CLI finden Sie unter Was ist die Databricks CLI?.
Erteilen der Berechtigung zum Erstellen und Verwalten von Freigaben und Empfängern
Metastore-Admins haben das Recht, Freigaben und Empfangende zu erstellen und zu verwalten, einschließlich der Gewährung von Freigaben an Empfangende. Viele Anbieteraufgaben können von einem Metastore-Administrator mit den folgenden Berechtigungen delegiert werden:
-
CREATE SHAREim Metastore gewährt das Recht, Freigaben zu erstellen. -
CREATE RECIPIENTim Metastore gewährt die Möglichkeit, Empfänger zu erstellen. -
USE RECIPIENTim Metastore gewährt das Recht zum Auflisten und Anzeigen von Details für alle Empfangenden im Metastore. -
USE SHAREim Metastore gewährt das Recht zum Auflisten und Anzeigen von Details für alle Freigaben im Metastore. -
USE RECIPIENT,USE SHARE,undSET SHARE PERMISSIONgeben zusammen einem Benutzer das Recht, Empfängern Freigabezugriff zu gewähren. - Der Metastore-Administrator hat die Möglichkeit, das Eigentum an einer beliebigen Freigabe zu übertragen.
- Freigabe- und Empfängerbesitzende können diese Objekte aktualisieren und Empfangenden Freigaben gewähren. Objekterstellern wird standardmäßig der Besitz gewährt, aber der Besitz kann übertragen werden.
- Freigabebesitzende können Tabellen zu Freigaben hinzufügen, solange sie
SELECT-Zugriff auf die Tabellen undREAD VOLUME-Zugriff auf die Volumes haben.
Ausführliche Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte und die Berechtigungen, die für die beschriebenen Delta-Sharing-Aufgaben aufgeführt sind.
Aktivieren der Überwachungsprotokollierung
Als Azure Databricks-Kontoadministrator sollten Sie die Überwachungsprotokollierung aktivieren, um Delta Sharing-Ereignisse zu erfassen, z. B.:
- Wenn jemand eine Freigabe oder einen Empfänger erstellt, ändert, aktualisiert oder löscht
- Wenn ein Empfänger auf einen Aktivierungslink zugreift und die Anmeldeinformationen herunterlädt (nur offene Freigabe)
- Wenn ein Empfänger auf Daten zugreift
- Wenn die Zugangsdaten eines Empfängers aktualisiert oder abgelaufen sind (nur für offene Freigabe)
Important
Delta Sharing-Aktivitäten werden auf Kontoebene protokolliert. Geben Sie beim Konfigurieren der Protokollübermittlung keinen Wert für workspace_ids_filter ein.
Befolgen Sie zum Aktivieren der Audit-Protokollierung die Anweisungen unter Diagnoseprotokollreferenz.
Ausführliche Informationen dazu, wie Delta-Freigabeereignisse protokolliert werden, finden Sie unter Überwachen der Datenfreigabe.
TTL der Datenmaterialisierung konfigurieren
Als Azure Databricks-Konto oder Metastore-Administrator können Sie die TTL der Datenmaterialisierung konfigurieren, die bestimmt, wie lange ein materialisiertes Ergebnis zwischengespeichert wird. Materialisierungen treten auf, wenn ein Empfänger freigegebene dynamische Ansichten, materialisierte Ansichten, Streamingtabellen und Fremdtabellen abfragt. Standardmäßig beträgt die TTL acht Stunden. Der Cache selbst wird nach zusätzlichen drei Stunden durch Materialisierung gelöscht, wodurch zusätzliche Zeit für vorhandene Abfragen zum Abschluss bereitgestellt wird.
Gehen Sie wie folgt vor, um diesen Wert zu ändern:
Klicken Sie im Azure Databricks-Arbeitsbereich auf das
Katalog zum Öffnen des Katalog-Explorers.
Klicken Sie oben im Katalogbereich auf das
, und wählen Sie "Delta-Freigabe" aus.
Klicken Sie alternativ auf der Seite Schnellzugriff auf die Schaltfläche Delta Sharing >.
Klicken Sie auf der Registerkarte " Für mich freigegeben " in der oberen rechten Ecke auf Ihren Organisationsnamen.
Klicken Sie auf " Delta-Freigabeeinstellungen anzeigen".
Geben Sie für materialization TTL Ihren gewünschten TTL-Wert ein.
Netzwerkzugriff auf Speicher zulassen
Wenn Ihr zugrunde liegender Cloudspeicher mit Zugriffssteuerungen konfiguriert ist, fügen Sie das Netzwerk Des Empfängers zur Zulassungsliste hinzu, damit sie freigegebene Tabellen lesen können.
Ausführliche Informationen finden Sie unter Konfigurieren von Azure Storage-Firewalls und virtuellen Netzwerken und Konfigurieren einer Firewall für serverlosen Computezugriff.