Freigeben über


Konfigurieren von Microsoft SQL Server für die Aufnahme in Azure Databricks

Zeigen Sie eine Vorschau der Quelleinrichtungsaufgaben von SQL Server in Azure Databricks mithilfe von Lakeflow Connect an.

Änderungsnachverfolgung im Vergleich zur Datenerfassung von Änderungen

Die Änderungsnachverfolgung und die Erfassung von Änderungsdaten (Change Data Capture, CDC) ermöglichen Databricks das Nachverfolgen von Änderungen in den Quelltabellen. Databricks empfiehlt die Verwendung der Änderungsnachverfolgung für jede Tabelle mit einem Primärschlüssel, um die Auslastung der Quelldatenbank zu minimieren. Wenn die Änderungsnachverfolgung und cdC aktiviert sind, verwendet der SQL Server-Connector die Änderungsnachverfolgung.

Methode Description
Änderungsnachverfolgung Erfasst die Tatsache, dass Zeilen in einer Tabelle geändert wurden, aber die tatsächlichen Vorgänge nicht erfassen. Die Änderungsnachverfolgung erfordert, dass eine Tabelle über einen Primärschlüssel verfügt, aber es ist ein einfacher Prozess, der keine großen Auswirkungen auf die Quelldatenbank hat.
Erfassung geänderter Daten Erfasst jeden Vorgang in einer Tabelle und enthält eine historische Ansicht zu den im Laufe der Zeit vorgenommenen Änderungen. CDC erfordert nicht, dass eine Tabelle über einen Primärschlüssel verfügt, aber sie kann mehr Auswirkungen auf die Leistung der Quelldatenbank haben.

Weitere Informationen zu diesen Optionen finden Sie in der SQL Server-Dokumentation unter Nachverfolgen von Datenänderungen (SQL Server ).

Übersicht über die Aufgaben zur Quelleneinrichtung

Sie müssen die folgenden Aufgaben in SQL Server ausführen, bevor Sie Daten in Azure Databricks aufnehmen:

  1. Stellen Sie sicher, dass Sie die SQL Server-Versionsanforderungen erfüllen:

    • Um die Änderungsnachverfolgung zu verwenden, müssen Sie ÜBER SQL Server 2012 oder höher verfügen.
    • Für die Verwendung von CDC benötigen Sie SQL Server 2012 Service Pack 1 (SP1) kumulatives Updatepaket 3 (CU3) oder höher. Für Versionen vor SQL Server 2016 ist enterprise Edition ebenfalls erforderlich.
  2. Konfigurieren Sie bei Bedarf Firewalleinstellungen.

  3. Erstellen Sie einen Datenbankbenutzer in SQL Server, der für die Erfassung von Databricks vorgesehen ist, und erfüllen Sie die Berechtigungsanforderungen.

  4. Richten Sie die Quelldatenbank ein, einschließlich Berechtigungsverwaltung, Änderungsverfolgungsaktivierung und CDC-Aktivierung. Weitere Informationen finden Sie unter Vorbereiten von SQL Server für die Aufnahme mithilfe des Skripts für Hilfsobjekte.