Udostępnij przez


Śledzenie zmian w Azure Synapse Link dla SQL

Dotyczy: SQL Server 2022 (16.x) Azure SQL DatabaseAzure Synapse Analytics

Ten artykuł zawiera szczegółowe informacje na temat sposobu działania źródła zmian usługi Azure Synapse Link dla języka SQL.

Ważne

Dublowanie w usłudze Microsoft Fabric jest teraz dostępne. Odwzorowanie do Fabric zapewnia wszystkie możliwości usługi Azure Synapse Link przy lepszej wydajności analitycznej, możliwość ujednolicenia zasobów danych za pomocą usługi OneLake w Fabric oraz otwarty dostęp do danych w formacie Delta Parquet. Zamiast Azure Synapse Link użyj Fabric Mirroring.

Dzięki funkcji replikacji w Microsoft Fabric można stale replikować istniejące zasoby danych bezpośrednio do OneLake w Fabric, w tym dane z SQL Server 2016+, Azure SQL Database, Azure SQL Managed Instance, Oracle, Snowflake, Cosmos DB i nie tylko.

Aby uzyskać więcej informacji, zobacz Dublowane bazy danych usługi Microsoft Fabric.

Program SQL Server 2022 (16.x) wprowadził nową funkcję, która umożliwia łączność między tabelami programu SQL Server i platformą Microsoft Azure Synapse o nazwie Azure Synapse Link for SQL. Usługa Azure Synapse Link dla usługi SQL udostępnia automatyczne kanały informacyjne zmian, które przechwytują zmiany w programie SQL Server i ładują je do usługi Azure Synapse Analytics.

Ta funkcja nie jest dostępna dla usługi Azure SQL Managed Instance.

Uwaga / Notatka

Włączenie usługi Azure Synapse Link dla bazy danych SQL spowoduje utworzenie użytkownika bazy danych changefeed, schematu changefeed oraz kilku tabel w tym schemacie i w źródłowej bazie danych changefeed. Nie zmieniaj żadnego z tych obiektów — są zarządzane przez system.

Strefa lądowania

Aby uzyskać więcej informacji na temat strefy docelowej dla usługi Azure Synapse Link dla programu SQL Server, zobacz Azure Synapse Link for SQL Server landing zone (Usługa Azure Synapse Link dla strefy docelowej programu SQL Server).

Chociaż usługa Azure Synapse Link dla programu SQL Server obejmuje zasoby platformy Azure aprowizowane przez użytkownika, w tym konto magazynu usługi Azure Data Lake Storage (ADLS) Gen2, usługa Azure Synapse Link dla usługi Azure SQL Database jest w pełni zarządzana, w tym aprowizacja strefy docelowej i używa podobnych procesów wykrywania zmian zgodnie z opisem w tym artykule. Aby uzyskać więcej informacji, zobacz Usługa Azure Synapse Link dla usługi Azure SQL Database.

W przypadku programu SQL Server lokalizacja strefy docelowej usługi Azure Storage jest zarządzana przez klienta i widoczna, ale nie jest zalecana ani obsługiwana do korzystania z plików w strefie docelowej ani modyfikowania ich.

Funkcja zestawienia zmian

Administrator programu SQL Server może włączyć usługę Azure Synapse Link w tabeli, która jest pusta lub która zawiera już dane. Tabela źródłowa musi mieć klucz podstawowy.

Jeżeli tabela zawiera już dane, usługa Azure Synapse Link umieści w strefie docelowej pełną początkową migawkę tabeli źródłowej. Po dodaniu istniejącej tabeli programu SQL Server zawierającej dane do usługi Azure Synapse Link zostanie wygenerowana pełna migawka początkowego zestawu danych. Początkowy plik migawki to plik formatu ".parquet", który jest przesyłany do strefy odbiorczej w usłudze "ADLS Gen2".

Azure Synapse Link obsługuje niską latencję wypychania zmian w tabelach źródłowych do strefy docelowej w usłudze Azure Storage. Kanał zmian używa pliku CSV do publikowania tych zmian w usłudze Azure Synapse. Ten format tabelaryczny naturalnie wspiera wprowadzanie zmian danych na poziomie wierszy o dużej częstotliwości (w odstępach co kilka sekund). Większość plików CSV powinna być stosunkowo mała.

Przechwytywanie zmian

Przechwytywanie zmian w usłudze Azure Synapse Link jest podobne do istniejącej technologii przechwytywania danych zmian (CDC). Źródłem danych zmiany jest dziennik transakcji programu SQL Server. Źródło zmian odczytuje dziennik i dodaje informacje o zmianach w strefie docelowej.

Usługa CDC działa poprzez zarejestrowanie dziennika transakcji w celu przechwycenia wszystkich modyfikacji wykonywanych na jednej lub więcej tabelach źródłowych.

  • W usłudze CDC zmienione dane są przekazywane wewnętrznie do tabeli pokrewnej w bazie danych.
  • W usłudze Azure Synapse Link dane są odczytywane bezpośrednio z dziennika transakcji bazy danych, buforowane w pamięci i ostatecznie zapisywane w strefie docelowej w usłudze Azure Storage.

Jeśli wystąpi awaria magazynu, może to spowodować, że strefa docelowa stanie się niedostępna, co spowoduje zablokowanie publikacji w tej strefie docelowej. Podobnie jak w przypadku awarii agenta czytnika dzienników CDC programu SQL Server lub gdy nie jest on uruchomiony, nie można skracać źródłowego dziennika transakcji bazy danych. W przypadku długotrwałej awarii magazynu lub zmiany konfiguracji magazynu, która powoduje, że stanie się niedostępna, zatrzymaj usługę Azure Synapse Link za pośrednictwem programu Synapse Studio.

Obsługa wysokiej dostępności

Usługa Azure Synapse Link dla programu SQL Server jest zgodna z grupami dostępności Always On i wystąpieniami klastrów w trybie failover (FCI).

Jeśli początkowa migawka była w toku i jest przerywana z jakiegokolwiek powodu, początkowy proces eksportowania migawek zostanie uruchomiony ponownie. Jest to przypadek, gdy program SQL Server ulegnie awarii w klastrze trybu failover lub synchronicznej grupie dostępności.

Dublowanie w usłudze Microsoft Fabric

Odwzorowanie do Fabric zapewnia wszystkie możliwości usługi Azure Synapse Link przy lepszej wydajności analitycznej, możliwość ujednolicenia zasobów danych za pomocą usługi OneLake w Fabric oraz otwarty dostęp do danych w formacie Delta Parquet. Zamiast Azure Synapse Link użyj Fabric Mirroring.

Aby uzyskać więcej informacji, zobacz: