Udostępnij przez


Łącznik programu SQL Server — często zadawane pytania

Ta strona zawiera odpowiedzi na często zadawane pytania dotyczące łącznika programu SQL Server w usłudze Databricks Lakeflow Connect.

Ogólne pytania dotyczące łącznika zarządzanego

Odpowiedzi na często zadawane pytania dotyczące łącznika zarządzanego dotyczą wszystkich łączników zarządzanych w programie Lakeflow Connect. Czytaj dalej, aby zapoznać się z często zadawanych pytań dotyczących łącznika.

Jak usługa Databricks nawiązuje połączenie z programem SQL Server?

Usługa Databricks łączy się z programem SQL Server przy użyciu zabezpieczeń warstwy transportu (TLS) i połączenia JDBC. Poświadczenia są bezpiecznie przechowywane w katalogu Unity i można je pobrać tylko wtedy, gdy użytkownik uruchamiający przepływ pozyskiwania ma odpowiednie uprawnienia. Usługa Databricks zaleca utworzenie oddzielnego użytkownika w programie SQL Server na potrzeby pozyskiwania danych. Jeśli istnieją bazy danych lub tabele, których nie chcesz ujawniać temu użytkownikowi, możesz użyć wbudowanych uprawnień programu SQL Server.

Jeśli przepływ danych zakończy się niepowodzeniem, czy przetwarzanie zostanie wznowione bez utraty danych?

Tak. Usługa Databricks śledzi, co łącznik wyodrębnił ze źródła i zastosował w miejscu docelowym. Jeśli coś się stanie, usługa Databricks może wznowić działanie w tym momencie, o ile dzienniki pozostaną w źródłowej bazie danych. Może to mieć wpływ, jeśli potok nie zostanie uruchomiony przed usunięciem dzienników przez okres przechowywania dziennika, co wymaga pełnego odświeżenia w tabelach docelowych.

Które odmiany programu SQL Server obsługują łącznik?

Łącznik obsługuje bazy danych SQL Azure SQL i AWS RDS SQL. Obejmuje to program SQL Server uruchomiony na maszynach wirtualnych platformy Azure i w usłudze Amazon EC2. Łącznik obsługuje również lokalny program SQL Server przy użyciu usług Azure ExpressRoute, AWS Direct Connect i VPN, jeśli jest dostępna wystarczająca przepustowość.

Jak łącznik przyrostowo ściąga dane?

Łącznik korzysta z usługi Microsoft Change Tracking i Microsoft Change Data Capture (CDC), gdzie jest dostępna. Jeśli tabela ma klucz podstawowy, usługa Databricks zaleca użycie śledzenia zmian w celu uzyskania optymalnej wydajności. Jeśli tabela nie ma klucza podstawowego, Databricks zaleca korzystanie z CDC. Jeśli śledzenie zmian i cdC są włączone, łącznik używa śledzenia zmian.

Czy łącznik przechwytuje strefy czasowe dla kolumn daty i godziny?

Nie. Data i godzina są pozyskiwane w formacie UTC.

Czy mogę dostosować harmonogram bramy importu?

Brama pozyskiwania nie musi działać w trybie ciągłym, aby uniknąć porzucania zmian z powodu przechowywania dziennika. Jeśli zmiany zostały usunięte, pełne odświeżanie jest wymagane dla wszystkich tabel.

Jak łącznik obsługuje tabelę bez klucza podstawowego?

Łącznik traktuje wszystkie kolumny z wyjątkiem dużych obiektów jako połączony klucz podstawowy. Jeśli w tabeli źródłowej znajdują się zduplikowane wiersze, te wiersze są pozyskiwane jako pojedynczy wiersz w tabeli docelowej.

Jak często mogę zaplanować uruchamianie potoku pozyskiwania danych?

Nie ma ograniczeń co do częstotliwości planowania uruchamiania potoku pozyskiwania. Jednak usługa Databricks zaleca co najmniej 5 minut między interwałami, ponieważ uruchamianie bezserwerowych zasobów obliczeniowych zajmuje trochę czasu. Usługa Databricks nie obsługuje uruchamiania potoku przetwarzania danych w trybie ciągłym.

Dlaczego nie widzę wszystkich wierszy z mojej bazy danych w początkowym przebiegu potoku?

Brama wejściowa pobiera dane historyczne i CDC natychmiast po uruchomieniu. Potok przetwarzania danych może zostać uruchomiony, zanim wszystkie te dane zostaną wyodrębnione, co spowoduje częściowe wprowadzenie danych do docelowych tabel. Może upłynąć kilka uruchomień potoku ładowania, aby wszystkie dane zostały wyodrębnione i zapisane w tabelach docelowych.

Czy mogę pobierać dane z repliki do odczytu lub instancji pomocniczej?

Nie. Obsługa jest ograniczona do podstawowych wystąpień programu SQL Server. Dzieje się tak, ponieważ śledzenie zmian i rejestrowanie danych o zmianach nie są obsługiwane w replikach do odczytu ani w wystąpieniach pomocniczych.