Omówienie możliwości bezserwerowej puli SQL usługi Azure Synapse i przypadków użycia

Ukończone

Azure Synapse Analytics to zintegrowana usługa analityczna, która łączy szeroką gamę powszechnie używanych technologii przetwarzania i analizowania danych na dużą skalę. Jedną z najbardziej najpopularniejszych technologii używanych w rozwiązaniach danych jest SQL — standardowy język branżowy służący do wykonywania zapytań i manipulowania danymi.

Bezserwerowe pule SQL w usłudze Azure Synapse Analytics

Usługa Azure Synapse SQL to rozproszony system zapytań w usłudze Azure Synapse Analytics, który oferuje dwa rodzaje środowisk uruchomieniowych:

  • Bezserwerowa pula SQL: przetwarzanie zapytań SQL na żądanie, głównie używane do pracy z danymi w jeziorze danych.
  • Dedykowana pula SQL: Wystąpienia relacyjnej bazy danych w skali przedsiębiorstwa, używane do hostowania magazynów danych, w których dane są przechowywane w tabelach relacyjnych.

W tym module skoncentrujemy się na bezserwerowej puli SQL, która zapewnia punkt końcowy płatności za zapytanie w celu wykonywania zapytań dotyczących danych w usłudze Data Lake. Zalety korzystania z bezserwerowej puli SQL obejmują:

  • Znana składnia Transact-SQL do wykonywania zapytań na miejscu bez konieczności kopiowania lub ładowania danych do wyspecjalizowanego magazynu.
  • Zintegrowana łączność z szeroką gamą narzędzi do analizy biznesowej i narzędzi do wykonywania zapytań ad hoc, w tym najpopularniejszych sterowników.
  • Przetwarzanie zapytań rozproszonych, które jest tworzone na potrzeby danych na dużą skalę i funkcji obliczeniowych , co skutkuje szybką wydajnością zapytań.
  • Wbudowana odporność na uszkodzenia wykonywania zapytań, co skutkuje wysoką niezawodnością i współczynnikami powodzenia nawet w przypadku długotrwałych zapytań obejmujących duże zestawy danych.
  • Brak infrastruktury do skonfigurowania ani obsługi klastrów. Wbudowany punkt końcowy dla tej usługi jest udostępniany w każdym obszarze roboczym usługi Azure Synapse, dzięki czemu można rozpocząć wykonywanie zapytań o dane zaraz po utworzeniu obszaru roboczego.
  • Brak opłat za zarezerwowane zasoby, płacisz tylko za dane przetworzone przez uruchomione zapytania.

Kiedy używać bezserwerowych pul SQL

Bezserwerowa pula SQL jest dostosowana do wykonywania zapytań dotyczących danych znajdujących się w usłudze Data Lake, więc oprócz wyeliminowania obciążeń związanych z zarządzaniem eliminuje konieczność pozyskiwania danych do systemu. Wystarczy wskazać zapytanie do danych, które są już w jeziorze danych, i je uruchomić.

Model zasobów bezserwerowych usługi Synapse SQL doskonale nadaje się do nieplanowanych lub gwałtownych obciążeń, które mogą być przetwarzane dzięki zawsze aktywnemu bezserwerowemu punktowi końcowemu SQL w twoim obszarze roboczym Azure Synapse Analytics. Korzystanie z puli bezserwerowej pomaga w przypadku konieczności znajomości dokładnego kosztu dla każdego zapytania wykonanego w celu monitorowania kosztów i atrybutów.

Uwaga

Bezserwerowa pula SQL jest systemem analitycznym i nie jest zalecana w przypadku obciążeń OLTP, takich jak bazy danych używane przez aplikacje do przechowywania danych transakcyjnych. Obciążenia, które wymagają milisekundowych czasów odpowiedzi i chcą wskazać pojedynczy wiersz w zestawie danych, nie są odpowiednie dla bezserwerowej puli SQL.

Typowe przypadki użycia bezserwerowych pul SQL obejmują:

  • Eksploracja danych: Eksploracja danych obejmuje przeglądanie jeziora danych w celu uzyskania początkowych wglądów w dane i jest łatwo osiągalna za pomocą Azure Synapse Studio. Możesz przeglądać pliki w połączonym magazynie data lake i użyć wbudowanej bezserwerowej puli SQL, aby automatycznie wygenerować skrypt SQL, aby wybrać 100 pierwszych wierszy z pliku lub folderu tak samo jak w przypadku tabeli w programie SQL Server. Z tego miejsca można stosować projekcje, filtrowanie, grupowanie i większość operacji na danych tak, jakby dane znajdowały się w regularnej tabeli programu SQL Server.
  • przekształcanie danych: Chociaż usługa Azure Synapse Analytics zapewnia doskonałe możliwości przekształcania danych za pomocą platformy Synapse Spark, niektórzy inżynierowie danych mogą łatwiej wykonać transformację danych przy użyciu języka SQL. Bezserwerowa pula SQL umożliwia wykonywanie przekształceń danych opartych na języku SQL; interaktywnie lub jako część zautomatyzowanego potoku danych.
  • logiczny magazyn danych: po początkowej eksploracji danych w usłudze Data Lake można zdefiniować obiekty zewnętrzne, takie jak tabele i widoki w bezserwerowej bazie danych SQL. Dane pozostają przechowywane w plikach data lake, ale są abstrakcyjne przez schemat relacyjny, który może być używany przez aplikacje klienckie i narzędzia analityczne do wykonywania zapytań o dane, tak jak w relacyjnej bazie danych hostowanej w programie SQL Server.