Grundlegendes zu Serverlosen SQL-Poolfunktionen und Anwendungsfällen in Azure Synapse

Abgeschlossen

Azure Synapse Analytics ist ein integrierter Analysedienst, der eine breite Palette häufig verwendeter Technologien für die Verarbeitung und Analyse von Daten im großen Maßstab vereint. Eine der am häufigsten verwendeten Technologien in Datenlösungen ist SQL – eine Branchenstandardsprache zum Abfragen und Bearbeiten von Daten.

Serverlose SQL-Pools in Azure Synapse Analytics

Azure Synapse SQL ist ein verteiltes Abfragesystem in Azure Synapse Analytics, das zwei Arten von Laufzeitumgebungen bietet:

  • Serverless SQL-Pool: Sql-Abfrageverarbeitung bei Bedarf, die hauptsächlich zum Arbeiten mit Daten in einem Data Lake verwendet wird.
  • Dedizierter SQL-Pool: Relationale Datenbankinstanzen im Unternehmensmaßstab, die zum Hosten von Data Warehouses verwendet werden, in denen Daten in relationalen Tabellen gespeichert sind.

In diesem Modul konzentrieren wir uns auf den serverlosen SQL-Pool, der einen Pay-per-Query-Endpunkt zum Abfragen der Daten in Ihrem Datensee bereitstellt. Zu den Vorteilen der Verwendung von serverlosen SQL-Pools gehören:

  • Eine vertraute Transact-SQL Syntax zum Abfragen von Daten, ohne dass Daten in einen speziellen Speicher kopiert oder geladen werden müssen.
  • Integrierte Konnektivität aus einer vielzahl von Business Intelligence- und Ad-hoc-Abfragetools, einschließlich der beliebtesten Treiber.
  • Verteilte Abfrageverarbeitung, die für umfangreiche Daten und Rechenfunktionen erstellt wird, was zu einer schnellen Abfrageleistung führt.
  • Integrierte Fehlertoleranz bei der Abfrageausführung, was zu hohen Zuverlässigkeits- und Erfolgsraten auch für lange ausgeführte Abfragen mit großen Datasets führt.
  • Keine Infrastruktur zum Einrichten oder Verwalten von Clustern. Ein integrierter Endpunkt für diesen Dienst wird in jedem Azure Synapse-Arbeitsbereich bereitgestellt, sodass Sie mit der Abfrage von Daten beginnen können, sobald der Arbeitsbereich erstellt wird.
  • Keine Gebühr für reservierte Ressourcen, Sie werden nur für die von Ihnen ausgeführten Abfragen verarbeiteten Daten belastet.

Wann man serverlose SQL-Pools verwendet

Der serverlose SQL-Pool ist auf die Abfrage der Daten im Datensee zugeschnitten, sodass zusätzlich zur Beseitigung der Verwaltungslast keine Sorgen mehr über die Erfassung der Daten in das System erforderlich sind. Sie müssen die Abfrage nur auf die Daten verweisen, die sich bereits im Lake befinden, und sie ausführen.

Das Synapse SQL serverlose Ressourcenmodell ist ideal für ungeplante oder schubweise Arbeitslasten, die mit dem ständig verfügbaren serverlosen SQL-Endpunkt in Ihrem Azure Synapse Analytics-Arbeitsbereich verarbeitet werden können. Die Verwendung des serverlosen Pools ist hilfreich, wenn Sie die genauen Kosten für jede ausgeführte Abfrage kennen müssen, um die Kosten zu überwachen und zuzuordnen.

Hinweis

Der Serverlose SQL-Pool ist ein Analysesystem und wird für OLTP-Workloads wie Datenbanken, die von Anwendungen zum Speichern von Transaktionsdaten verwendet werden, nicht empfohlen. Workloads, die Millisekunden-Reaktionszeiten erfordern und eine einzelne Zeile in einem Dataset anheften möchten, eignen sich nicht gut für serverlose SQL-Pools.

Zu den gängigen Anwendungsfällen für serverlose SQL-Pools gehören:

  • Datenexploration: Die Datenerkundung umfasst das Durchsuchen des Datensees, um erste Einblicke zu den Daten zu erhalten und ist mit Azure Synapse Studio leicht erreichbar. Sie können die Dateien in Ihrem verknüpften Datenspeicherspeicher durchsuchen und den integrierten serverlosen SQL-Pool verwenden, um automatisch ein SQL-Skript zu generieren, um TOP 100 Zeilen aus einer Datei oder einem Ordner wie bei einer Tabelle in SQL Server auszuwählen. Von dort aus können Sie Projektionen, Filterung, Gruppierung und den großteil des Vorgangs über die Daten anwenden, als wären die Daten in einer regulären SQL Server-Tabelle enthalten.
  • Datentransformation: Während Azure Synapse Analytics großartige Datentransformationsfunktionen mit Synapse Spark bietet, finden einige Dateningenieure möglicherweise die Datentransformation einfacher, wenn sie SQL verwenden. Mit serverlosen SQL-Pool können Sie SQL-basierte Datentransformationen durchführen; entweder interaktiv oder als Teil einer automatisierten Datenpipeline.
  • Logisches Data Warehouse: Nach der ersten Erkundung der Daten im Datensee können Sie externe Objekte wie Tabellen und Ansichten in einer serverlosen SQL-Datenbank definieren. Die Daten bleiben in den Data Lake-Dateien gespeichert, werden jedoch von einem relationalen Schema abstrahiert, das von Clientanwendungen und Analysetools verwendet werden kann, um die Daten wie in einer relationalen Datenbank abzufragen, die in SQL Server gehostet wird.