Mit SQL Server-Big Data-Clustern bereitgestellte Ressourcen

Gilt für: SQL Server 2019 (15.x)

Important

Die Big Data Cluster von Microsoft SQL Server 2019 werden eingestellt. Der Support für SQL Server 2019 Big Data Cluster endete am 28. Februar 2025. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und den Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In diesem Artikel werden die Ressourcen beschrieben, die ein SQL Server Big Data Cluster bereitstellt.

Ein Big-Data-Cluster stellt Pods basierend auf dem Bereitstellungsprofil bereit. Ausführliche Informationen finden Sie unter "Standardkonfigurationen".

In diesem Artikel werden die mit aks-dev-test-ha Profil bereitgestellten Pods beschrieben, und ein Spark-Pool ist enthalten. Kubernetes abfragen, um die in Ihrem Cluster bereitgestellten Pods anzuzeigen. Im folgenden Beispiel wird eine Liste von Pods unter einem bestimmten Namespace zurückgegeben.

kubectl get pods -n <namespace>

Ersetzen Sie <namespace> durch den Namen Ihres Big Data-Clusters.

Weitere Informationen finden Sie unter Vorgehensweise: Bereitstellen von Big Data-Cluster für SQL Server auf Kubernetes.

Das folgende Diagramm zeigt die komponenten, die in einem Big Data-Cluster bereitgestellt werden:

big-data-cluster-diagram

Informationen zur Architektur finden Sie in der Einführung von SQL Server Big Data Clustern.

Deployed pods

In der folgenden Tabelle sind Pods aufgeführt, die in einem Big Data-Cluster bereitgestellt werden.

Name	Area
`control-<nnnn>`	Control
`controldb-<#>`	Control
`controlwd-<nnnn>`	Control
`logsdb-<#>`	Control
`logsui-<nnnn>`	Control
`metricsdb-<#>`	Control
`metricsdc-<nnnn>`	Control
`metricsui-<nnnn>`	Control
`mgmtproxy-<nnnn>`	Control
`zookeeper-<#>`	Control
`dns-<nnnn>`	Control
`master-<#n>`	Master instance
`operator-<nnnn>`	Master instance
`compute-<#n>-<#m>`	Compute pool
`data-<#>-<#>`	Data pool
`storage-<#>-<#>`	Storage pool
`nmnode-<#>-<#>`	Storage pool
`sparkhead-<#>`	Storage pool
`appproxy-<#m>`	Application pool
`gateway-<#>`	Gateway service

Nicht alle Pods sind in jedem Big Data-Cluster enthalten. Bereitstellungen mit hoher Verfügbarkeit oder Active Directory-Integration umfassen bestimmte Pods.

Spezielle Pods für hohe Verfügbarkeit:

operator-<nnnn>
zookeeper-<#>

Active Directory-spezifische Pods:

dns-<nnnn>

In den folgenden Abschnitten werden die Pods beschrieben und die Container in den einzelnen Pods aufgeführt.

Control

Kontroll-Pods stellen den Kontrolldienst bereit.

Pod name	Count	Kubernetes-Controllertyp	Containers
`control-#`	1	ReplicaSet	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	ReplicaSet	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	ReplicaSet	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 pro Kubernetes-Knoten.	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	ReplicaSet	- `grafana`
`mgmtproxy-nnnn`	1	ReplicaSet	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 oder 1 für die Active Directory-Integration	ReplicaSet	- `dns` - `fluentbit`

Master instance

master-<#n> ist die SQL Server-Masterinstanz.

Verwaltet den Datenpool über DDL
Bearbeitet Daten im Datenpool über DML
Lagert die Ausführung analytischer Abfragen in den Datenpool aus

Pod name	Count	Kubernetes-Controllertyp	Containers
`master-<#n>`	1 oder mehr für hohe Verfügbarkeit.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 oder 1 für hohe Verfügbarkeit	ReplicaSet	- `mssql-ha-operator`

^* Nur Bereitstellungen mit hoher Verfügbarkeit. Der Operator implementiert und registriert die benutzerdefinierte Ressourcendefinition für SQL Server und die Verfügbarkeitsgruppenressourcen. Wenn der Operator bereitgestellt wird, registriert er sich als Listener für Benachrichtigungen über SQL Server-Ressourcen, die im Kubernetes-Cluster bereitgestellt werden. mssql-ha-supervisor unterstützt die Verfügbarkeitsgruppe.

Jeder master Pod enthält eine Instanz von SQL Server. Eine Hochverfügbarkeitsbereitstellung umfasst drei Pods. Jeder Pod enthält eine SQL Server-Instanz mit Datenbanken in einer SQL Server AlwaysOn-Verfügbarkeitsgruppe.

Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.

Compute pool

Der Computepool stellt eine SQL Server-Instanz für die Berechnung bereit.

Pod name	Count	Kubernetes-Controllertyp	Containers
`compute-<#n>-<#m>`	1 oder mehr.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifiziert den Computepool.
#m identifiziert die Instanz-ID innerhalb des Pools.

Die SQL Server-Instanzen des Computepools sind zustandslos. Sie benötigen nur Speicherplatz für tempdb.

Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.

Data pool

Der Datenpool stellt SQL Server-Instanzen zum Speichern und Berechnen bereit.

Pod name	Count	Kubernetes-Controllertyp	Containers
`data-<#n>-<#m>`	0 oder mehr	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifiziert den Datenpool.
#m identifiziert die Instanz-ID innerhalb des Pools.

Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.

Storage pool

Der Speicherpool bietet Datenaufnahme über Spark, Speicher in HDFS, Datenzugriff über HDFS- und SQL Server-Endpunkte.

Pod name	Count	Kubernetes-Controllertyp	Containers
`storage-0-#`	1 oder mehr. Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	1 oder mehr für hohe Verfügbarkeit	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	1 oder mehr für hohe Verfügbarkeit	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 oder 3 für hohe Verfügbarkeit.	StatefulSet	- `zookeeper` - `fluentbit`

Application pool

Der Anwendungspool ist in einigen der Testkonfigurationsprofile enthalten. Der Anwendungspool hostt Anwendungsdienstproxys, die Sie definieren, wenn Sie Ihre Anwendungen für Big Data-Cluster bereitstellen.

appproxy ist eine Web-API, die sich vor den Anwendungspoolanwendungen befindet. Sie authentifiziert Benutzer und leitet die Anforderungen dann an die Anwendungen weiter.

Pod name	Kubernetes-Controllertyp	Containers
`appproxy`	ReplicaSet	- `app-service-proxy` - `fluentbit`

Weitere Informationen finden Sie unter Einführung der Anwendungsbereitstellung auf einem Big Data-Cluster.

Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.

Gateway service

Gatewaydienste bieten das Knox-Gateway zu Spark, HDFS, Yarn, Yarn UI und Spark UI.

Pod name	Kubernetes-Controllertyp	Containers
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Es wird nur ein Gateway unterstützt.

Open-Source-Containerverweise

Informationen zu bestimmten Open-Source-Projekten und -Versionen finden Sie in der Open-Source-Softwarereferenz.

Next steps

Weitere Informationen zu Big Data-Cluster für SQL Server finden Sie in den folgenden Ressourcen:

Last updated on 2021-02-11

Freigeben über