Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für: SQL Server 2019 (15.x)
Important
Die Big Data Cluster von Microsoft SQL Server 2019 werden eingestellt. Der Support für SQL Server 2019 Big Data Cluster endete am 28. Februar 2025. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und den Big Data-Optionen auf der Microsoft SQL Server-Plattform.
In diesem Artikel werden die Ressourcen beschrieben, die ein SQL Server Big Data Cluster bereitstellt.
Ein Big-Data-Cluster stellt Pods basierend auf dem Bereitstellungsprofil bereit. Ausführliche Informationen finden Sie unter "Standardkonfigurationen".
In diesem Artikel werden die mit aks-dev-test-ha Profil bereitgestellten Pods beschrieben, und ein Spark-Pool ist enthalten. Kubernetes abfragen, um die in Ihrem Cluster bereitgestellten Pods anzuzeigen. Im folgenden Beispiel wird eine Liste von Pods unter einem bestimmten Namespace zurückgegeben.
kubectl get pods -n <namespace>
Ersetzen Sie <namespace> durch den Namen Ihres Big Data-Clusters.
Weitere Informationen finden Sie unter Vorgehensweise: Bereitstellen von Big Data-Cluster für SQL Server auf Kubernetes.
Das folgende Diagramm zeigt die komponenten, die in einem Big Data-Cluster bereitgestellt werden:
Informationen zur Architektur finden Sie in der Einführung von SQL Server Big Data Clustern.
Deployed pods
In der folgenden Tabelle sind Pods aufgeführt, die in einem Big Data-Cluster bereitgestellt werden.
| Name | Area |
|---|---|
control-<nnnn> |
Control |
controldb-<#> |
Control |
controlwd-<nnnn> |
Control |
logsdb-<#> |
Control |
logsui-<nnnn> |
Control |
metricsdb-<#> |
Control |
metricsdc-<nnnn> |
Control |
metricsui-<nnnn> |
Control |
mgmtproxy-<nnnn> |
Control |
zookeeper-<#> |
Control |
dns-<nnnn> |
Control |
master-<#n> |
Master instance |
operator-<nnnn> |
Master instance |
compute-<#n>-<#m> |
Compute pool |
data-<#>-<#> |
Data pool |
storage-<#>-<#> |
Storage pool |
nmnode-<#>-<#> |
Storage pool |
sparkhead-<#> |
Storage pool |
appproxy-<#m> |
Application pool |
gateway-<#> |
Gateway service |
Nicht alle Pods sind in jedem Big Data-Cluster enthalten. Bereitstellungen mit hoher Verfügbarkeit oder Active Directory-Integration umfassen bestimmte Pods.
Spezielle Pods für hohe Verfügbarkeit:
operator-<nnnn>zookeeper-<#>
Active Directory-spezifische Pods:
dns-<nnnn>
In den folgenden Abschnitten werden die Pods beschrieben und die Container in den einzelnen Pods aufgeführt.
Control
Kontroll-Pods stellen den Kontrolldienst bereit.
| Pod name | Count | Kubernetes-Controllertyp | Containers |
|---|---|---|---|
control-# |
1 | ReplicaSet | - controller- security-support- fluentbit |
controldb |
1 | StatefulSet | - mssql-server- fluentbit |
controlwd |
1 | ReplicaSet | - controlwatchdog |
logsdb-# |
1 | StatefulSet | - elasticsearch |
logsui |
1 | ReplicaSet | - kibana |
metricsdb-# |
1 | StatefulSet | - influxdb |
metricsdc |
1 pro Kubernetes-Knoten. | DaemonSet | - telegraf |
metricsui-nnnn |
1 | ReplicaSet | - grafana |
mgmtproxy-nnnn |
1 | ReplicaSet | - service-proxy- fluentbit |
dns-nnnn |
0 oder 1 für die Active Directory-Integration | ReplicaSet | - dns- fluentbit |
Master instance
master-<#n> ist die SQL Server-Masterinstanz.
- Verwaltet den Datenpool über DDL
- Bearbeitet Daten im Datenpool über DML
- Lagert die Ausführung analytischer Abfragen in den Datenpool aus
| Pod name | Count | Kubernetes-Controllertyp | Containers |
|---|---|---|---|
master-<#n> |
1 oder mehr für hohe Verfügbarkeit. | StatefulSet | - mssql-server- fluentbit- collectd- mssql-ha-supervisor
*
|
operator* |
0 oder 1 für hohe Verfügbarkeit | ReplicaSet | - mssql-ha-operator |
* Nur Bereitstellungen mit hoher Verfügbarkeit. Der Operator implementiert und registriert die benutzerdefinierte Ressourcendefinition für SQL Server und die Verfügbarkeitsgruppenressourcen. Wenn der Operator bereitgestellt wird, registriert er sich als Listener für Benachrichtigungen über SQL Server-Ressourcen, die im Kubernetes-Cluster bereitgestellt werden.
mssql-ha-supervisor unterstützt die Verfügbarkeitsgruppe.
Jeder master Pod enthält eine Instanz von SQL Server. Eine Hochverfügbarkeitsbereitstellung umfasst drei Pods. Jeder Pod enthält eine SQL Server-Instanz mit Datenbanken in einer SQL Server AlwaysOn-Verfügbarkeitsgruppe.
Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.
Compute pool
Der Computepool stellt eine SQL Server-Instanz für die Berechnung bereit.
| Pod name | Count | Kubernetes-Controllertyp | Containers |
|---|---|---|---|
compute-<#n>-<#m> |
1 oder mehr. | StatefulSet | - mssql-server- fluentbit- collectd |
-
#nidentifiziert den Computepool. -
#midentifiziert die Instanz-ID innerhalb des Pools.
Die SQL Server-Instanzen des Computepools sind zustandslos. Sie benötigen nur Speicherplatz für tempdb.
Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.
Data pool
Der Datenpool stellt SQL Server-Instanzen zum Speichern und Berechnen bereit.
| Pod name | Count | Kubernetes-Controllertyp | Containers |
|---|---|---|---|
data-<#n>-<#m> |
0 oder mehr | StatefulSet | - mssql-server - fluentbit- collectd |
-
#nidentifiziert den Datenpool. -
#midentifiziert die Instanz-ID innerhalb des Pools.
Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.
Storage pool
Der Speicherpool bietet Datenaufnahme über Spark, Speicher in HDFS, Datenzugriff über HDFS- und SQL Server-Endpunkte.
| Pod name | Count | Kubernetes-Controllertyp | Containers |
|---|---|---|---|
storage-0-# |
1 oder mehr. Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu. | StatefulSet | - hadoop- mssql-server- fluentbit |
nmnode-0-# |
1 oder mehr für hohe Verfügbarkeit | StatefulSet | - hadoop- fluentbit |
sparkehead-# |
1 oder mehr für hohe Verfügbarkeit | StatefulSet | - hadoop-yarn-jobhistory- hadoop-livy-sparkhistory- hadoop-hivemetastore-- fluentbit |
zookeeper |
0 oder 3 für hohe Verfügbarkeit. | StatefulSet | - zookeeper- fluentbit |
Application pool
Der Anwendungspool ist in einigen der Testkonfigurationsprofile enthalten. Der Anwendungspool hostt Anwendungsdienstproxys, die Sie definieren, wenn Sie Ihre Anwendungen für Big Data-Cluster bereitstellen.
appproxy ist eine Web-API, die sich vor den Anwendungspoolanwendungen befindet. Sie authentifiziert Benutzer und leitet die Anforderungen dann an die Anwendungen weiter.
| Pod name | Kubernetes-Controllertyp | Containers |
|---|---|---|
appproxy |
ReplicaSet | - app-service-proxy- fluentbit |
Weitere Informationen finden Sie unter Einführung der Anwendungsbereitstellung auf einem Big Data-Cluster.
Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.
Gateway service
Gatewaydienste bieten das Knox-Gateway zu Spark, HDFS, Yarn, Yarn UI und Spark UI.
| Pod name | Kubernetes-Controllertyp | Containers |
|---|---|---|
gateway-<#> |
StatefulSet | - knox- fluentbit |
Es wird nur ein Gateway unterstützt.
Open-Source-Containerverweise
Informationen zu bestimmten Open-Source-Projekten und -Versionen finden Sie in der Open-Source-Softwarereferenz.
Next steps
Weitere Informationen zu Big Data-Cluster für SQL Server finden Sie in den folgenden Ressourcen: