Freigeben über


Mit SQL Server-Big Data-Clustern bereitgestellte Ressourcen

Gilt für: SQL Server 2019 (15.x)

Important

Die Big Data Cluster von Microsoft SQL Server 2019 werden eingestellt. Der Support für SQL Server 2019 Big Data Cluster endete am 28. Februar 2025. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und den Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In diesem Artikel werden die Ressourcen beschrieben, die ein SQL Server Big Data Cluster bereitstellt.

Ein Big-Data-Cluster stellt Pods basierend auf dem Bereitstellungsprofil bereit. Ausführliche Informationen finden Sie unter "Standardkonfigurationen".

In diesem Artikel werden die mit aks-dev-test-ha Profil bereitgestellten Pods beschrieben, und ein Spark-Pool ist enthalten. Kubernetes abfragen, um die in Ihrem Cluster bereitgestellten Pods anzuzeigen. Im folgenden Beispiel wird eine Liste von Pods unter einem bestimmten Namespace zurückgegeben.

kubectl get pods -n <namespace>

Ersetzen Sie <namespace> durch den Namen Ihres Big Data-Clusters.

Weitere Informationen finden Sie unter Vorgehensweise: Bereitstellen von Big Data-Cluster für SQL Server auf Kubernetes.

Das folgende Diagramm zeigt die komponenten, die in einem Big Data-Cluster bereitgestellt werden:

big-data-cluster-diagram

Informationen zur Architektur finden Sie in der Einführung von SQL Server Big Data Clustern.

Deployed pods

In der folgenden Tabelle sind Pods aufgeführt, die in einem Big Data-Cluster bereitgestellt werden.

Name Area
control-<nnnn> Control
controldb-<#> Control
controlwd-<nnnn> Control
logsdb-<#> Control
logsui-<nnnn> Control
metricsdb-<#> Control
metricsdc-<nnnn> Control
metricsui-<nnnn> Control
mgmtproxy-<nnnn> Control
zookeeper-<#> Control
dns-<nnnn> Control
master-<#n> Master instance
operator-<nnnn> Master instance
compute-<#n>-<#m> Compute pool
data-<#>-<#> Data pool
storage-<#>-<#> Storage pool
nmnode-<#>-<#> Storage pool
sparkhead-<#> Storage pool
appproxy-<#m> Application pool
gateway-<#> Gateway service

Nicht alle Pods sind in jedem Big Data-Cluster enthalten. Bereitstellungen mit hoher Verfügbarkeit oder Active Directory-Integration umfassen bestimmte Pods.

Spezielle Pods für hohe Verfügbarkeit:

  • operator-<nnnn>
  • zookeeper-<#>

Active Directory-spezifische Pods:

  • dns-<nnnn>

In den folgenden Abschnitten werden die Pods beschrieben und die Container in den einzelnen Pods aufgeführt.

Control

Kontroll-Pods stellen den Kontrolldienst bereit.

Pod name Count Kubernetes-Controllertyp Containers
control-# 1 ReplicaSet - controller

- security-support

- fluentbit
controldb 1 StatefulSet - mssql-server

- fluentbit
controlwd 1 ReplicaSet - controlwatchdog
logsdb-# 1 StatefulSet - elasticsearch
logsui 1 ReplicaSet - kibana
metricsdb-# 1 StatefulSet - influxdb
metricsdc 1 pro Kubernetes-Knoten. DaemonSet - telegraf
metricsui-nnnn 1 ReplicaSet - grafana
mgmtproxy-nnnn 1 ReplicaSet - service-proxy

- fluentbit
dns-nnnn 0 oder 1 für die Active Directory-Integration ReplicaSet - dns

- fluentbit

Master instance

master-<#n> ist die SQL Server-Masterinstanz.

  • Verwaltet den Datenpool über DDL
  • Bearbeitet Daten im Datenpool über DML
  • Lagert die Ausführung analytischer Abfragen in den Datenpool aus
Pod name Count Kubernetes-Controllertyp Containers
master-<#n> 1 oder mehr für hohe Verfügbarkeit. StatefulSet - mssql-server

- fluentbit

- collectd

- mssql-ha-supervisor *
operator* 0 oder 1 für hohe Verfügbarkeit ReplicaSet - mssql-ha-operator

* Nur Bereitstellungen mit hoher Verfügbarkeit. Der Operator implementiert und registriert die benutzerdefinierte Ressourcendefinition für SQL Server und die Verfügbarkeitsgruppenressourcen. Wenn der Operator bereitgestellt wird, registriert er sich als Listener für Benachrichtigungen über SQL Server-Ressourcen, die im Kubernetes-Cluster bereitgestellt werden. mssql-ha-supervisor unterstützt die Verfügbarkeitsgruppe.

Jeder master Pod enthält eine Instanz von SQL Server. Eine Hochverfügbarkeitsbereitstellung umfasst drei Pods. Jeder Pod enthält eine SQL Server-Instanz mit Datenbanken in einer SQL Server AlwaysOn-Verfügbarkeitsgruppe.

Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.

Compute pool

Der Computepool stellt eine SQL Server-Instanz für die Berechnung bereit.

Pod name Count Kubernetes-Controllertyp Containers
compute-<#n>-<#m> 1 oder mehr. StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifiziert den Computepool.
  • #m identifiziert die Instanz-ID innerhalb des Pools.

Die SQL Server-Instanzen des Computepools sind zustandslos. Sie benötigen nur Speicherplatz für tempdb.

Fügen Sie je nach Workload während des Bereitstellungsprozesses zusätzliche Pods hinzu.

Data pool

Der Datenpool stellt SQL Server-Instanzen zum Speichern und Berechnen bereit.

Pod name Count Kubernetes-Controllertyp Containers
data-<#n>-<#m> 0 oder mehr StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifiziert den Datenpool.
  • #m identifiziert die Instanz-ID innerhalb des Pools.

Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.

Storage pool

Der Speicherpool bietet Datenaufnahme über Spark, Speicher in HDFS, Datenzugriff über HDFS- und SQL Server-Endpunkte.

Pod name Count Kubernetes-Controllertyp Containers
storage-0-# 1 oder mehr. Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu. StatefulSet - hadoop

- mssql-server

- fluentbit

nmnode-0-# 1 oder mehr für hohe Verfügbarkeit StatefulSet - hadoop

- fluentbit
sparkehead-# 1 oder mehr für hohe Verfügbarkeit StatefulSet - hadoop-yarn-jobhistory

- hadoop-livy-sparkhistory

- hadoop-hivemetastore

-- fluentbit
zookeeper 0 oder 3 für hohe Verfügbarkeit. StatefulSet - zookeeper

- fluentbit

Application pool

Der Anwendungspool ist in einigen der Testkonfigurationsprofile enthalten. Der Anwendungspool hostt Anwendungsdienstproxys, die Sie definieren, wenn Sie Ihre Anwendungen für Big Data-Cluster bereitstellen.

appproxy ist eine Web-API, die sich vor den Anwendungspoolanwendungen befindet. Sie authentifiziert Benutzer und leitet die Anforderungen dann an die Anwendungen weiter.

Pod name Kubernetes-Controllertyp Containers
appproxy ReplicaSet - app-service-proxy

- fluentbit

Weitere Informationen finden Sie unter Einführung der Anwendungsbereitstellung auf einem Big Data-Cluster.

Fügen Sie je nach Workload zusätzliche Pods bei der Bereitstellung hinzu.

Gateway service

Gatewaydienste bieten das Knox-Gateway zu Spark, HDFS, Yarn, Yarn UI und Spark UI.

Pod name Kubernetes-Controllertyp Containers
gateway-<#> StatefulSet - knox

- fluentbit

Es wird nur ein Gateway unterstützt.

Open-Source-Containerverweise

Informationen zu bestimmten Open-Source-Projekten und -Versionen finden Sie in der Open-Source-Softwarereferenz.

Next steps

Weitere Informationen zu Big Data-Cluster für SQL Server finden Sie in den folgenden Ressourcen: