Ressources déployées avec des clusters Big Data SQL Server

S’applique à : SQL Server 2019 (15.x)

Important

Les clusters Big Data Microsoft SQL Server 2019 sont mis hors service. La prise en charge des clusters Big Data SQL Server 2019 a pris fin le 28 février 2025. Pour plus d’informations, consultez le billet de blog d’annonce et les options Big Data sur la plateforme Microsoft SQL Server.

Cet article décrit les ressources qu’un cluster Big Data SQL Server déploie.

Un cluster Big Data déploie des pods en fonction du profil de déploiement. Pour plus d’informations, consultez configurations par défaut.

Cet article décrit les pods déployés sous le profil aks-dev-test-ha et comprend un pool Spark. Interrogez Kubernetes pour voir les pods déployés dans votre cluster. L’exemple suivant retourne une liste de pods sous un espace de noms spécifique.

kubectl get pods -n <namespace>

Remplacez <namespace> par le nom de votre cluster Big Data.

Pour plus d’informations, consultez Guide pratique pour déployer Clusters Big Data SQL Server sur Kubernetes.

Le diagramme suivant affiche les composants déployés dans un cluster Big Data :

big-data-cluster-diagram

Pour plus d’informations sur l’architecture, consultez Présentation des clusters Big Data SQL Server.

Deployed pods

Le tableau suivant répertorie les pods déployés dans un cluster Big Data.

Name	Area
`control-<nnnn>`	Control
`controldb-<#>`	Control
`controlwd-<nnnn>`	Control
`logsdb-<#>`	Control
`logsui-<nnnn>`	Control
`metricsdb-<#>`	Control
`metricsdc-<nnnn>`	Control
`metricsui-<nnnn>`	Control
`mgmtproxy-<nnnn>`	Control
`zookeeper-<#>`	Control
`dns-<nnnn>`	Control
`master-<#n>`	Master instance
`operator-<nnnn>`	Master instance
`compute-<#n>-<#m>`	Compute pool
`data-<#>-<#>`	Data pool
`storage-<#>-<#>`	Storage pool
`nmnode-<#>-<#>`	Storage pool
`sparkhead-<#>`	Storage pool
`appproxy-<#m>`	Application pool
`gateway-<#>`	Gateway service

Tous les pods ne sont pas inclus dans chaque cluster Big Data. Les déploiements avec haute disponibilité ou l’intégration Active Directory incluent des pods spécifiques.

Pods spécifiques à haute disponibilité :

operator-<nnnn>
zookeeper-<#>

Pods spécifiques à Active Directory :

dns-<nnnn>

Les sections suivantes décrivent les pods et répertorient les conteneurs dans chaque pod.

Control

Les modules de contrôle fournissent le service de contrôle.

Pod name	Count	Type de contrôleur Kubernetes	Containers
`control-#`	1	ReplicaSet	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	ReplicaSet	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	ReplicaSet	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 par nœud Kubernetes.	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	ReplicaSet	- `grafana`
`mgmtproxy-nnnn`	1	ReplicaSet	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 ou 1 pour l’intégration d’Active Directory	ReplicaSet	- `dns` - `fluentbit`

Master instance

master-<#n> est l’instance principale SQL Server.

Gère le pool de données via DDL
Manipule des données dans le pool de données via DML
Ordonne l’exécution des requêtes analytiques vers le pool de données

Pod name	Count	Type de contrôleur Kubernetes	Containers
`master-<#n>`	1 ou plus pour la haute disponibilité.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 ou 1 pour la haute disponibilité	ReplicaSet	- `mssql-ha-operator`

^* Seuls les déploiements à haute disponibilité. L’opérateur implémente et inscrit la définition de ressource personnalisée pour SQL Server et les ressources du groupe de disponibilité. Lorsque l’opérateur est déployé, il s’inscrit en tant qu’écouteur pour les notifications relatives aux ressources SQL Server déployées dans le cluster Kubernetes. mssql-ha-supervisor prend en charge le groupe de disponibilité.

Chaque master pod contient une instance de SQL Server. Un déploiement à haute disponibilité comprend 3 pods. Chaque pod inclut une instance SQL Server avec des bases de données dans un groupe de disponibilité Always On SQL Server.

Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Compute pool

Le pool de calcul fournit une instance SQL Server pour le calcul.

Pod name	Count	Type de contrôleur Kubernetes	Containers
`compute-<#n>-<#m>`	1 ou plus.	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifie le pool de calcul.
#m identifie l’ID d’instance dans le pool.

Les instances SQL Server du pool de calcul sont sans état. Ils nécessitent uniquement un stockage pour tempdb.

Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Data pool

Le pool de données fournit des instances SQL Server pour le stockage et le calcul.

Pod name	Count	Type de contrôleur Kubernetes	Containers
`data-<#n>-<#m>`	0 ou plus	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifie le pool de données.
#m identifie l’ID d’instance dans le pool.

Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Storage pool

Le pool de stockage fournit l’ingestion des données via Spark, le stockage dans HDFS, l’accès aux données par le biais de points de terminaison HDFS et SQL Server.

Pod name	Count	Type de contrôleur Kubernetes	Containers
`storage-0-#`	1 ou plus. Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	1 ou plus pour la haute disponibilité	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	1 ou plus pour la haute disponibilité	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 ou 3 pour la haute disponibilité.	StatefulSet	- `zookeeper` - `fluentbit`

Application pool

Le pool d’applications est inclus dans certains des profils de configuration de test. Le pool d’applications héberge des proxys de service d’application que vous définissez lorsque vous déployez vos applications pour les clusters Big Data.

appproxy est une API web qui se trouve devant les applications du pool d’applications. Il authentifie les utilisateurs, puis route les demandes vers les applications.

Pod name	Type de contrôleur Kubernetes	Containers
`appproxy`	ReplicaSet	- `app-service-proxy` - `fluentbit`

Pour plus d’informations, consultez Présentation du déploiement d’applications sur un cluster Big Data.

Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Gateway service

Les services de passerelle mettent à disposition la passerelle Knox pour Spark, HDFS, Yarn, l'interface utilisateur de Yarn et l'interface utilisateur de Spark.

Pod name	Type de contrôleur Kubernetes	Containers
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Une seule passerelle est prise en charge.

Références de conteneur open source

Pour obtenir des projets et des versions open source spécifiques, consultez la référence logicielle open source.

Next steps

Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :

Last updated on 2021-02-11

Partager via