Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
S’applique à : SQL Server 2019 (15.x)
Important
Les clusters Big Data Microsoft SQL Server 2019 sont mis hors service. La prise en charge des clusters Big Data SQL Server 2019 a pris fin le 28 février 2025. Pour plus d’informations, consultez le billet de blog d’annonce et les options Big Data sur la plateforme Microsoft SQL Server.
Cet article décrit les ressources qu’un cluster Big Data SQL Server déploie.
Un cluster Big Data déploie des pods en fonction du profil de déploiement. Pour plus d’informations, consultez configurations par défaut.
Cet article décrit les pods déployés sous le profil aks-dev-test-ha et comprend un pool Spark. Interrogez Kubernetes pour voir les pods déployés dans votre cluster. L’exemple suivant retourne une liste de pods sous un espace de noms spécifique.
kubectl get pods -n <namespace>
Remplacez <namespace> par le nom de votre cluster Big Data.
Pour plus d’informations, consultez Guide pratique pour déployer Clusters Big Data SQL Server sur Kubernetes.
Le diagramme suivant affiche les composants déployés dans un cluster Big Data :
Pour plus d’informations sur l’architecture, consultez Présentation des clusters Big Data SQL Server.
Deployed pods
Le tableau suivant répertorie les pods déployés dans un cluster Big Data.
| Name | Area |
|---|---|
control-<nnnn> |
Control |
controldb-<#> |
Control |
controlwd-<nnnn> |
Control |
logsdb-<#> |
Control |
logsui-<nnnn> |
Control |
metricsdb-<#> |
Control |
metricsdc-<nnnn> |
Control |
metricsui-<nnnn> |
Control |
mgmtproxy-<nnnn> |
Control |
zookeeper-<#> |
Control |
dns-<nnnn> |
Control |
master-<#n> |
Master instance |
operator-<nnnn> |
Master instance |
compute-<#n>-<#m> |
Compute pool |
data-<#>-<#> |
Data pool |
storage-<#>-<#> |
Storage pool |
nmnode-<#>-<#> |
Storage pool |
sparkhead-<#> |
Storage pool |
appproxy-<#m> |
Application pool |
gateway-<#> |
Gateway service |
Tous les pods ne sont pas inclus dans chaque cluster Big Data. Les déploiements avec haute disponibilité ou l’intégration Active Directory incluent des pods spécifiques.
Pods spécifiques à haute disponibilité :
operator-<nnnn>zookeeper-<#>
Pods spécifiques à Active Directory :
dns-<nnnn>
Les sections suivantes décrivent les pods et répertorient les conteneurs dans chaque pod.
Control
Les modules de contrôle fournissent le service de contrôle.
| Pod name | Count | Type de contrôleur Kubernetes | Containers |
|---|---|---|---|
control-# |
1 | ReplicaSet | - controller- security-support- fluentbit |
controldb |
1 | StatefulSet | - mssql-server- fluentbit |
controlwd |
1 | ReplicaSet | - controlwatchdog |
logsdb-# |
1 | StatefulSet | - elasticsearch |
logsui |
1 | ReplicaSet | - kibana |
metricsdb-# |
1 | StatefulSet | - influxdb |
metricsdc |
1 par nœud Kubernetes. | DaemonSet | - telegraf |
metricsui-nnnn |
1 | ReplicaSet | - grafana |
mgmtproxy-nnnn |
1 | ReplicaSet | - service-proxy- fluentbit |
dns-nnnn |
0 ou 1 pour l’intégration d’Active Directory | ReplicaSet | - dns- fluentbit |
Master instance
master-<#n> est l’instance principale SQL Server.
- Gère le pool de données via DDL
- Manipule des données dans le pool de données via DML
- Ordonne l’exécution des requêtes analytiques vers le pool de données
| Pod name | Count | Type de contrôleur Kubernetes | Containers |
|---|---|---|---|
master-<#n> |
1 ou plus pour la haute disponibilité. | StatefulSet | - mssql-server- fluentbit- collectd- mssql-ha-supervisor
*
|
operator* |
0 ou 1 pour la haute disponibilité | ReplicaSet | - mssql-ha-operator |
* Seuls les déploiements à haute disponibilité. L’opérateur implémente et inscrit la définition de ressource personnalisée pour SQL Server et les ressources du groupe de disponibilité. Lorsque l’opérateur est déployé, il s’inscrit en tant qu’écouteur pour les notifications relatives aux ressources SQL Server déployées dans le cluster Kubernetes.
mssql-ha-supervisor prend en charge le groupe de disponibilité.
Chaque master pod contient une instance de SQL Server. Un déploiement à haute disponibilité comprend 3 pods. Chaque pod inclut une instance SQL Server avec des bases de données dans un groupe de disponibilité Always On SQL Server.
Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.
Compute pool
Le pool de calcul fournit une instance SQL Server pour le calcul.
| Pod name | Count | Type de contrôleur Kubernetes | Containers |
|---|---|---|---|
compute-<#n>-<#m> |
1 ou plus. | StatefulSet | - mssql-server- fluentbit- collectd |
-
#nidentifie le pool de calcul. -
#midentifie l’ID d’instance dans le pool.
Les instances SQL Server du pool de calcul sont sans état. Ils nécessitent uniquement un stockage pour tempdb.
Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.
Data pool
Le pool de données fournit des instances SQL Server pour le stockage et le calcul.
| Pod name | Count | Type de contrôleur Kubernetes | Containers |
|---|---|---|---|
data-<#n>-<#m> |
0 ou plus | StatefulSet | - mssql-server - fluentbit- collectd |
-
#nidentifie le pool de données. -
#midentifie l’ID d’instance dans le pool.
Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.
Storage pool
Le pool de stockage fournit l’ingestion des données via Spark, le stockage dans HDFS, l’accès aux données par le biais de points de terminaison HDFS et SQL Server.
| Pod name | Count | Type de contrôleur Kubernetes | Containers |
|---|---|---|---|
storage-0-# |
1 ou plus. Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail. | StatefulSet | - hadoop- mssql-server- fluentbit |
nmnode-0-# |
1 ou plus pour la haute disponibilité | StatefulSet | - hadoop- fluentbit |
sparkehead-# |
1 ou plus pour la haute disponibilité | StatefulSet | - hadoop-yarn-jobhistory- hadoop-livy-sparkhistory- hadoop-hivemetastore-- fluentbit |
zookeeper |
0 ou 3 pour la haute disponibilité. | StatefulSet | - zookeeper- fluentbit |
Application pool
Le pool d’applications est inclus dans certains des profils de configuration de test. Le pool d’applications héberge des proxys de service d’application que vous définissez lorsque vous déployez vos applications pour les clusters Big Data.
appproxy est une API web qui se trouve devant les applications du pool d’applications. Il authentifie les utilisateurs, puis route les demandes vers les applications.
| Pod name | Type de contrôleur Kubernetes | Containers |
|---|---|---|
appproxy |
ReplicaSet | - app-service-proxy- fluentbit |
Pour plus d’informations, consultez Présentation du déploiement d’applications sur un cluster Big Data.
Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.
Gateway service
Les services de passerelle mettent à disposition la passerelle Knox pour Spark, HDFS, Yarn, l'interface utilisateur de Yarn et l'interface utilisateur de Spark.
| Pod name | Type de contrôleur Kubernetes | Containers |
|---|---|---|
gateway-<#> |
StatefulSet | - knox- fluentbit |
Une seule passerelle est prise en charge.
Références de conteneur open source
Pour obtenir des projets et des versions open source spécifiques, consultez la référence logicielle open source.
Next steps
Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :