Partager via


Ressources déployées avec des clusters Big Data SQL Server

S’applique à : SQL Server 2019 (15.x)

Important

Les clusters Big Data Microsoft SQL Server 2019 sont mis hors service. La prise en charge des clusters Big Data SQL Server 2019 a pris fin le 28 février 2025. Pour plus d’informations, consultez le billet de blog d’annonce et les options Big Data sur la plateforme Microsoft SQL Server.

Cet article décrit les ressources qu’un cluster Big Data SQL Server déploie.

Un cluster Big Data déploie des pods en fonction du profil de déploiement. Pour plus d’informations, consultez configurations par défaut.

Cet article décrit les pods déployés sous le profil aks-dev-test-ha et comprend un pool Spark. Interrogez Kubernetes pour voir les pods déployés dans votre cluster. L’exemple suivant retourne une liste de pods sous un espace de noms spécifique.

kubectl get pods -n <namespace>

Remplacez <namespace> par le nom de votre cluster Big Data.

Pour plus d’informations, consultez Guide pratique pour déployer Clusters Big Data SQL Server sur Kubernetes.

Le diagramme suivant affiche les composants déployés dans un cluster Big Data :

big-data-cluster-diagram

Pour plus d’informations sur l’architecture, consultez Présentation des clusters Big Data SQL Server.

Deployed pods

Le tableau suivant répertorie les pods déployés dans un cluster Big Data.

Name Area
control-<nnnn> Control
controldb-<#> Control
controlwd-<nnnn> Control
logsdb-<#> Control
logsui-<nnnn> Control
metricsdb-<#> Control
metricsdc-<nnnn> Control
metricsui-<nnnn> Control
mgmtproxy-<nnnn> Control
zookeeper-<#> Control
dns-<nnnn> Control
master-<#n> Master instance
operator-<nnnn> Master instance
compute-<#n>-<#m> Compute pool
data-<#>-<#> Data pool
storage-<#>-<#> Storage pool
nmnode-<#>-<#> Storage pool
sparkhead-<#> Storage pool
appproxy-<#m> Application pool
gateway-<#> Gateway service

Tous les pods ne sont pas inclus dans chaque cluster Big Data. Les déploiements avec haute disponibilité ou l’intégration Active Directory incluent des pods spécifiques.

Pods spécifiques à haute disponibilité :

  • operator-<nnnn>
  • zookeeper-<#>

Pods spécifiques à Active Directory :

  • dns-<nnnn>

Les sections suivantes décrivent les pods et répertorient les conteneurs dans chaque pod.

Control

Les modules de contrôle fournissent le service de contrôle.

Pod name Count Type de contrôleur Kubernetes Containers
control-# 1 ReplicaSet - controller

- security-support

- fluentbit
controldb 1 StatefulSet - mssql-server

- fluentbit
controlwd 1 ReplicaSet - controlwatchdog
logsdb-# 1 StatefulSet - elasticsearch
logsui 1 ReplicaSet - kibana
metricsdb-# 1 StatefulSet - influxdb
metricsdc 1 par nœud Kubernetes. DaemonSet - telegraf
metricsui-nnnn 1 ReplicaSet - grafana
mgmtproxy-nnnn 1 ReplicaSet - service-proxy

- fluentbit
dns-nnnn 0 ou 1 pour l’intégration d’Active Directory ReplicaSet - dns

- fluentbit

Master instance

master-<#n> est l’instance principale SQL Server.

  • Gère le pool de données via DDL
  • Manipule des données dans le pool de données via DML
  • Ordonne l’exécution des requêtes analytiques vers le pool de données
Pod name Count Type de contrôleur Kubernetes Containers
master-<#n> 1 ou plus pour la haute disponibilité. StatefulSet - mssql-server

- fluentbit

- collectd

- mssql-ha-supervisor *
operator* 0 ou 1 pour la haute disponibilité ReplicaSet - mssql-ha-operator

* Seuls les déploiements à haute disponibilité. L’opérateur implémente et inscrit la définition de ressource personnalisée pour SQL Server et les ressources du groupe de disponibilité. Lorsque l’opérateur est déployé, il s’inscrit en tant qu’écouteur pour les notifications relatives aux ressources SQL Server déployées dans le cluster Kubernetes. mssql-ha-supervisor prend en charge le groupe de disponibilité.

Chaque master pod contient une instance de SQL Server. Un déploiement à haute disponibilité comprend 3 pods. Chaque pod inclut une instance SQL Server avec des bases de données dans un groupe de disponibilité Always On SQL Server.

Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Compute pool

Le pool de calcul fournit une instance SQL Server pour le calcul.

Pod name Count Type de contrôleur Kubernetes Containers
compute-<#n>-<#m> 1 ou plus. StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifie le pool de calcul.
  • #m identifie l’ID d’instance dans le pool.

Les instances SQL Server du pool de calcul sont sans état. Ils nécessitent uniquement un stockage pour tempdb.

Incluez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Data pool

Le pool de données fournit des instances SQL Server pour le stockage et le calcul.

Pod name Count Type de contrôleur Kubernetes Containers
data-<#n>-<#m> 0 ou plus StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifie le pool de données.
  • #m identifie l’ID d’instance dans le pool.

Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Storage pool

Le pool de stockage fournit l’ingestion des données via Spark, le stockage dans HDFS, l’accès aux données par le biais de points de terminaison HDFS et SQL Server.

Pod name Count Type de contrôleur Kubernetes Containers
storage-0-# 1 ou plus. Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail. StatefulSet - hadoop

- mssql-server

- fluentbit

nmnode-0-# 1 ou plus pour la haute disponibilité StatefulSet - hadoop

- fluentbit
sparkehead-# 1 ou plus pour la haute disponibilité StatefulSet - hadoop-yarn-jobhistory

- hadoop-livy-sparkhistory

- hadoop-hivemetastore

-- fluentbit
zookeeper 0 ou 3 pour la haute disponibilité. StatefulSet - zookeeper

- fluentbit

Application pool

Le pool d’applications est inclus dans certains des profils de configuration de test. Le pool d’applications héberge des proxys de service d’application que vous définissez lorsque vous déployez vos applications pour les clusters Big Data.

appproxy est une API web qui se trouve devant les applications du pool d’applications. Il authentifie les utilisateurs, puis route les demandes vers les applications.

Pod name Type de contrôleur Kubernetes Containers
appproxy ReplicaSet - app-service-proxy

- fluentbit

Pour plus d’informations, consultez Présentation du déploiement d’applications sur un cluster Big Data.

Incluez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Gateway service

Les services de passerelle mettent à disposition la passerelle Knox pour Spark, HDFS, Yarn, l'interface utilisateur de Yarn et l'interface utilisateur de Spark.

Pod name Type de contrôleur Kubernetes Containers
gateway-<#> StatefulSet - knox

- fluentbit

Une seule passerelle est prise en charge.

Références de conteneur open source

Pour obtenir des projets et des versions open source spécifiques, consultez la référence logicielle open source.

Next steps

Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :