Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Le cadre d'observabilité Opérateur Nexus fournit des perceptions opérationnelles sur vos instances locales. L’infrastructure prend en charge la journalisation, la surveillance et les alertes (LMA), l’analytique et la visualisation des données et des métriques opérationnelles (plateforme et charges de travail).
Figure : Cadre de journalisation, de surveillance et d'alerte (LMA) de l'opérateur Nexus
Les principaux points forts de l’infrastructure d’observabilité Nexus de l’opérateur sont les suivants :
- Collecte de données centralisée : la solution d’observabilité Nexus opérateur est basée sur une collection de toutes les données d’un emplacement central. À cet endroit, vous pouvez observer les données de surveillance de toutes vos instances locales.
- Outils bien définis et testés : la solution s’appuie sur Azure Monitor qui collecte, analyse et agit sur les données de télémétrie à partir de vos instances cloud et locales.
- Facile à apprendre et à utiliser : la solution vous permet d’analyser et de déboguer facilement des problèmes avec la possibilité de rechercher les données à partir ou dans toutes vos instances cloud et locales.
- Outils de visualisation : vous créez des tableaux de bord et des classeurs personnalisés en fonction de vos besoins.
- Outils d’alerte intégrés : vous créez des alertes basées sur des seuils personnalisés. Vous pouvez créer et réutiliser des modèles d’alerte sur toutes vos instances.
Cet article vous aide à comprendre l’infrastructure d’observabilité Opérateur Nexus qui se compose d’une pile de composants :
- Azure Monitor collecte et agrège les données de journalisation à partir des composants Operator Nexus
- Azure Log Analytics Workspace (LAW) collecte et agrège les données de journalisation provenant de plusieurs abonnements et clients Azure.
- L’analyse, la visualisation et les alertes sont effectuées sur les données de journal agrégées.
Supervision de la plateforme
L’opérateur Nexus vous donne une visibilité sur les performances de vos déploiements qui se composent de ressources d’infrastructure. Vous devez collecter et analyser les journaux de bord et les métriques issus de ces ressources de la plateforme. Vous obtenez des informations précieuses à partir de la collection centralisée et de l’agrégation des données de toutes les sources, par rapport aux données non agrégées.
Ces journaux et métriques sont utilisés pour observer l’état de la plateforme. Vous pouvez voir les performances et analyser ce qui est incorrect. Vous pouvez analyser ce qui a provoqué la situation. La visualisation vous aide à configurer les alertes requises et dans quelles conditions. Par exemple, vous pouvez configurer les alertes à générer lorsque les ressources se comportent anormalement ou lorsque des seuils ont été atteints. Vous pouvez utiliser les journaux collectés et les données d'analyse pour déboguer tous les problèmes dans l'environnement.
Données de surveillance
L’observabilité Nexus de l’opérateur vous permet de collecter le même type de données que d’autres ressources Azure. Les données collectées à partir de chacune de vos instances peuvent être consultées dans votre LOI.
Vous pouvez en savoir plus sur la surveillance des ressources Azure ici.
Collecte et routage
L’observabilité Nexus de l’opérateur vous permet de collecter des données pour chaque ressource d’infrastructure. L’ensemble des composants d’infrastructure comprend :
- Infrastructure réseau qui inclut des CEs, des TOR, des npB, des commutateurs de gestion et le serveur terminal.
- Ressources de calcul qui incluent les serveurs bare metal.
- Plan de contrôle Undercloud (cluster Kubernetes responsable du déploiement et de la gestion du cycle de vie de la plateforme globale).
La collecte de données de journal à partir de ces couches est activée par défaut lors de la création de votre instance Opérateur Nexus. Ces journaux collectés sont routés vers votre Azure Monitor LAW.
Vous pouvez également collecter des données à partir des couches de locataire créées pour l’exécution de fonctions de réseau conteneurisées et virtualisées. Les données de journal qui peuvent être collectées incluent :
- Collection de syslog à partir de machines virtuelles (utilisée pour les charges de travail VNFs ou CNF).
- Collection de journaux d’activité à partir de clusters Kubernetes et des applications déployées en haut.
Vous devez activer la collecte des journaux des clusters Kubernetes locataires et des machines virtuelles. Vous devez suivre les étapes pour déployer les agents de surveillance Azure. Les données seraient collectées dans votre Azure LAW.
Stockage des logs Nexus de l'opérateur
Les données des journaux Azure Monitor sont stockées dans des tables, chacune ayant son propre ensemble de propriétés uniques.
Tous les journaux de ressources dans Azure Monitor ont les mêmes champs suivis de champs spécifiques au service ; consultez le schéma commun.
Les journaux d’activité de la plateforme Opérateur Nexus sont stockés dans les tableaux suivants :
| Table | Descriptif |
|---|---|
| syslog (protocole standard pour la journalisation des événements en informatique) | Événements Syslog sur des ordinateurs Linux à l’aide de l’agent Log Analytics |
| ContainerInventory | Détails et état actuel de chaque conteneur. |
| ContainerLog | Lignes de journal collectées à partir de flux stdout et stderr pour les conteneurs |
| ContainerNodeInventory | Détails des nœuds qui servent d’hôtes de conteneur. |
| InsightMetrics | Métriques collectées à partir du serveur, des K8s, des conteneurs. |
| KubeEvents | Événements Kubernetes et leurs propriétés. |
| KubeMonAgentEvents | Événements enregistrés par l’agent Kubernetes Azure Monitor pour les erreurs et les avertissements. |
| KubeNodeInventory | Détails des nœuds qui font partie du cluster Kubernetes |
| KubePodInventory | Les pods Kubernetes et leurs propriétés |
| KubePVInventory | Volumes persistants de Kubernetes et leurs propriétés. |
| KubeServices | Services Kubernetes et leurs propriétés |
| Heartbeat | Enregistrements consignés par les agents Log Analytics une fois par minute pour rendre compte de l’état de santé de l’agent |
Métriques nexus de l’opérateur
La table « InsightMetrics » de la section Journaux contient les métriques collectées à partir de machines Bare Metal et du cluster Kubernetes souscloud. En outre, quelques métriques sélectionnées collectées à partir du sous-cloud peuvent être observées en ouvrant l’onglet Métriques dans le menu Azure Monitor.
Figure : Sélection des métriques Azure Monitor
Pour plus d’informations sur l’utilisation de cet outil, consultez Analyser les métriques avec Azure Monitor Metrics Explorer .
Cahiers d'exercices
Les classeurs combinent du texte, des requêtes de journal, des métriques et des paramètres pour l’analyse des données et la création de plusieurs types de visualisations enrichies. Vous pouvez utiliser l’exemple de modèles de classeur Azure Resource Manager pour l’opérateur Nexus Logging and Monitoring pour déployer des classeurs Azure au sein de votre azure LAW.
Alerts
Vous pouvez utiliser l’exemple de modèles d’alarme Azure Resource Manager pour les règles d’alerte Nexus d’opérateur. Vous devez spécifier des seuils et des conditions pour les alertes. Vous pouvez ensuite déployer ces modèles d’alerte sur votre environnement local.
Alertes de capacité matérielle
Le seuil de capacité matérielle pour les appareils est défini à 60%et les seuils de limite TrafficPolicy sont définis à 35%. Toutes les alertes seront publiées via syslog.
Espace de travail Log Analytics
Un espace de travail Log Analytics (LAW) est un environnement unique pour journaliser les données d’Azure Monitor et d’autres services Azure. Chaque espace de travail possède son propre référentiel de données et sa configuration, mais peut combiner des données de plusieurs services. Chaque espace de travail se compose de plusieurs tables de données.
Une loi unique peut être créée pour collecter toutes les données pertinentes ou plusieurs espaces de travail en fonction des exigences de l’opérateur.