Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article décrit la zone de conception de supervision d’une charge de travail Azure VMware Solution. Ce domaine se concentre sur les meilleures pratiques d’observabilité. Les conseils sont destinés à une équipe d’exploitation. Microsoft, VMware et les tiers fournissent différents outils que vous pouvez utiliser pour surveiller votre infrastructure et votre application. Cet article répertorie ces options.
Chaque option offre des solutions de supervision avec différents degrés de coûts de licence, d’options d’intégration, d’étendue de surveillance et de prise en charge. Examinez attentivement les conditions générales applicables avant d’utiliser les outils.
Collecter des données d’infrastructure
Impact : Excellence opérationnelle
La surveillance de votre charge de travail implique la collecte de données à partir de l’infrastructure Azure VMware Solution et de divers composants de solution VMware. Azure VMware Solution est intégré au centre de données défini par logiciel VMware (SDDC), qui exécute plusieurs composants natifs de la solution VMware, tels que VMware Aria. Vous pouvez utiliser cette suite d’outils, notamment VMware Aria Operations, pour gérer différents aspects de votre infrastructure.
Un autre outil à votre disposition est VMware vSphere Health Status pour Azure VMware Solution. Cet outil permet de s’assurer que la détection et la correction proactives des problèmes sont continuellement effectuées dans votre environnement Azure VMware Solution. En particulier, cet outil trouve des configurations incorrectes dans l’infrastructure VMware vSphere et détecte les goulots d’étranglement des performances. Il fournit également des informations sur l’utilisation des ressources et la performance globale de la santé environnementale.
Les opérations VMware Aria pour réseaux vous aident à obtenir une visibilité réseau complète, à rationaliser les processus de résolution des problèmes et à optimiser les performances du réseau.
Recommendations
- Configurez l’état d’intégrité de VMware vSphere pour obtenir une vue générale de l’état de santé du cloud privé d'Azure VMware Solution.
- Utilisez des outils tiers comme VMware Aria Suite pour améliorer la visibilité et l’analytique de l’infrastructure réseau de cloud privé Azure VMware Solution.
- Utilisez des outils de supervision natifs Azure tels que :
- Azure Monitor.
- Opérations VMware Aria pour la supervision opérationnelle.
- Azure Policy et son tableau de bord associé pour la surveillance de la conformité.
- Microsoft Defender pour cloud et Microsoft Sentinel pour la surveillance de la sécurité.
Gérer les journaux et les archives
Impact : Excellence opérationnelle
Pour obtenir des données de santé à partir de composants de la solution VMware, vous devez avoir accès aux journaux collectés par le service syslog VMware. Les composants de solution incluent VMware ESXi, VMware vSAN, VMware NSX-T Data Center et VMware vCenter Server. Les journaux de ces composants sont disponibles via l’infrastructure Azure VMware Solution. Un agent ou une extension Log Analytics envoie des journaux d’activité invités au niveau de la machine virtuelle à Log Analytics. Dans Azure VMware Solution, vous pouvez envoyer les journaux Azure VMware Solution à un conteneur blob de stockage Azure natif. Pour envoyer des journaux à un objet blob de stockage, vous pouvez configurer des redirecteurs à partir d’un serveur syslog centralisé ou configurer l’objet blob en tant que destination dans Azure Monitor. Il est également possible d’utiliser un outil natif Azure tel qu’Azure Logic Apps ou Azure Functions pour transférer des journaux. Vous pouvez utiliser ces outils pour créer des instances réceptrices pour les journaux entrants provenant de Azure VMware Solution et envoyer les journaux à un conteneur de stockage Blob.
L’archivage des journaux de logs est une stratégie pour réduire les coûts de stockage. Les objets Blob de stockage Azure et Log Analytics peuvent transférer des journaux pour l’archivage à long terme. L’utilisation d’un objet blob de stockage est l’option moins coûteuse. Toutefois, Log Analytics a des intégrations avancées pour les alertes, la visualisation, l’interrogation et l’obtention d’insights basés sur le Machine Learning. Tenez compte de votre budget, des cas d’usage fonctionnels et des cas d’usage à long terme lorsque vous choisissez une solution.
Recommendations
- Collectez les journaux à partir du service syslog VMware pour obtenir des données de santé à partir des composants des solutions VMware, tels que VMware ESXi, VMware vSAN, VMware NSX-T Data Center et VMware vCenter Server.
- Configurez des outils tels que les opérations VMware Aria pour la journalisation afin de collecter différents journaux d’activité pour l’interrogation, l’analyse et les fonctionnalités de création de rapports.
- Configurez les durées de rétention pour l'archivage des journaux à long terme afin de réduire le temps des requêtes et d’économiser sur les coûts de stockage.
Surveiller le système d’exploitation invité
Impact : Excellence opérationnelle
Dans le système d’exploitation invité, les métriques sont disponibles pour l’utilisation du disque, les performances des applications, l’utilisation des ressources système et l’activité utilisateur. Envisagez d’utiliser Azure Arc pour Azure VMware Solution (préversion) pour gérer les ressources d’infrastructure VMware dans Azure. Pour plus d’informations, consultez Déployer Azure Arc pour Azure VMware Solution.
Recommendations
- Activez la gestion des invités et installez les extensions Azure une fois votre cloud privé activé par Azure Arc pour serveurs ou Azure Arc pour Azure VMware Solution (préversion).
- Installez des agents supplémentaires pour collecter des données afin d’activer la gestion et la surveillance des invités sur des machines virtuelles invitées Azure VMware Solution.
Implémenter la surveillance de la sécurité
Impact : Sécurité, Excellence opérationnelle
La surveillance de la sécurité est essentielle pour détecter et répondre aux activités anormales. Les charges de travail qui s’exécutent dans un cloud privé Azure VMware Solution ont besoin d’une surveillance complète de la sécurité qui s’étend sur les réseaux, les ressources Azure et le cloud privé Azure VMware Solution lui-même. Vous pouvez centraliser les événements de sécurité en déployant un espace de travail Microsoft Sentinel. À l’aide de cette intégration, l’équipe d’exploitation peut afficher, analyser et détecter les incidents de sécurité dans le contexte d’un paysage plus large des menaces organisationnelles.
Recommendations
- Activez Defender pour cloud sur l’abonnement Azure que vous utilisez pour déployer le cloud privé Azure VMware Solution. Vérifiez que dans le plan Defender pour cloud, le paramètre CWP (Cloud Workload Protection) a la valeur ON pour les serveurs.
- Auditer les actions effectuées par les utilisateurs privilégiés sur le cloud privé Azure VMware Solution. Pour plus d’informations, consultez l’historique des activités d’audit pour les affectations de groupe dans la Gestion des identités à privilèges.
- Intégrez Microsoft Sentinel à Defender pour cloud. Activez son collecteur de données pour les événements de sécurité et connectez-le à Defender pour cloud.
- Utilisez des solutions de surveillance de la sécurité des partenaires validés dans Azure VMware Solution.
Surveiller et analyser des réseaux
Impact : Sécurité, Excellence opérationnelle
Le processus de surveillance du réseau inspecte tout le trafic entrant et sort du cloud privé Azure VMware Solution. Dans Azure VMware Solution, la sécurité réseau fonctionne sur les couches réseau et hôte.
Recommendations
- Capturez et surveillez les journaux de pare-feu réseau déployés dans le cloud privé Azure VMware Solution. Surveillez également les journaux d’activité déployés dans Azure lorsque votre application s’étend à des appareils natifs Azure tels que le Pare-feu Azure ou Azure Application Gateway. Pour plus d'informations, consultez l'intégration du pare-feu dans Azure VMware Solution.
- Utilisez le classeur de pare-feu Azure ou des outils similaires pour surveiller les métriques et journaux courants liés aux appareils de pare-feu.
- Mettre en corrélation les journaux à partir de plusieurs vecteurs de sécurité tels que les vecteurs d’identité, de mise en réseau et d’infrastructure.
Configurer et simplifier les alertes
Impact : Excellence opérationnelle, Optimisation des coûts
Lorsque vous exécutez des charges de travail dans le cloud privé Azure VMware Solution, vous devez surveiller efficacement les performances des charges de travail. Par exemple, vous devez capturer les journaux, les métriques et les demandes de suivi pour vos couches d’application et d’infrastructure.
Les alertes peuvent vous aider à répondre aux modifications apportées à votre base de référence de performances. Vous pouvez également utiliser des alertes pour fournir des informations sur les modifications de maintenance ou de configuration nécessaires. Par exemple, vous pouvez recevoir des notifications quand une clé expire, une connexion est perdue ou il y a un risque de dépassement de la capacité d’une ressource.
Pour rendre les alertes efficaces, configurez-les pour notifier les équipes responsables lorsque certaines conditions sont remplies. Envisagez également de consolider les alertes pour réduire le nombre de notifications individuelles envoyées :
- Au lieu d'émettre une alerte pour chaque ordinateur à court d'espace, envisagez de consolider les alertes par hôtes, groupes de ressources ou clusters.
- Utilisez également cette approche avec les problèmes d’hôte, le processeur et les pics de stockage.
- Baser les alertes sur des fenêtres temporelles. Par exemple, si un hôte émet des alertes pendant une courte période, vous pouvez supprimer les alertes en fonction d’un seuil de temps défini. Par exemple, vous ne pouvez envoyer une alerte qu’après cinq minutes.
Recommendations
- Discutez et établissez des bases de référence basées sur des données de performances.
- Définissez des critères d’alerte pertinents tels que des seuils, des niveaux de gravité ou des conditions spécifiques.
- Utilisez le sous-système des événements et des alarmes VMware vSphere pour surveiller VMware vSphere et configurer des déclencheurs.
- Configurez des alertes Azure dans Azure VMware Solution pour répondre aux événements en temps réel.
- Assurez-vous que les alertes sont configurées afin que l’espace de marge du magasin de données VMware vSAN soit conservé aux niveaux que votre contrat de niveau de service (SLA) impose.
- Configurez les alertes d’intégrité des ressources pour obtenir l’état d’intégrité en temps réel du cloud privé Azure VMware Solution.
- Utilisez les outils APM (Application Performance Monitoring) pour obtenir des insights sur les performances au niveau du code de l’application.
- Utilisez une combinaison de techniques de surveillance telles que les transactions synthétiques, la surveillance des pulsations et la surveillance des points de terminaison.
- Hiérarchiser les alertes en fonction de leur impact sur les opérations ou de la criticité des systèmes concernés. Ajustez les alertes pour déclencher uniquement des événements significatifs.
- Pour réduire le bruit et gérer efficacement les alertes, utilisez des méthodes pour réduire le nombre de notifications individuelles émises.
- Pour réduire la fatigue des alertes, utilisez un mécanisme pour informer les parties prenantes clés uniquement des événements importants.
- Utilisez des canaux de notification tels que SMS, e-mail, notifications Push et plateformes de collaboration telles que Microsoft Teams pour vous assurer que les alertes sont remises efficacement.
Gérer les coûts
Impact : Optimisation des coûts, excellence opérationnelle
La surveillance des coûts fait référence à la possibilité de suivre les coûts associés au cloud privé Azure VMware Solution.
Recommendations
- Utilisez le sous-système des événements et des alarmes VMware vSphere pour surveiller VMware vSphere et configurer des déclencheurs.
- Configurez des alertes Azure basées sur des requêtes Log Analytics pour Azure VMware Solution. Ces alertes aident votre équipe d’exploitation à répondre aux événements attendus et inattendus en temps réel.
Utiliser les outils de résolution des problèmes et de débogage
Impact : Optimisation des coûts, excellence opérationnelle
Pour déboguer et dépanner efficacement votre application, vous avez besoin de journaux, de métriques et d’informations associées. Ces informations incluent les activités d’événement afin que vous puissiez identifier, analyser et établir des connexions entre les événements.
Recommendations
- Configurez votre système pour transférer les journaux du service syslog d'Azure VMware Solution vers Log Analytics. Transférez tous les journaux, métriques et informations de diagnostic pertinents.
- Configurez un agent de serveur activé par Azure Arc sur des machines virtuelles invitées qui s’exécutent dans le cloud privé Azure VMware Solution.
Utiliser des tableaux de bord
Impact : Excellence opérationnelle
Les tableaux de bord d’application vous aident à visualiser et à surveiller les performances, l’intégrité et les autres métriques d’une application :
- Les rapports de surveillance dans les tableaux de bord vous aident à effectuer rapidement l'analyse des causes principales et les dépannages. Les équipes d’opérations peuvent utiliser ces tableaux de bord pour afficher toutes les ressources clés qui composent Azure VMware Solution dans un seul volet.
- Les métriques de tableau de bord fournissent des informations sur la façon dont le code et l’infrastructure changent ont un impact sur le comportement de l’application.
- Les visuels aident les équipes de support client à comprendre l’impact des modifications, des performances et des problèmes de disponibilité sur une application.
- Les indicateurs de performance profitent au leadership exécutif et aux parties prenantes de l’entreprise. Ces outils informent les décisions qui alignent les performances d’une application avec les objectifs métier. Par exemple, un cadre peut surveiller l’engagement des clients en examinant les métriques telles que la disponibilité du service, les temps de résolution des incidents et les temps de réponse moyens. Ces métriques permettent de s’assurer que l’organisation fournit des services en fonction de son contrat SLA.
Outre l’offre d’insights, les tableaux de bord peuvent également promouvoir la transparence et encourager la collaboration, par exemple, lorsque vous accordez aux parties prenantes appropriées l’accès aux tableaux de bord d’application. Cet acte cultive une compréhension partagée des performances d’une application. Cette pratique permet également à une organisation de prendre des décisions éclairées. Par conséquent, les parties prenantes peuvent se concentrer sur la poursuite d’initiatives cruciales qui propulsent l’entreprise vers l’avant.
Recommendations
- Créez un tableau de bord d’application avec Application Insights ou Grafana. Connectez le tableau de bord aux sources de données pertinentes qui stockent les métriques à partir de votre environnement Azure VMware Solution.
- Créez un classeur Azure en tant que référentiel central pour exécuter couramment des requêtes, des métriques et des rapports interactifs.
- Assurez-vous que votre source de données s’aligne sur les exigences de sécurité et de conformité.
- Définissez des contrôles d’accès et des autorisations tels que l’authentification utilisateur et le contrôle d’accès en fonction du rôle. Assurez-vous que chaque partie prenante dispose d’un accès approprié en fonction de son rôle.
- Effectuez des révisions d’accès périodiques pour vérifier que l’accès utilisateur est à jour et aligné sur les rôles et responsabilités actuels.
Étapes suivantes
Maintenant que vous avez examiné les meilleures pratiques d’observabilité dans Azure VMware Solution, explorez les mécanismes, les outils et les périmètres que vous pouvez utiliser pour sécuriser davantage les charges de travail dans le SDDC.
Utilisez l’outil d’évaluation pour évaluer vos choix de conception.