Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
La gestion de votre environnement Azure ne consiste pas seulement à maintenir les lumières allumées. Il s’agit de maintenir la gouvernance et la sécurité tout en garantissant que votre cloud reste aligné sur les objectifs métier au fil du temps. À mesure que votre environnement augmente, vous devez empêcher la dérive de la configuration, améliorer les déploiements via l’infrastructure en tant que code et gérer efficacement les modifications.
La méthodologie de gestion du Framework d’adoption du cloud (CAF) introduit l’approche RAMP (Prêt, Administrer, Surveiller, Protéger) pour vous aider à créer ces fonctionnalités. RAMP offre un moyen structuré d’organiser les équipes, de définir des responsabilités et d’implémenter les processus et outils qui permettent à vos opérations Azure de sécuriser, de respecter et de résister. De l’administration quotidienne à la surveillance de l’intégrité et à la protection contre les perturbations, RAMP vous aide à établir une solide base opérationnelle pour réussir à long terme.
Identifier vos responsabilités de gestion
La gestion Efficace d’Azure s’étend sur deux couches de responsabilité : responsabilités centrales (plateforme) et responsabilités de charge de travail . Les responsabilités centrales s’appliquent à l’ensemble du patrimoine cloud. Les responsabilités de charge de travail se concentrent sur les applications ou services individuels. Utilisez le tableau 1 pour vous assurer que votre modèle d’exploitation couvre les domaines essentiels de la gestion cloud
Tableau 1. Responsabilités principales en matière de gestion cloud
| Zones de gestion cloud | Responsabilités centrales (plateforme) | Responsabilités de charge de travail |
|---|---|---|
| Compliance | ▪ Définir des procédures opérationnelles. ▪ Appliquer des stratégies de gouvernance. ▪ Surveillez la conformité et corrigez ou faites remonter le cas échéant. |
▪ Suivez les procédures opérationnelles. ▪ Aligner la conception avec les stratégies de gouvernance. |
| Security | ▪ Gérer les opérations de sécurité à l’échelle de l’organisation. ▪ Gérer les identités dans Microsoft Entra ID. ▪ Accordez l’accès aux abonnements Azure. ▪ Définissez et gérez les bases de référence de sécurité via Azure Policy et Microsoft Defender pour cloud. ▪ Supervisez l’intégration de la protection contre les menaces et des incidents à Microsoft Sentinel. |
▪ Implémentez la conception sécurisée de la charge de travail. ▪ Répondez aux alertes et incidents de sécurité spécifiques à la charge de travail. ▪ Évaluez en permanence les vulnérabilités au sein de la charge de travail. |
| Gestion des ressources | ▪ Définissez et gérez la hiérarchie des ressources. ▪ Créez des abonnements de charge de travail comme demandé. ▪ Définissez la stratégie de nommage et d’étiquetage. ▪ Définissez la topologie de réseau. ▪ Configurer la mise en réseau partagée (peering de réseaux virtuels, connectivité locale). ▪ Gérez les ressources/services partagés ou communs entre les chargements de travail. ▪ Surveillez les limites d’abonnement et gérez les demandes pour les augmentations de quota. |
▪ Gérer les abonnements spécifiques à la charge de travail (s’ils sont délégués). ▪ Gérez les groupes de ressources et les ressources pour chaque charge de travail. ▪ Respectez et appliquez des normes de nommage et d’étiquetage. ▪ Gérez l’utilisation des ressources au niveau de l’application, ce qui garantit que les ressources restent dans les quotas d’abonnement. |
| Déploiement | ▪ Normaliser et régir les pipelines et outils CI/CD (Azure DevOps, GitHub Actions). ▪ Définissez des modèles d’infrastructure en tant que code de référence (Bicep, Terraform, modèles ARM). ▪ Fournissez les meilleures pratiques centralisées pour la sécurité du pipeline (analyse du code, gestion des secrets). |
▪ Utilisez l’infrastructure CI/CD centrale et les modèles IaC pour les déploiements de charge de travail. ▪ Implémentez des tâches de déploiement spécifiques à la charge de travail (configurer les paramètres de l’application, la base de données). ▪ Adaptez les modèles de référence aux besoins de charge de travail tout en respectant les instructions centrales. |
| Développement | ▪ Fournissez et appliquez des chaînes d’outils et des frameworks de développement standardisés pour accélérer la cohérence (normes de codage, meilleures pratiques DevOps). ▪ Gérez les dépôts internes ou les flux de package pour les bibliothèques ou modules partagés. |
▪ Adoptez et adaptez les chaînes d’outils standard pour le développement de charges de travail. ▪ Possèdez le cycle de vie de l’application et incorporez les meilleures pratiques (tests unitaires, tests d’intégration). ▪ Gérer l’amélioration continue de la base de code de la charge de travail. |
| Supervision | ▪ Planifier la stratégie de surveillance. ▪ Alerte sur les responsabilités centralisées. ▪ Fournissez des tableaux de bord pour les métriques opérationnelles courantes dans l’environnement. |
▪ Surveiller la charge de travail ▪ Étendez ou ajustez les alertes centrales pour capturer des conditions spécifiques à la charge de travail. ▪ Examinez et corrigez les incidents au niveau de la charge de travail en fonction des alertes et des journaux. |
| Coûts | ▪ Allouer des budgets cloud globaux ou au niveau de l’abonnement ▪ Surveillez les dépenses cloud à l’échelle de l’organisation et créez des rapports de coûts. ▪ Allouez des coûts à des unités commerciales ou des produits, généralement à l’aide de balises ou de modèles d’allocation de coûts personnalisés. ▪ Appliquez la stratégie d’étiquetage pour l’allocation des coûts. |
▪ Conception de charge de travail pour l'optimisation des coûts ▪ Respectez les contraintes budgétaires. |
| Reliability | ▪ Définissez les exigences de fiabilité (SLO, RPO, RTO) par priorité de charge de travail. ▪ Fournissez des conseils sur la continuité d’activité et la reprise d’activité (BCDR). ▪ Gérer les solutions de récupération d’urgence centralisées. ▪ Prendre en charge la gestion des incidents majeurs sur toutes les charges de travail. |
▪ Concevez la charge de travail pour répondre aux exigences de fiabilité. |
| Performance | ▪ Surveillez et gérez les performances des composants centralisés (réseau hub, services partagés). ▪ Fournissez des instructions pour l’optimisation des performances et la planification de la capacité. ▪ Surveiller le quota |
▪ Conception de la charge de travail pour l’efficacité des performances. |
Établir vos opérations cloud
Utilisez les responsabilités décrites dans le tableau 1 pour créer une base opérationnelle efficace. Définissez clairement les équipes, les normes et les processus en procédant comme suit :
Définissez votre modèle d’opérations cloud. Choisissez un modèle d’exploitation cloud centralisé, partagé ou décentralisé en fonction de la taille et de la maturité de votre organisation. Pour obtenir des conseils, consultez Choisir un modèle d’exploitation cloud
Attribuez des responsabilités de plateforme centrale. Former une équipe dédiée pour gérer les tâches de gestion centralisée. Développez une matrice de compétences du Tableau 1 pour identifier les compétences requises.
Attribuez des responsabilités de charge de travail. Configurez des équipes spécialisées pour les tâches spécifiques à la charge de travail. Identifiez les responsabilités à l’aide du tableau 1 , puis recruter en conséquence. Utilisez Azure Well-Architected Framework et son pilier d’excellence opérationnelle pour guider vos responsabilités de gestion des charges de travail.
Attribuez la responsabilité. Nommez des propriétaires spécifiques pour toutes les responsabilités de gestion cloud. Dans un modèle de gestion partagée, les équipes de charge de travail doivent avoir l’autonomie pour gérer leurs abonnements.
Documenter vos opérations cloud
Documentez clairement vos opérations cloud pour permettre une réponse efficace aux crises et une implémentation fluide des modifications. Établissez des procédures globales et créez des guides détaillés pour des tâches fréquentes et spécifiques.
Documenter les procédures opérationnelles
Définissez des procédures opérationnelles pour la gestion des modifications, de la récupération d’urgence et des tâches de maintenance de routine que l’automatisation ne peut pas gérer. Suivez ces étapes :
Définissez les procédures de gestion des modifications. Le changement est la cause majeure de l’échec dans le cloud. Développez un processus standardisé pour gérer les modifications afin d’éviter les défaillances dans votre environnement cloud. Consultez Gérer les modifications.
Définir des procédures de déploiement (gestion des mises en production). Pour maintenir une configuration cohérente, normalisez vos déploiements, versions et promotions d’environnement. Consultez Gérer les déploiements.
Définissez les procédures de reprise d’activité et de continuité d’activité. Pour gérer les défaillances potentielles, préparez un plan de réponse standardisé. Consultez Gérer la reprise d’activité et la continuité d’activité.
Définissez des procédures supplémentaires. Processus de document pour la gestion des demandes de service, des mises à jour correctives et de la gestion de la configuration. Documentez clairement ces processus pour vous assurer que les parties prenantes savent comment lancer ou terminer chaque tâche.
Documenter les guides opérationnels
Créez des guides détaillés étape par étape (manuels d'exploitation ou scénarios de jeu) pour les principales tâches opérationnelles. Cette préparation garantit une exécution cohérente, améliore l’efficacité et raccourcit les temps de résolution pendant les événements critiques.
Définissez les tâches quotidiennes. Préparez des manuels couvrant les responsabilités quotidiennes, telles que les demandes d’escalade de privilèges et les révisions de journal. Établissez des procédures d’exploitation standard pour la surveillance des métriques, des seuils d’alerte et des tableaux de bord pour chaque système.
Créez une bibliothèque de runbooks centrés sur Azure. Créez des runbooks spécifiques à Azure qui traitent des scénarios tels que :
Scénario Example Utilisation élevée du processeur Gérer le scale-up dans Azure App Service Basculement et restauration automatique Basculement et retour en arrière dans Azure Site Recovery Déploiements bleus/verts Déploiement bleu/vert dans Azure Front Door Restauration des sauvegardes Restauration de sauvegarde dans Stockage Blob Azure et Azure Cosmos DB Stockez ces runbooks dans un référentiel central. Gérez les runbooks dans un référentiel central accessible par les ingénieurs à appel pour une utilisation immédiate pendant les incidents.
Implémentez des opérations par programmation. Intégrez l’infrastructure en tant que code à vos runbooks pour déployer des ressources communes de manière cohérente et précise à chaque fois.
Passez en revue et mettez à jour. Passez régulièrement en revue et modifiez la documentation pour refléter les ajustements opérationnels et les mises à jour du service cloud.
Outils et solutions de document
La documentation claire garantit la cohérence, réduit les risques opérationnels et améliore l’efficacité de l’équipe. Créez et gérez une documentation complète pour les outils cloud. Mettez régulièrement à jour la documentation pour refléter les pratiques actuelles et garantir une accessibilité facile pour tous les membres de l’équipe.
| Area | Exemples d’avantages |
|---|---|
| Integration | La normalisation simplifie les intégrations en consolidant les journaux et les référentiels de code. |
| Automation | Réutiliser des modèles IaC entre les équipes, les scripts d’automatisation et les meilleures pratiques entre les projets. |
| Gestion des incidents | Capturez les problèmes et générez des actions de correction qui s’intègrent aux cycles de mise en production. |
Gérer vos opérations cloud
Une gestion cloud efficace optimise l’efficacité opérationnelle, réduit les temps d’arrêt et clarifie les rôles et responsabilités. Normaliser vos opérations cloud via des processus d’automatisation et de support structuré. Suivez ces instructions opérationnelles :
Fournir une prise en charge continue du cloud. Établissez une couverture de support 24/7 par le biais d’équipes mondiales adoptant un modèle de suivi-le-soleil ou des rotations structurées sur appel. Définissez clairement les responsabilités pour garantir une réponse et une résolution en temps opportun des incidents critiques. Configurez des alertes automatisées pour avertir immédiatement le personnel de support désigné.
Automatisez le travail répétitif. Utilisez les fonctionnalités d’automatisation Azure pour réduire les processus manuels et réduire la surcharge opérationnelle. Automatisez les activités de routine pour éliminer les erreurs, rationaliser les flux de travail et permettre aux équipes de se concentrer sur les priorités stratégiques.
Cas d’usage Examples Automation Automatisez les flux de travail dans azure Boards ou le système ITSM. Modèles pour les éléments de travail « Demande de modification » et « Incident ». Réponse aux incidents Pour générer automatiquement des tickets d’incident avec des champs standard remplis, intégrez Azure Monitor et Azure Service Health au système de gestion des tickets. Gestion des changements Utilisez Azure Logic Apps pour autoapprouver automatiquement les modifications à faible risque ou effectuer une récupération automatique de certains incidents. Compliance Utilisez Azure Policy pour appliquer et surveiller la conformité du cloud. Security Utilisez Microsoft Defender pour cloud et Microsoft Sentinel pour automatiser la détection et la réponse des menaces de sécurité. Utilisez Microsoft Entra ID Governance pour passer en revue les autorisations et automatiser la gestion des autorisations.
Améliorer les opérations
Optimisez votre environnement cloud Azure en favorisant l’amélioration continue. Évaluez régulièrement les opérations et priorisez l'apprentissage et les retours d'expérience continus. Suivez ces étapes :
Passez en revue les opérations pour améliorer. Suivez les bonnes pratiques pour surveiller l’intégrité, la conformité, la sécurité, les coûts, les données et les ressources cloud. Effectuez des examens opérationnels hebdomadaires pour discuter des métriques clés, des incidents récents, des modifications déployées et des risques prévus. Traitez activement l’expansion des ressources et la dette technique.
Effectuer l’apprentissage pour les opérations. Favoriser le développement continu des compétences en hiérarchisant les ressources d’apprentissage essentielles. Gérez les opérations cloud dynamiques par le biais d’environnements de formation pratiques. Le tableau suivant fournit des ressources pour l’entraînement des opérations.
Formation sur les opérations Descriptif Obtenir les informations d’identification Définissez des objectifs pour les informations d’identification Microsoft, comme les compétences appliquées et les certifications Microsoft pour créer une expertise. Utiliser des ressources opérationnelles Consultez les ressources de gestion Azure. Utiliser la documentation du produit Utilisez Microsoft Learn pour trouver des conseils sur les services Azure. Obtenez une expérience pratique Encouragez la pratique intensive dans des environnements hors production de type bac à sable.
Ressources de gestion Azure
| Catégorie | Ressource de gestion | Descriptif |
|---|---|---|
| Compliance | Gouvernance du CAF | Framework de gouvernance cloud de Microsoft |
| Security | Gérer les opérations de sécurité | Conseils pour gérer les opérations de sécurité |
| Security | Outil de sécurité Microsoft | Liste des outils de sécurité Microsoft et Azure |
| Security | Sécurité de la charge de travail | Conseils de charge de travail pour la sécurité |
| Gestion des ressources | Stratégie de nommage et d’étiquetage | Recommandations en matière de nommage et d’étiquetage pour gérer les ressources |
| Gestion des ressources | Abréviation Azure | Liste des abréviations pour les ressources Azure |
| Gestion des ressources | Azure Advisor | Assistant numérique pour s’aligner sur les meilleures pratiques Azure. |
| Gestion des ressources | Règles d’affectation de noms Azure | Règles d’affectation de noms pour toutes les ressources Azure |
| Gestion des ressources | Guides de service Azure | Conseils pour les décisions de configuration de service |
| Développement | Développement logiciel de charge de travail | Conseils sur la charge de travail pour le développement de logiciels |
| Développement | Centre des architectures Azure | Architectures et guides pour différents cas d’usage |
| Développement | Hub de ressources du développeur | Hub pour les outils et ressources de développement |
| Déploiement | Modèles Bicep, Terraform et ARM | Modèles IaC pour chaque ressource Azure |
| Déploiement | Paires de régions Azure | Liste des régions jumelées Azure |
| Déploiement | Répertoire des services cloud Azure | Répertoire de tous les services Azure |
| Déploiement | Déploiement de la charge de travail | Conseils sur la charge de travail pour l’intégration continue |
| Supervision | Surveiller votre patrimoine cloud Azure | Conseils complets sur la supervision Azure |
| Supervision | Supervision de la charge de travail | Conseils sur la charge de travail pour la surveillance |
| Coûts | Gérer les coûts | Conseils de gestion des coûts |
| Coûts | Optimisation des coûts de charge de travail | Conseils sur la charge de travail pour l’optimisation des coûts |
| Reliability | Gérer la fiabilité des données | Conseils pour maintenir la fiabilité des données |
| Reliability | Gérer la fiabilité des ressources cloud | Conseils pour maintenir la fiabilité des ressources |
| Reliability | Gérer les incidents de sécurité | Recommandations pour répondre aux incidents de sécurité |
| Performance | Efficacité des performances de la charge de travail | Conseils sur la charge de travail pour l’efficacité des performances |