Partager via


Liste de vérification de la révision de conception pour la fiabilité

Cette liste de contrôle présente un ensemble de recommandations à utiliser pour évaluer la fiabilité, la résilience et les stratégies de récupération des défaillances dans votre conception d’architecture. Pour garantir la fiabilité, identifiez la meilleure conception d’infrastructure et d’application pour votre charge de travail. Prenez ces décisions en fonction des besoins de votre entreprise mappés aux métriques cibles de disponibilité et de récupération.

Pour implémenter une conception fiable, prenez soigneusement en compte les points de décision de votre conception et sachez comment ces décisions affectent votre charge de travail. Cette liste de contrôle et les guides d’accompagnement fournissent des ressources pour vous aider à prendre ces décisions. Prenez en compte la fiabilité de la charge de travail tout au long du cycle de vie de conception, de développement et d’opération de la charge de travail.

Liste de contrôle

Approchez votre conception avec un focus sur la fiabilité pour vous assurer que vous concevez une charge de travail résiliente, gérable et reproductible. Si vous n’incluez pas de pratiques de fiabilité et que vous envisagez les compromis, votre conception est potentiellement à risque. Examinez soigneusement tous les points abordés dans la liste de contrôle pour donner confiance au succès de votre système.

  Code Recommandation
RE :01 Concentrez la conception de votre charge de travail sur la simplicité et l’efficacité. Utilisez une approche pratique pour éviter toute complexité inutile tout en répondant aux objectifs et exigences de votre entreprise.
RE :02 Identifier et évaluer les flux utilisateur et système. Utilisez une échelle de criticité en fonction des besoins de votre entreprise pour hiérarchiser les flux.
RE :03 Utilisez l’analyse du mode d’échec (FMA) pour identifier les défaillances potentielles dans votre charge de travail. Identifiez les dépendances et les points d’échec et développez des stratégies d’atténuation pour ces défaillances.
RE :04 Définissez des cibles de fiabilité et de récupération pour votre charge de travail. Utilisez les cibles pour informer votre conception et comme base de votre modèle d’intégrité.
RE :05 Ajouter une redondance à différents niveaux, en particulier pour les flux critiques, pour vous aider à répondre à vos objectifs de fiabilité. Envisagez les composants d’infrastructure redondants tels que le calcul et le réseau, ainsi que plusieurs instances de votre solution.
RE :06 Implémentez une stratégie de mise à l’échelle rapide et fiable au niveau de l’application, des données et de l’infrastructure. Basez la stratégie de mise à l’échelle sur des modèles d’utilisation réels ou prédits et réduisez l’intervention manuelle.
RE :07 Renforcez la résilience de votre charge de travail en implémentant des mesures d’auto-préservation et d’auto-guérison. Utilisez des fonctionnalités intégrées et des modèles cloud bien établis pour aider votre charge de travail à rester fonctionnelle pendant et à récupérer des incidents.
RE :08 Testez la résilience et les scénarios de disponibilité en appliquant les principes de l’ingénierie du chaos. Assurez-vous que vos stratégies de mise à l’échelle et d’implémentation de dégradation normale sont efficaces en effectuant un dysfonctionnement actif et des tests de charge simulés.
RE :09 Implémentez des plans de récupération d’urgence structurés, testés et documentés qui s’alignent sur les cibles de récupération. Les plans doivent couvrir tous les composants et le système dans son ensemble.
RE :10 Mesurez et modélisez les signaux d’intégrité de la solution. Capturez en continu les données de disponibilité et d’autres données de fiabilité sur l’ensemble de la charge de travail, ainsi que sur les composants individuels et les flux clés.

Étapes suivantes

Nous vous recommandons de passer en revue les compromis de fiabilité pour explorer d’autres concepts.