Résumé
Dans ce module, nous avons discuté en profondeur de l’examen post-incident. C’est l’un de nos outils les plus puissants pour transformer les incidents que nous vivons tous en carburant pour améliorer nos pratiques opérationnelles. C’est un élément clé de l’augmentation de notre fiabilité.
Nous avons exploré certains des aspects des systèmes complexes qui rendent inévitables les incidents. Compte tenu de cette inévitabilité, il est judicieux de se concentrer non seulement sur la tentative d’éviter une catastrophe, mais aussi sur la façon dont nous pouvons y répondre. Il nous donne une incitation à trouver et à utiliser des outils qui peuvent aider à améliorer cette réponse dans le cadre de la phase d’analyse du cycle de vie des incidents.
C’est là que l’examen post-incident entre en jeu. Après avoir acquis une bonne compréhension de ce qu'est (et n'est pas) une révision post-incident et de son objectif, nous avons veillé à explorer les caractéristiques et les composants nécessaires à son efficacité.
Ensuite, nous avons discuté du processus et comment commencer à utiliser des outils disponibles dans Azure.
Pour améliorer les chances de réussite, nous avons ensuite exploré comment éviter les pièges courants que les gens tombent lors de l’exécution de révisions post-incidents, et certaines bonnes pratiques que vous pouvez utiliser pour aider à rendre vos révisions post-incidents une réussite retentissante.