Resumen
En este módulo, hemos analizado la revisión posterior al incidente en profundidad. Esta es una de nuestras herramientas más eficaces para convertir los incidentes que todos experimentamos en el combustible para mejorar nuestras prácticas operativas. Es una parte clave del aumento de nuestra confiabilidad.
Hemos explorado algunos de los aspectos de los sistemas complejos que hacen inevitables incidentes. Dada esta inebilidad, tiene sentido centrarse no solo en intentar evitar una catástrofe, sino también en cómo podemos responder a una. Nos ofrece un incentivo para encontrar y usar herramientas que pueden ayudar a mejorar esa respuesta como parte de la fase de análisis en el ciclo de vida de los incidentes.
Aquí es donde entra en juego la revisión posterior al incidente. Después de comprender bien qué es (y qué no es) una revisión posterior al incidente, además de su propósito, nos aseguramos de explorar las características y componentes necesarios para que sea eficaz.
A continuación, se ha descrito el proceso y cómo empezar a usar las herramientas disponibles en Azure.
Para mejorar las posibilidades de éxito, hemos explorado cómo evitar las trampas comunes en las que las personas entran al ejecutar revisiones posteriores a incidentes y algunos procedimientos recomendados que puede usar para ayudar a que las revisiones posteriores al incidente sean un éxito rotundo.