Resumo

Concluído

Neste módulo, discutimos detalhadamente a revisão pós-incidente. Esta é uma de nossas ferramentas mais poderosas para transformar os incidentes que todos experimentamos no combustível para nivelar nossa prática de operações. É uma parte fundamental para aumentar nossa confiabilidade.

Exploramos alguns dos aspectos de sistemas complexos que tornam os incidentes inevitáveis. Dada essa inevitabilidade, faz sentido focar não apenas na tentativa de evitar uma catástrofe, mas também em como podemos responder a uma. Ele nos dá um incentivo para encontrar e usar ferramentas que podem ajudar a melhorar essa resposta como parte da fase de análise no ciclo de vida de incidentes.

É aqui que a revisão pós-incidente entra em jogo. Depois de ter uma boa noção do que é uma revisão pós-incidente (e não é) e sua finalidade, nos certificamos de explorar as características e componentes necessários para torná-la eficaz.

Em seguida, veio uma discussão sobre o processo e como começar a usar as ferramentas disponíveis no Azure.

Para melhorar as chances de sucesso, então exploramos como evitar as armadilhas comuns em que as pessoas se enquadram ao executar revisões pós-incidente, e algumas boas práticas que você pode usar para ajudar a tornar suas revisões pós-incidente um sucesso retumbante.