概要

完了

誰もがインシデントを持っています。 基本的に任意のサイズのシステムを実行すると、ある時点で障害が発生し、停止します。 これは単なる事実です。 これが、 インシデント対応 がディッカーソンの信頼性階層の 2 番目のレベルである理由です。これは、監視の直後です。

質問は次のようになります: あなたはそれらの瞬間にどのように反応しますか? 設定された計画またはプロセスを使用して緊急性を持って対応しますか、それともアドホックな反応がありますか? 私たちは、回復時間が高パフォーマンスの組織の指標の1つであるという分野の良い研究から知っています。 この復旧期間を短縮するために、インシデント対応のための適切なプロセスが不可欠です。

このモジュールでは、インシデントのステージを見て、各ステージのインシデント対応計画の主要なコンポーネントをいくつか調べてきました。 インシデントを適切に追跡できることの重要性と、Azure が提供するツールを使用してそのプロセスを自動化する方法について説明しました。 また、インシデント発生時のコミュニケーションの重要な側面についても確認しました。 最後に、インシデントの修復中に組織の効率を高めるのに役立つ、Azure で提供されるツールの一部について説明しました。