事件的特性和生命週期
- 4 分鐘
如您在上一個單元中所瞭解, 事件 是影響客戶和終端用戶的服務中斷。 事件以多種形式出現,從讓使用者感到沮喪的效能變慢(「緩慢就等於停擺」),到讓服務或網站在一段時間內完全無法使用的系統當機。
事件的特性
事件通常是意外的,似乎發生在最糟糕的時間(如淩晨 2:00,或當您深深沉浸於重要專案時)。 這就是為什麼人們通常對事件感到害怕並加以避免,有時甚至會淡化事件的重要性。 組織中內部壓力通常會大到誘使人員對事件進行錯誤的標記,或因為害怕遭到斥責而使其無法報告中斷。
至少,事件會帶來臨時的工作,而由於您大部分時間都花在有計劃的工作上,且清楚知道自己應該做什麼,您可能會認為事件是壞事。 但是,仍然有另外一種檢視事件的方式:事件實際上是一種「投資」*,因為其可提供您正嘗試傳遞給終端使用者的價值。 無論事件的原因或影響程度為何,所有事件都有一個共同點:它們可以提供寶貴的學習經驗。
您應該將事件視為 系統的脈搏。 他們告訴你系統比你以前瞭解的更多, 知識是一件好事。 當您有強大的監視基礎,並深入了解系統中發生的事情時,它不可避免地會產生更多的警示和事件和響應機會。 至少,事件會告訴您發生了什麼事,進而提高作業意識。 在先前的監控課程模組中,我們建議這是可靠性工作的重要前提。
事件的生命週期
如果您想要將事件回應小組的狀態提升為「精英/高效能」,必須超越將服務中斷或事件視為簡單線性時間軸的想法,而應從循環的觀點來加以處理。
您可以將事件的生命週期分成若干明確的階段,這些階段會按照邏輯順序依次發生,最終再次回到起點。 每次您進入這個循環時 (而且會這樣做很多次),如果您正確處理它,就有可能會回到起點,對您的系統有更深入的了解。 透過某些刻意的工作,您也可以在下次事件發生時,更做好快速且有效的響應準備。
事件的階段
根據您使用的模型,事件回應程式的個別階段看起來稍有不同。 為了本模組的目的,回應事件時有五個階段:
- 偵測:此階段是此學習路徑中上一個課程模組的監視知識作用所在。 您的監視工具會從記錄收集資訊、根據您設定的客戶中心目標分析該資訊,並傳送可採取動作的警示,讓您知道需要人為介入。
- 回應:此階段是您和小組收到該警示之後所發生的情況。 我們將在此課程模組中詳細探討此階段,因此在短短的一刻內,將有更多關於這個想法的表達。
- 補救:此階段可讓您將系統還原為一般功能。 您這樣做的方式取決於服務中斷的原因。 儘快恢復服務並提供給您的客戶是您最重要的工作。 不過,一旦完成,您的工作就不會停止。
- 分析:若要從事件取得持久的價值,您需要從事件中學習。 在此階段,我們的任務是收集事件發生的詳細資訊及其時間,並透過詢問正確的問題來探究從中可以學到的教訓。 有一個關於學習失敗的整個課程模組,可解決此階段的問題。
- 整備程度:您應該將分析階段中學到的教訓納入您的作業實務。 如果有動作專案有助於防止未來發生類似的中斷,它們也會成為此階段的一部分。
建立事件回應計劃之前,您必須瞭解事件的特性和價值,並熟悉事件生命周期的階段。 下一個步驟是確保您的回應策略是以堅實的基礎為基礎。