인시던트 대응의 기초
- 6분
오늘날 조직은 클라우드의 접근성, 효율성 및 편의성을 활용하지만 비즈니스의 일부를 클라우드 서비스로 이동하는 디지털 변환을 거치면서 많은 과제에 직면해 있습니다.
조직에서 발생할 수 있는 일반적인 문제 중 일부는 다음과 같습니다.
- 서비스 중단 횟수 증가
- 인시던트를 추적하고 대응하는 효과적인 방법 없음(모든 것이 임시 및 반응)
- 허용할 수 없는 해결 시간
- 해결 시간이 개선되지 않거나 악화되고 있습니다.
- 정보 및 상태를 찾기가 어렵습니다.
- 동일한 문제 및 실수 되풀이
이러한 문제를 해결하려면 견고한 기반을 기반으로 하는 잘 정의된 인시던트 대응 계획이 필요합니다.
기초 및 기둥
기초의 목적은 위의 구조를 지탱하고 함께 단단히 결합시키는 것입니다. 이 학습 경로에 대한 별도의 소개 모듈에서는 안정성 작업이 기본 모니터링 수준을 기반으로 하며 인시던트 대응이 계층 구조의 바로 위에 있다는 생각에 대해 설명했습니다.
인시던트 대응에도 기반이 있습니다. 좋은 인시던트 대응 계획을 지원하는 세 가지 핵심 요소가 있습니다.
- 명단
- 역할
- 회전
이 단원에서는 이러한 각 핵심 요소가 무엇이며 안정성 목표를 향해 더 나아가는 인시던트 대응 전략을 설계하는 데 어떤 역할을 하는지 알아보세요.
명단
좋은 계획을 세우는 것이 중요하지만, 계획을 실행하는 사람이 없으면 쓸모가 없습니다. 따라서 가장 좋은 시작 장소는 문제에 응답할 것으로 예상되는 사용자와 응답이 필요한 시기를 알려주는 방법을 결정하는 것입니다.
이 문제를 해결하는 가장 좋은 방법은 명단을 디자인하는 것입니다. 명단은 대기 팀에 배정된 사람들의 목록입니다. 이 팀은 여러 엔지니어로 구성되어야 합니다. 이러한 팀 구성원은 사용자 환경에서 발생할 수 있는 문제 유형과 인시던트 대응 교육을 해결하기 위한 지식과 기술을 가지고 있어야 합니다.
그러나 이름 목록만으로는 충분하지 않습니다. 특정 시점에 통화 중인 사용자와 각 사용자가 수행할 작업을 중심으로 프레임워크를 빌드해야 합니다. 이것이 바로 역할이 들어오는 곳입니다.
역할
역할을 활용하면 혼란스럽거나 기껏해야 임시적인 대응에서 질서가 잡힙니다. 이 작업은 특정 상황에서 각 사용자가 가정할 특정 함수와 "명령 체인"에 있는 각 사용자의 위치를 정의하여 수행합니다. 역할은 조직 또는 인시던트 유형에 따라 다를 수 있지만 일반적으로 다음 역할은 조직된 인시던트 대응 팀의 일부여야 합니다.
- 기본 응답자: 이것은 일반적으로 현장에서 첫 번째 사람인 "지점 사람"입니다. 즉, 인시던트가 발생할 때 호출되는 첫 번째 대기 엔지니어입니다.
- 보조 응답자: 백업 역할을 하며 기본 응답자를 사용할 수 없거나 두 번째 눈이 필요한 경우 개입할 수 있는 사람입니다.
- 주제 전문가(SMEs): 이들은 운영의 특정 측면에 대한 심층적인 지식을 가진 사람들입니다. 기본 및 부차적 응답자가 문제를 더 많은 전문 지식을 가진 사람에게 전달해야 할 경우 그들이 준비되어 있습니다. 항상 통화하지는 않지만 전문 기술이 필요할 때 사용할 수 있습니다. 다양한 주제(예: 데이터베이스, 프런트 엔드, 네트워크 인프라, 웹앱, 사이버 보안 등)에서 중소기업 목록을 유지 관리해야 합니다.
- 인시던트 사령관: 이것은 다양한 구성 요소에 영향을 미치거나 다양한 팀과 시스템에 대한 조정이 필요한 대규모 인시던트 또는 중단에서 중요한 역할입니다. 인시던트 사령관은 많은 대화와 대응 및 수정 활동에 대한 노력을 조정하는 사람이 될 것입니다. 인시던트 사령관은 "큰 그림"을 주시합니다. 그들은 무슨 일이 일어나고 누가 무엇을 하고 있는지 모니터링합니다. 인시던트는 책임자는 엔지니어가 다른 사람의 작업을 간섭하거나 망치지 않고 자신의 수정 작업에 집중해서 계속하도록 하는 데 중요한 역할을 합니다.
- Scribe: 서기관의 역할은 사건에 대한 대화를 가능한 한 자세하게 문서화하는 것입니다. Teams는 일반적으로 전화 브리지, 전화 회의 또는 화상 채팅을 사용하여 모든 사람을 한데 모으고 무슨 일이 일어나고 있는지 이해하려고 노력합니다. 이는 대화 공간을 만드는 데 확실히 도움이 될 수 있습니다. 저희가 엔지니어가 말하고 행동한 것을 자세히 이해하고 파악하기는, 전사되지 않는 한 어려운 일입니다. 결과적으로, 서기관은 나중에 검토할 수 있도록 가능한 한 많이 문서화하는 데 도움을 줄 수 있는 사람입니다. 서기관은 가능한 모든 데이터를 캡처합니다. 팀 구성원이 하는 일뿐만 아니라 그들이 말하는 내용과 느낌이나 경험도 있습니다.
- 커뮤니케이션 코디네이터: 이 사람을 이 사건의 "홍보 관리자"라고 생각합니다. 커뮤니케이션 코디네이터는 인시던트 사령관과 협력하여 인시던트에 대한 정보를 적극적으로 처리하고 복구하는 데 참여하지 않은 사람들과 공유합니다. 여기에는 고객, 영업 및 마케팅 팀, 고객 지원, 그리고 진행 상황과 대응 및 수정 조치의 상태에 대해 인지해야 하는 조직 내부 또는 외부의 다른 이해 관계자가 포함될 수 있습니다.
회전
이제 응답 팀 직원의 명단이 있고 적절한 역할을 할당했습니다. 다음의 마지막 단계는 대기 중인 각 사람의 교대 근무를 할당하는 일정인 교대를 만드는 것입니다.
교대 근무를 나누는 방법에는 여러 가지가 있습니다. 시프트 일정은 복잡한 전략적 프로세스가 될 수 있습니다. 교대 근무는 임의로 할당해서는 안 됩니다. 가능한 한 팀 구성원에게 효과적이고 즐거운 일정으로 만들기 위해 일정 예약에 몇 가지 생각을 넣어야 합니다.
교대 근무를 예약하는 몇 가지 방법은 다음과 같습니다.
- 24 x 7: 팀 구성원이 며칠 연속으로 호출되는 회전입니다. 이는 교대 근무 범위를 할당하는 간단한 방법이지만 기간을 제한해야 합니다. 3~4일 이상 시프트 회전은 엔지니어링 직원의 전반적인 상태에 해가 될 수 있으므로 전체 시스템의 안정성을 저하시킬 수 있습니다.
- 태양을 따라가는 근무 모델: 엔지니어가 정상적인 근무 시간 동안에만 온콜 근무를 배치하고, 근무일이 끝날 때 다른 시간대에 있는 동료에게 온콜 책임을 전달하는 교대 근무 방식입니다.
다음은 교대 근무를 할당할 수 있는 몇 가지 예에 불과합니다. 중요한 점은 응답 팀의 개인에게 가장 적합한 방식으로 교대 근무를 나누는 것입니다. 엔지니어에게 더 많은 유연성이 필요한 경우 특히 주말에 교대 근무를 사용자 지정하는 여러 가지 방법이 있습니다. 엔지니어는 업무와 관련이 없는 충돌이 발생할 때 다른 사람에게 역할을 쉽게 넘겨줄 수 있어야 합니다.