피해야 할 일반적인 트랩
- 7분
인시던트 후 검토 프로세스를 시작하는 데 도움이 되도록 논의한 로드맵은 도움이 되지만 이 여정에서 발생할 수 있는 몇 가지 장애물에 대해 아는 것도 유용할 수 있습니다.
이 단원에서는 인시던트 후 검토 프로세스 중에 다른 사용자가 발생한 몇 가지 일반적인 트랩과 이를 방지하는 방법에 대해 알아봅니다.
트랩 1: "사람의 실수"에 대한 특성
"파일럿 오류"("인간의 오류"라고도 함)는 모듈 소개에서 시작한 B-17 이야기에서 초기 조사자가 도달한 결론이었습니다. 그 이야기로 돌아가봅시다.
그 소개에서, 우리는 도달 결론이 당신에게 불만 될 수 있음을 제안했다. 그들은 미국 공군이 이 사건을 조사해 달라는 요청을 받은 군사 심리학자 알폰스 차파니스에게 확실히 불만을 품고 있었다. 그는 무엇보다도 이러한 사고가 B- 17 및 소량의 다른 항공기에 고유하다는 것을 발견했습니다. 서유럽에서 동시에 수천 대의 C-47 수송기가 사용되었지만 C-47은 비슷한 사건을 경험한 적이 없었습니다.
그래서 그는 조종사들을 인터뷰했고, 그들로부터 들은 내용을 바탕으로 B-17 조종석을 보았습니다. 기어 스위치와 플랩 스위치라는 두 개의 스위치가 있었습니다. 스위치는 조종석에서 서로 약 3 인치 떨어져 있었다. 그들의 작업 모드는 동일했습니다. 그들은 단순히 서로 혼동하기에는 너무 쉬웠고, 이것이 이 사건에서 일어난 일입니다. 방금 비행기에 착륙했다면 플랩이 확장될 것이고, 주차하기 전에 플랩을 철회할 것입니다. 그래서 차파니스는 뭔가 다른 것을 시도했다.
그는 기어 스위치에 약간의 고무 휠을 붙이고 플랩 스위치에 단단한 각도의 "플랩"을 붙이고 사고가 멈추었을 만큼 충분히 확신했습니다.
그는 현재 인체공학 분야의 창립자 중 한 명으로 알려져 있으며, 인간 성능의 디자인 요인에 대한 연구를 통해 조종석 설계가 인간의 오류 가능성에 영향을 줄 수 있다는 간단한 관찰을 했습니다. 이 접근 방식은 모든 현대 항공기의 디자인을 알리기 위해 계속되었습니다. 현재 비행기의 두 스위치는 이제 미국의 연방 법률에 의해 위임 된 바와 같이, 매우 구별된다.
그래서, 왜 우리는 당신에게이 이야기를 했습니까?
인간은 실수를 합니다. 그러나 사람의 실수 는 원인이 아닙니다. 증상입니다. 인적 오류가 실패의 원인으로 간주되는 경우 사람들은 인시던트를 추가로 분석하는 대신 중지합니다.
시스템 디자인, 조직 컨텍스트 및 개인 컨텍스트는 모두 사람들이 실수를 할 때, 어떻게, 어떤 영향을 미치는지에 영향을 미칩니다. "사용자 오류"는 시스템에 대해 흥미로운 것을 발견하려는 순간에 조사를 종료하게 하는 레이블입니다.
수사에서 "인간의 오류"결론의 문제는 인간이 그 시간에 그들에게 의미가 있었다는 사실을 시력을 잃게한다는 것입니다. 정의상 실수는 의도적인 것이 아니므로 실수를 할 의도가 없었습니다.
"인간의 실수"를 보거나 들을 때, 그것은 우리가 더 깊이 보아야 한다는 신호입니다. 우리가 배우고 싶다면, 우리는 우리가 너무 자주하는 것처럼, 우리가 인간의 오류를 찾을 때 조사를 중지해서는 안됩니다. B-17s의 이야기에서 알 수 있듯이, 인간의 실수를 넘어 우리가 시스템에 대해 흥미로운 것들을 배우는 곳입니다.
트랩 2: 상반된 추론
반면은 "사실에 반하는"을 의미하며 , 반면적 추론 은 일어난 사건을 설명하기 위해 일어나지 않은 사건에 대한 이야기를 말하는 것을 의미합니다. 사람들이 항상 그렇게 하는 경향이 있더라도 이것은 별로 의미가 없습니다.
핵심 구를 사용하여 반시계 문을 식별할 수 있습니다.
- 가질 수 있음
- 있어야 합니다.
- 가 있을 것
- 실패
- 하지 않았다
- 만인 경우
인시던트 후 검토와 관련된 반대 진술의 몇 가지 예:
"모니터링 시스템에서 문제를 감지하지 못했습니다."
"엔지니어가 구성을 적용하기 전에 구성의 유효성을 확인하지 않았습니다."
"이것은 카나리아 환경에서 포착되었을 수 있습니다."
인시던트 후 검토에서 이러한 유형의 추론의 문제는 어떤 일이 일어났는지 이해하는 데 시간을 할애하는 대신 일어나지 않은 일에 대해 이야기하고 있다는 것입니다. 당신은이 추측에서 아무것도 배울 수 없습니다.
트랩 3: 표준 언어
규범적 언어 는 종종 연산자가 취해야 할 "분명히 올바른" 작업 과정이 있음을 의미하며, 뒤늦게 그 연산자의 행동을 판단합니다.
규범적 언어는 일반적으로 "부적절하게", "부주의하게", "서둘러"와 같은 부사로 식별될 수 있습니다.
규범적 사고는 결과에 따라 결정을 판단하도록 유도합니다. 결과가 결정과 판단을 내린 사람들에게 제공되지 않은 유일한 정보 이기 때문에 이러한 말하기 방식은 논리적이지 않습니다.
표준 언어는 반대의 의미로도 사용할 수 있습니다. 예를 들어 사람들은 연산자가 "적절하게" 행동한 것에 대해 칭찬할 수 있습니다. 그러나 다시 말하지만, 종종이 판단은 문제의 사람들이 가지고 있지 않은 정보의 혜택으로 이루어집니다.
규범적 언어의 문제는 반인상적 추론의 문제와 유사합니다: 사고 당시 관련자가 사용할 수 없었던 정보를 사용한 사실 이후에 판단을 내린다면, 우리는 운영자의 행동이 당시 그들에게 어떻게 이해되었는지 이해하지 못합니다.
트랩 4: 기계적 추론
기계적 추론 은 특정 결과가 개입으로부터 유추될 수 있다는 개념을 가리킵니다. 그것은 때때로 전제에 따라 (제시카 DeVita에 의해 만들어진) 메들링 아이 증후군 이라고 "우리의 시스템은 잘 작동했을 것이다 ... 만약 그 아이들을 위한 것이 아니었다면."
인시던트 후 검토에서 기계적 추론을 사용할 때, 함께 작업하는 시스템과 내부 시스템이 기본적으로 제대로 작동하고 있다는 오류에 대한 결론을 내릴 수 있으며, "meddling kids"만 그들이 한 일을 하지 않았다면 실패가 발생하지 않았을 것입니다.
그러나 시스템이 작동하는 방식은 아닙니다.
이 점을 설명하기 위해 프로덕션 서비스에서 작업하는 시나리오를 상상해 보세요. 이제 해당 서비스를 터치하거나 수행할 수 없다는 말을 들었습니다. 팀 외부의 모든 작업은 이전과 같이 계속됩니다. 고객은 계속해서 서비스를 사용하고, 외부 종속성은 계속 변경되며, 인터넷은 정상적으로 작동합니다.
하지만 코드 또는 구성을 변경할 수는 없습니다. 배포, 컨트롤 플레인 작업, 아무것도 없습니다.
하루 후에도 서비스가 예상대로 실행될 것이라고 생각하십니까? 일주일 후? 한 달 후? 1 년 후? 인간의 개입 없이 서비스가 계속 실행되기를 현실적으로 얼마나 오래 기대할 수 있습니까? 대부분의 경우 그렇지 않습니다.
이 생각 운동은 중요한 결론으로 우리를 이끈다:
시스템을 가동하고 실행하려면 인적 적응 용량이 필요합니다.
시스템이 처음에 계속 가동되고 실행되는 유일한 이유는 제어 루프에서 사람의 작업 때문입니다. 그것은 단지 인간의 행동과 시스템이 계속 작동하는 변화하는 상황에 적응하는 능력을 통해서만 가능합니다.
따라서 시스템이 "기본적으로 작동 중"이라고 결론을 내리는 것은 잘못된 일입니다. 만약 그 아이들을 위한 것이 아니었다면." 실제로 서비스의 안정성은 서비스 작업을 하는 사람과 독립적이지 않습니다. 대신, 그것은 인간이 매일 그것에 할 작업의 직접적인 결과.
기계적 추론의 문제는 결함이 있는 인간을 찾는 것이 문제를 찾는 것과 같다고 믿는 길을 따라 내려갈 수 있다는 것입니다. 그러나, 그 같은 결함이 있는 인간 즉흥 하 고 주 및 개월 동안 실행 하는 시스템을 유지 하기 위해 적응 하고있다. 아마도 이 역할은 인시던트 후 검토에 반영할 만큼 중요합니다.
인시던트 후 검토 중에 피해야 할 몇 가지 사항을 알게 되었으므로 다음 단원으로 이동하여 해당 검토에 대한 몇 가지 유용한 사례를 살펴볼 수 있습니다.