이 체크리스트는 아키텍처 설계의 안정성, 탄력성 및 오류 복구 전략을 평가하는 데 사용할 수 있는 일련의 권장 사항을 제공합니다. 안정성을 보장하려면 워크로드에 가장 적합한 인프라 및 애플리케이션 설계를 식별하세요. 가용성 및 복구 가능성 목표 지표에 매핑된 비즈니스 요구 사항을 기반으로 이러한 결정을 내립니다.
안정적인 디자인을 구현하려면 디자인의 결정 사항을 철저히 고려하고 이러한 결정이 워크로드에 어떤 영향을 미치는지 파악해야 합니다. 이 체크리스트와 함께 제공되는 가이드는 그러한 결정을 내리는 데 도움이 되는 리소스를 제공합니다. 워크로드 설계, 개발, 운영 수명주기의 모든 단계에서 워크로드 안정성을 핵심 고려 사항으로 삼으세요.
검사 목록
탄력성 있고 관리 가능하며 반복 가능한 워크로드를 설계하는 데 도움이 되도록 안정성에 중점을 두고 설계에 접근하세요. 신뢰성 관행을 포함하지 않고 장단점을 고려한다면 설계가 잠재적으로 위험할 수 있습니다. 시스템 성공에 대한 확신을 심어주기 위해 체크리스트에 포함된 모든 사항을 주의 깊게 고려하세요.
| 코드 | 추천 | |
|---|---|---|
| ☐ | RE:01 | 업무량을 비즈니스 목표에 맞춰 설계하고 불필요한 복잡성이나 간접비를 피하세요. 실용적이고 균형 잡힌 접근 방식을 사용하여 원하는 결과를 제공하는 설계 결정을 내립니다. 비효율성과 잠재적인 문제를 줄이기 위해 설계에 필수 사항을 포함하십시오. |
| ☐ | RE:02 | 사용자 및 시스템 흐름을 식별하고 평가합니다. 비즈니스 요구 사항에 따라 중요도 척도를 사용하여 흐름의 우선 순위를 지정합니다. |
| ☐ | RE:03 | FMA(실패 모드 분석)를 사용하여 솔루션 구성 요소의 잠재적 오류를 식별하고 우선 순위를 지정합니다. FMA를 수행하면 각 실패 모드의 위험과 영향을 평가하는 데 도움이 됩니다. 워크로드가 어떻게 응답하고 복구하는지 결정합니다. |
| ☐ | RE:04 | 구성 요소, 흐름 및 전체 솔루션에 대한 안정성 및 복구 목표를 정의합니다. 이상적인 상태를 달성하기 위해 협상하고, 합의를 얻고, 기대치를 설정하고, 조치를 취하는 목표를 시각화합니다. 정의된 목표를 사용하여 상태 모델을 구축합니다. 상태 모델은 정상, 저하, 비정상 상태를 정의합니다. |
| ☐ |
RE:05 RE:05 |
오류 처리 및 일시적 오류 처리를 구현하여 작업 부하의 복원력을 강화하세요. 구성 요소 오류 및 일시적인 오류를 처리할 수 있는 기능을 솔루션에 구축합니다. |
| ☐ | RE:06 | 테스트 및 프로덕션 환경에 혼돈 엔지니어링의 원칙을 적용하여 복원력과 가용성 시나리오를 테스트하세요. 테스트를 통해 활성 오작동 및 시뮬레이션된 부하 테스트를 수행하여 정상적인 성능 저하 구현 전략이 효과적인지 확인하세요. |
| ☐ | RE:07 | 복구 목표에 맞춰 체계적이고, 테스트되고, 문서화된 비즈니스 연속성 및 재해 복구(BCDR) 계획을 구현합니다. 계획은 모든 구성요소와 시스템 전체를 포괄해야 합니다. |
| ☐ | RE:08 | 솔루션의 상태 지표를 측정하고 게시합니다. 워크로드 전체와 개별 구성 요소 및 주요 흐름에서 가동 시간 및 기타 안정성 데이터를 지속적으로 캡처합니다. |