클러스터 상태를 모니터링하고 유지 관리하는 주요 단계는 정상적인 작동 상태 또는 성능의 편차를 식별하는 것입니다. HPC 클러스터 관리자를 사용하면 클러스터 및 노드 상태를 한눈에 보고, 문제 노드를 식별하고, 추가 조사를 위해 노드 세부 정보로 드릴다운할 수 있습니다.
이 주제에서는:
클러스터 상태를 한눈에 보기
노드 관리에서 노드목록 보기 또는 노드 열 지도 보기를 사용하여 클러스터를 한눈에 모니터링할 수 있습니다. 차트 및 보고서에서 모니터링 차트는 노드 상태 및 클러스터 사용률에 대한 현재 및 최근 데이터를 표시합니다. 자세한 내용은 다음을 참조하세요.
개별 노드 세부 정보로 드릴다운
목록 및 열 지도 보기는 문제 영역을 식별하기 위한 시작점을 제공합니다. 컴퓨팅 노드를 두 번 클릭하여 하드웨어, 운영 체제 속성 및 현재 성능 메트릭과 같은 자세한 정보를 확인합니다. 하나 이상의 노드를 선택한 다음 노드 세부 정보로 드릴다운하여 성능을 조사할 수도 있습니다.
진단 테스트 및 보고서 실행: 하나 이상의 컴퓨팅 노드에서 진단 테스트를 실행합니다.
성능 차트 보기: 시간에 따른 컴퓨팅 노드의 성능 메트릭 차트를 봅니다.
노드 이벤트 보기: 특정 컴퓨팅 노드에서 HPC 서비스에서 생성된 이벤트를 봅니다.
HPC 클러스터 관리자에서 노드에 대한 원격 데스크톱 연결을 엽니다. 하나 이상의 컴퓨팅 노드에 대한 원격 데스크톱 세션을 엽니다.
노드 작업 모니터링
최근 또는 진행 중인 클러스터 작업을 추적하는 것은 클러스터를 관리하는 데 중요한 또 다른 모니터링 측면입니다. 자세한 내용은 다음을 참조하세요.
노드, 작업, 작업 및 진단 간의 모니터링 정보 상관 관계 지정
HPC 작업 관리자에서 피벗 To 작업을 사용하여 노드, 작업, 작업 및 진단 간에 모니터링 정보를 상호 연결할 수 있습니다. 예를 들어 보기 창에서 하나 이상의 노드를 선택한 다음 선택한 노드에 대한 작업으로 피벗할 수 있습니다. 그러면 선택한 노드로 필터링된 작업 목록 보기로 이동합니다.
지원되는 피벗 경로는 다음과 같습니다.
노드: 작업, 테스트 결과 및 작업에 피벗합니다.
작업: 노드에 피벗합니다.
테스트 결과: 실패한 노드 및 작업으로 피벗합니다.
시간에 따른 클러스터 사용량 및 통계 모니터링
HPC 클러스터 관리자는 시간에 따른 클러스터 리소스 사용량 및 작업 및 노드 통계를 모니터링하고 분석하는 몇 가지 기본 제공 차트 및 보고서를 제공합니다. HPCReporting 데이터베이스는 사용자 지정 보고도 지원합니다. 자세한 내용은 차트 및 보고서: HPC 클러스터 관리자를 참조하세요.