Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Ein wichtiger Schritt bei der Überwachung und Aufrechterhaltung der Clusterintegrität besteht darin, abweichungen vom normalen Betriebszustand oder der Normalenleistung zu identifizieren. MIT HPC Cluster Manager können Sie den Cluster- und Knotenstatus auf einen Blick anzeigen, Problemknoten identifizieren und einen Drilldown zu Knotendetails zur weiteren Untersuchung ausführen.
Inhalt dieses Themas:
Korrelieren der Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen
Überwachen der Clusternutzung und -statistiken im Laufe der Zeit
Anzeigen des Clusterstatus auf einen Blick
In der Knotenverwaltung können Sie Ihren Cluster auf einen Blick mithilfe der Knotenlistenansicht oder der Wärmebildansicht des Knotens überwachen. In Diagrammen und Berichten zeigen die Überwachungsdiagramme aktuelle und aktuelle Daten zur Knotenintegrität und Clusternutzung an. Weitere Informationen finden Sie unter:
Drilldown zu einzelnen Knotendetails
Die Listen- und Wärmebildansichten bieten einen Ausgangspunkt für die Identifizierung von Problembereichen. Doppelklicken Sie auf einen Computeknoten, um detaillierte Informationen wie Hardware, Betriebssystemeigenschaften und aktuelle Leistungsmetriken anzuzeigen. Sie können auch einen oder mehrere Knoten auswählen und dann einen Drilldown in die Knotendetails ausführen, um die Leistung zu untersuchen.
Führen Sie Diagnosetests und Berichte aus: Führen Sie Diagnosetests auf einem oder mehreren Computeknoten aus.
Leistungsdiagramme anzeigen: Anzeigen eines Diagramms der Leistungsmetriken für einen Computeknoten im Laufe der Zeit.
Anzeigen von Knotenereignissen: Anzeigen von Ereignissen, die von HPC-Diensten auf einem bestimmten Computeknoten generiert wurden.
Öffnen Sie eine Remotedesktopverbindung mit Ihren Knoten vom HPC Cluster Manager: Öffnen Sie eine Remotedesktopsitzung auf mindestens einen Computeknoten.
Überwachen von Knotenvorgängen
Das Nachverfolgen neuer oder fortlaufender Clustervorgänge ist ein weiterer Überwachungsaspekt, der für die Verwaltung eines Clusters von entscheidender Bedeutung ist. Weitere Informationen finden Sie unter:
Korrelieren der Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen
Im HPC-Auftrags-Manager können Sie die Pivot To-Aktionen verwenden, um die Überwachungsinformationen zwischen Knoten, Aufträgen, Vorgängen und Diagnosen zu korrelieren. Sie können beispielsweise einen oder mehrere Knoten im Ansichtsbereich auswählen und dann zu den Aufträgen für die ausgewählten Knoten pivotieren. Dadurch gelangen Sie zu einer Auftragslistenansicht, die nach den von Ihnen ausgewählten Knoten gefiltert wird.
Die unterstützten Pivotpfade sind:
Knoten: Pivot to jobs, test results, and operations.
Aufträge: Pivot zu Knoten.
Testergebnisse: Pivot zu fehlgeschlagenen Knoten und Vorgängen.
Überwachen der Clusternutzung und -statistiken im Laufe der Zeit
HPC Cluster Manager bietet mehrere integrierte Diagramme und Berichte zum Überwachen und Analysieren von Clusterressourcennutzung und Auftrags- und Knotenstatistiken im Laufe der Zeit. Die HPCReporting-Datenbank unterstützt auch benutzerdefinierte Berichte. Weitere Informationen finden Sie unter Diagramme und Berichte: HPC Cluster Manager.