Freigeben über


Azure Operator Nexus Observability

Das Operator Nexus Observability Framework bietet operative Einblicke in Ihre lokalen Instanzen. Das Framework unterstützt Protokollierung, Überwachung und Warnung (LMA), Analysen und Visualisierung von Betriebsdaten (Plattform- und Workloads)-Daten und -Metriken.

Screenshot des Operator Nexus Logging-, Monitoring- und Alerting-Frameworks (LMA).

Abbildung: Operator Nexus Logging, Monitoring and Alerting (LMA) Framework

Die wichtigsten Highlights des Operator Nexus Observability Frameworks sind:

  • Zentrale Datenerfassung: Die Observability-Lösung operator Nexus basiert auf einer Sammlung aller Daten an einem zentralen Ort. An dieser Stelle können Sie die Überwachungsdaten aller lokalen Instanzen beobachten.
  • Gut definierte und getestete Tools: Die Lösung basiert auf Azure Monitor, der Telemetriedaten aus Ihrer Cloud und lokalen Instanzen sammelt, analysiert und verarbeitet.
  • Einfach zu erlernen und zu verwenden: Die Lösung erleichtert es Ihnen, Probleme zu analysieren und zu debuggen, mit der Möglichkeit, die Daten innerhalb oder über alle Ihre Cloud- und lokalen Instanzen hinweg zu durchsuchen.
  • Visualisierungstools: Sie erstellen angepasste Dashboards und Arbeitsmappen nach Ihren Anforderungen.
  • Integrierte Warnungstools: Sie erstellen Warnungen basierend auf benutzerdefinierten Schwellenwerten. Sie können Warnungsvorlagen für alle Ihre Instanzen erstellen und wiederverwenden.

Dieser Artikel hilft Ihnen, das Observability-Framework von Operator Nexus zu verstehen, das aus einem Stapel von Komponenten besteht:

  • Azure Monitor sammelt und aggregiert Protokollierungsdaten aus den Operator Nexus-Komponenten
  • Azure Log Analytics Workspace (LAW) sammelt und aggregiert Protokollierungsdaten aus mehreren Azure-Abonnements und -Mandanten.
  • Analysen, Visualisierungen und Warnungen werden für die aggregierten Protokolldaten ausgeführt.

Plattformüberwachung

Operator Nexus bietet Ihnen Einblicke in die Leistung Ihrer Bereitstellungen, die aus Infrastrukturressourcen bestehen. Sie benötigen die Protokolle und Metriken, die aus diesen Plattformressourcen gesammelt und analysiert werden sollen. Sie erhalten wertvolle Erkenntnisse aus der zentralisierten Sammlung und Aggregation von Daten aus allen Quellen im Vergleich zu disaggregatierten Daten.

Diese Protokolle und Metriken werden verwendet, um den Status der Plattform zu beobachten. Sie können die Leistung sehen und analysieren, was falsch ist. Sie können analysieren, was die Situation verursacht hat. Die Visualisierung hilft Ihnen beim Konfigurieren der erforderlichen Warnungen und unter welchen Bedingungen. Sie können z. B. die Warnungen so konfigurieren, dass sie generiert werden, wenn Ressourcen ungewöhnliches Verhalten zeigen oder wenn Schwellenwerte erreicht werden. Sie können die gesammelten Protokolle und Analysen verwenden, um Probleme in der Umgebung zu debuggen.

Überwachen von Daten

Operator Nexus Observability ermöglicht es Ihnen, dieselbe Art von Daten wie andere Azure-Ressourcen zu sammeln. Die von den einzelnen Instanzen gesammelten Daten können in Ihrem GESETZ angezeigt werden.

Hier erfahren Sie mehr über die Überwachung von Azure-Ressourcen.

Sammlung und Routing

Operator Nexus Observability ermöglicht es Ihnen, Daten für jede Infrastrukturressource zu sammeln. Der Satz von Infrastrukturkomponenten umfasst:

  • Netzwerkstruktur, die CEs, TORs, NPBs, Management-Switches und den Terminalserver enthält.
  • Rechenkapazität, die Bare-Metal-Server umfasst.
  • Undercloud Control Plane (Kubernetes-Cluster, der für die Bereitstellung und verwaltung des Lebenszyklus der gesamten Plattform verantwortlich ist).

Die Erfassung von Protokolldaten aus diesen Ebenen ist bei der Erstellung Ihrer Operator Nexus-Instanz standardmäßig aktiviert. Diese gesammelten Protokolle werden an Ihren Azure Monitor LAW weitergeleitet.

Sie können auch Daten aus den Mandantenebenen sammeln, die für die Ausführung von containerisierten und virtualisierten Netzwerkfunktionen erstellt wurden. Die Protokolldaten, die gesammelt werden können, umfassen:

  • Sammlung von Syslog von virtuellen Maschinen (verwendet für VNFs oder CNF-Workloads).
  • Sammlung von Protokollen aus Kubernetes-Clustern und den darauf bereitgestellten Anwendungen.

Sie müssen die Sammlung der Protokolle aus den Kubernetes-Mandantenclustern und virtuellen Computern aktivieren. Führen Sie die Schritte zur Bereitstellung der Azure-Überwachungsagents aus. Die Daten werden in Ihrem Azure LAW erfasst.

Operator Nexus Protokolldateispeicher

Daten in Azure Monitor-Protokollen werden in Tabellen gespeichert, wobei jede Tabelle ihren eigenen Satz an eindeutigen Eigenschaften hat.

Alle Ressourcenprotokolle in Azure Monitor weisen dieselben Felder auf, gefolgt von dienstspezifischen Feldern; siehe das allgemeine Schema.

Die Protokolle der Operator Nexus-Plattform werden in den folgenden Tabellen gespeichert:

Table Description
Syslog Syslog-Ereignisse auf Linux-Computern mit dem Log Analytics-Agent
ContainerInventory Details und aktueller Status der einzelnen Container.
ContainerLog Protokollzeilen, die aus den stdout- und stderr-Streams von Containern gesammelt wurden
Container-Knoten-Inventar Details zu Knoten, die als Containerhosts dienen.
InsightMetrics Metriken, die von Server, K8s, Containern gesammelt werden.
KubeEvents Kubernetes-Ereignisse und deren Eigenschaften.
KubeMonAgentEvents Ereignisse, die vom Azure Monitor Kubernetes-Agent für Fehler und Warnungen protokolliert werden.
KubeNodeInventory Details zu Knoten, die Teil des Kubernetes-Clusters sind
KubePodInventory Kubernetes-Pods und ihre Eigenschaften
KubePVInventory Persistente Kubernetes-Volumen und deren Eigenschaften.
KubeServices Kubernetes-Dienste und deren Eigenschaften
Heartbeat Protokolle, die von Log Analytics-Agents einmal pro Minute protokolliert werden, um über den Zustand der Agents zu berichten.

Operator-Nexusmetriken

Die Tabelle "InsightMetrics" im Abschnitt "Protokolle" enthält die Metriken, die von Bare Metal Machines und dem Undercloud Kubernetes-Cluster gesammelt werden. Darüber hinaus können einige ausgewählte Metriken, die aus der Untercloud gesammelt werden, beobachtet werden, indem sie die Registerkarte "Metriken" im Menü "Azure Monitor" öffnen.

Screenshot der Auswahl von Azure Monitor-Metriken.

Abbildung: Auswahl von Azure Monitor-Metriken

Details zur Verwendung dieses Tools finden Sie unter der Analyse von Metriken mit dem Azure Monitor-Metrik-Explorer.

Workbooks

Arbeitsmappen kombinieren Text, Protokollabfragen, Metriken und Parameter für die Datenanalyse und die Erstellung mehrerer Arten von umfangreichen Visualisierungen. Sie können die Azure Resource Manager-Beispielarbeitsmappenvorlagen für die Operator Nexus Logging and Monitoring verwenden, um Azure-Arbeitsmappen in Ihrem Azure LAW bereitzustellen.

Alarmsignale

Sie können die Beispiel-Azure Resource Manager-Alarmvorlagen für Operator Nexus-Warnungsregeln verwenden. Sie sollten Schwellenwerte und Bedingungen für die Warnungen angeben. Anschließend können Sie diese Warnungsvorlagen in Ihrer lokalen Umgebung bereitstellen.

Hardwarekapazitätswarnungen

Der Schwellenwert für die Hardwarekapazität von Geräten wird auf 60 % festgelegt, und der Schwellenwert der Verkehrsrichtlinie wird auf 35 % festgelegt. Alle Warnungen werden über syslog veröffentlicht.

Log Analytik-Arbeitsbereich

Ein Log Analytics-Arbeitsbereich (LAW) ist eine einzigartige Umgebung zum Protokollieren von Daten aus Azure Monitor und anderen Azure-Diensten. Jeder Arbeitsbereich verfügt über ein eigenes Daten-Repository und eine eigene Konfiguration, kann jedoch Daten aus mehreren Diensten kombinieren. Jeder Arbeitsbereich besteht aus mehreren Datentabellen.

Ein einzelnes LAW kann erstellt werden, um alle relevanten Daten oder mehrere Arbeitsbereiche basierend auf den Betreiberanforderungen zu sammeln.