Operator Nexus 可觀測性框架提供您對內部部署實例的詳盡作業解析。 此架構支援記錄、監控和警示 (LMA)、分析以及營運 (平台和工作負載) 資料和指標的視覺化。
圖:運營商樞紐日誌、監控和警報(LMA)框架
Operator Nexus 可觀測性架構的主要亮點包括:
- 集中式資料收集:Operator Nexus 可觀測性解決方案以中央位置的所有資料集合為基礎。 在此位置,您可以觀察所有內部部署執行個體的監控資料。
- 經驗完善且經過測試的工具:此解決方案依賴於 Azure Monitor,旨在收集、分析並對雲端和內部部署執行個體的遙測資料採取行動。
- 易於學習和使用:此解決方案可讓您輕鬆分析和排除問題,並能跨所有雲端及內部部署執行個體搜尋資料。
- 視覺化工具:您可以根據需求建立自訂儀表板和活頁簿。
- 整合式警示工具:您可以根據自訂臨界值建立警示。 您可以在所有執行個體中創建和再次使用警示範本。
本文可協助您瞭解由元件堆疊所組成的運算子連接點可觀察性架構:
- Azure 監視器會從操作員連接點元件收集並彙總記錄資料
- Azure Log Analytics 工作區 (LAW) 會從多個 Azure 訂用帳戶和租用戶收集並彙總記錄資料
- 分析、視覺化和警示會針對彙總的記錄資料執行。
平台監控
操作員連接點可讓您查看由 基礎結構資源組成的部署效能。 您需要從這些平台資源收集和分析日誌和指標。 與來自未彙總資料的見解相比,從所有來源集中收集和彙總的資料中,您可以獲得有價值的見解。
這些日誌和指標用於觀察平台的狀態。 您可以查看性能並分析問題所在。 您可以分析導致這種情況的原因。 視覺化可協助您設定所需的警示以及在什麼條件下。 例如,您可以設定在資源行為異常或達到臨界值時產生警示。 您可以使用收集的日誌和分析來偵錯環境中的任何問題。
監控數據
Operator Nexus observability 允許您像其他 Azure 資源一樣收集相同類型的資料。 從您的每個實例收集的數據可以在您的 LAW 中查看。
您可以在這裡瞭解如何監視 Azure 資源。
收集與路由
Operator Nexus 觀察能力可讓您收集每個基礎架構資源的資料。 基礎架構元件集包括:
- 網路網狀架構,包括 CE、TOR、NBB、管理交換器和終端機伺服器。
- 包含裸機伺服器的運算。
- 控制平面(Undercloud Kubernetes叢集,負責部署和管理整個平台的生命週期)。
預設情況下,在建立 Operator Nexus 實例期間,就會啟用從這些層收集日誌資料。 這些收集的記錄會路由傳送至您的 Azure 監視器 LAW。
您也可以從為執行容器化和虛擬化網路功能而建立的租用戶層收集資料。 可收集的日誌資料包括:
- 從虛擬機器收集系統日誌,以用於 VNF 或 CNF 的工作負載。
- 從 Kubernetes 叢集及其上運行的應用程式收集日誌。
您需要啟用租戶 Kubernetes 叢集和虛擬機器的日誌收集。 您應該遵循步驟來部署 Azure 監視代理程式。 數據將收集在您的 Azure 法律中。
操作員連接點記錄儲存體
Azure 監視器記錄中的資料會儲存在資料表中,其中每個資料表都有一組專屬的唯一屬性。
Azure 監視器中的所有資源記錄都有相同的欄位,後面接著服務特定的欄位;請參閱 通用結構描述。
Operator Nexus 平台的記錄會儲存在下表中:
| Table | Description |
|---|---|
| Syslog | 使用 Log Analytics 代理程式的 Linux 電腦上的 Syslog 事件 |
| ContainerInventory | 每個容器的詳細資料和目前狀態。 |
| ContainerLog | 從容器的 stdout 和 stderr 串流收集的日誌行 |
| ContainerNodeInventory | 做為容器主機的節點詳細資料。 |
| InsightMetrics(洞察指標) | 從伺服器、K8s、容器收集的指標。 |
| KubeEvents | Kubernetes 事件及其屬性。 |
| KubeMonAgentEvents | Azure Monitor Kubernetes 代理程式所記錄的錯誤和警告事件。 |
| KubeNodeInventory | 屬於 Kubernetes 叢集之節點的詳細資料 |
| KubePodInventory | Kubernetes Pod 及其屬性 |
| KubePVInventory | Kubernetes 永續性磁碟區及其屬性。 |
| KubeServices | Kubernetes 服務及其屬性 |
| Heartbeat | Log Analytics 代理程式每分鐘記錄一次記錄,以報告代理程式健康情況 |
操作員關聯計量
「日誌」區段中的「InsightMetrics」資料表包含從裸機機器和底層雲端 Kubernetes 叢集收集的指標。 此外,您可以從 Azure 監視器功能表開啟 [計量] 索引標籤,觀察從雲端底層收集的一些選取計量。
圖:Azure 監視器指標選擇
如需使用此工具的詳細資訊,請參閱 Azure Monitor Metrics Explorer 以分析計量。
Workbooks
活頁簿結合文字、記錄查詢、指標和參數,以進行資料分析,並建立多種豐富的視覺化。 您可以使用 操作員連接點記錄和監視 的範例 Azure Resource Manager 活頁簿範本,在 Azure LAW 內部署 Azure 活頁簿。
警示
您可以使用 Azure Resource Manager 的範例警示範本來設定 Operator Nexus 警示規則。 您應該指定警示的臨界值和條件。 然後,您可以在內部部署環境中部署這些警示範本。
硬體容量警示
裝置的硬體容量臨界值設定為 60%,而 TrafficPolicy 限制臨界值設定為 35%。 所有警示都會透過系統日誌發佈。
日誌分析工作區
Log Analytics 工作區 (LAW) 是記錄來自 Azure 監視器和其他 Azure 服務資料的唯一環境。 每個工作區都有自己的資料儲存庫和組態,但可能會結合來自多個服務的資料。 每個工作區都包含多個資料表。
可以建立單一 LAW 來根據操作員需求收集所有相關資料或多個工作區。