共用方式為


Azure 監視器中的代理程式健康情況解決方案

Azure 中的代理程式健康情況解決方案可協助您瞭解哪些監視代理程式沒有回應並提交作業資料。 這包括直接報告給 Azure 監視器中的 Log Analytics 工作區或連線到 Azure 監視器的 System Center Operations Manager 管理群組的所有代理程式。

您也可以使用代理程式健康解決方案來:

  • 追蹤部署了多少代理程式以及它們在地理位置上的分佈位置。
  • 執行其他查詢,以保持對部署在 Azure、其他雲端環境或內部部署中代理程式分佈的了解。

這很重要

代理程式健康情況解決方案只會監視 Log Analytics 代理程式的健康情況,該代理程式自 2024 年 8 月 31 日起已被取代。 此解決方案不會監視 Azure 監視器代理程式的健康情況。

先決條件

部署此解決方案之前,請確認您已支援向 Log Analytics 工作區報告的 Windows 代理程式 ,或向與工作區整合的 Operations Manager 管理群組 報告。

管理套件

如果您的 Operations Manager 管理群組已連線到 Log Analytics 工作區,則會在 Operations Manager 中安裝下列管理元件。 新增此解決方案之後,這些管理元件也會安裝在直接連線的 Windows 電腦上:

  • Microsoft System Center Advisor HealthAssessment 直接通道智慧套件 (Microsoft.IntelligencePacks.HealthAssessmentDirect)
  • Microsoft System Center Advisor HealthAssessment Server 通道智慧套件 (Microsoft.IntelligencePacks.HealthAssessmentViaServer)

這些管理套件不需要設定或管理。 如需如何更新解決方案管理元件的詳細資訊,請參閱 將 Operations Manager 連線到 Log Analytics

設定

使用 新增解決方案中所述的程式,將代理程式健康情況解決方案新增至 Log Analytics 工作區。 不需要進一步的設定。

支援的代理程式

下表說明此解決方案支援的連線來源。

連線的來源 支持 Description
Windows 代理程式 Yes 心跳事件是直接從 Windows 代理程式收集的。
System Center Operations Manager 管理群組 Yes 來自代理程式的心跳事件會被收集,並每隔 60 秒向管理群組報告,然後轉送至 Azure 監視器。 不需要從 Operations Manager 代理程式直接連線到 Azure 監視器。 心跳事件資料會從管理群組轉送至 Log Analytics 工作區。

使用解決方案

當您將解決方案新增至 Log Analytics 工作區時,「代理程式健康情況」磁磚會新增至您的儀錶板。 此圖塊顯示過去 24 小時內客服專員總數和無回應客服專員的數量。

螢幕擷取畫面,顯示儀表板上的客服人員健康情況圖磚。

選取 [代理程式健康情況 ] 磚以開啟 [代理程式健康情況 ] 儀表板。 儀表板包含下表中的資料行。 每個資料行都會依計數列出符合指定時間範圍內該資料行準則的前 10 個事件。 您可以執行提供完整清單的日誌搜尋。 選取每個資料行下方的 [ 查看全部 ],或選取資料行標題。

資料行 Description
隨時間變化的代理計數 Windows 和 Linux 代理程式在 7 天期間的代理數量趨勢分析
無回應的客服專員計數 過去 24 小時內未傳送活動訊號的代理程式清單
作業系統類型分佈 環境中 Windows 和 Linux 代理程式的數量分配
依代理程式版本分發 您環境中安裝的代理版本的分類,以及每個版本的計數
按代理商類別分佈 傳遞心跳事件之代理程式類別的區分:直接代理程式、Operations Manager 代理程式或者 Operations Manager 管理伺服器。
按管理群組分配 環境中 Operations Manager 管理群組的分割區
代理的地理位置 您擁有代理程式的國家/地區的分割區,以及每個國家/地區已安裝的代理程式數目總計數
已安裝的閘道計數 已安裝 Log Analytics 閘道的伺服器數目,以及這些伺服器的清單

螢幕擷取畫面顯示客服專員健康情況解決方案儀表板的範例。

Azure 監視器日誌記錄

解決方案會在 Log Analytics 工作區中建立一種記錄類型:心跳訊號。 心跳記錄具有下表所列的屬性。

房產 Description
Type Heartbeat
Category Direct AgentSCOM AgentSCOM Management Server
Computer 電腦名稱
OSType Windows 或 Linux 作業系統
OSMajorVersion 作業系統主要版本
OSMinorVersion 作業系統次要版本
Version Log Analytics 代理程式或 Operations Manager 代理程式版本
SCAgentChannel Direct 及/或 SCManagementServer
IsGatewayInstalled true 如果已安裝 Log Analytics 閘道;否則 false
ComputerIP Azure 虛擬機器的公用 IP 位址 (如果有的話);Azure SNAT 位址 (不是私人 IP 位址) ,適用於使用私人 IP 的虛擬機器
ComputerPrivateIPs 電腦的私有IP清單
RemoteIPCountry 部署電腦的地理位置
ManagementGroupName Operations Manager 管理群組的名稱
SourceComputerId 電腦的唯一 ID
RemoteIPLongitude 電腦地理位置的經度
RemoteIPLatitude 電腦地理位置的緯度

每個報告至 Operations Manager 管理伺服器的代理都會傳送兩個心跳訊號。 SCAgentChannel屬性的值將同時包含 DirectSCManagementServer,視您在訂用帳戶中啟用的資料來源和監視解決方案而定。

如果您記得,來自解決方案的資料會以某種方式傳送:

  • 直接從 Operations Manager 管理伺服器傳送至 Azure 監視器。
  • 直接從代理程式到 Azure 監視器,因為代理程式上收集的資料量很大。

對於值等於SCManagementServer的活動訊號事件,ComputerIP的值是管理伺服器的 IP 位址,因為該伺服器實際上負責上傳資料。 對於將SCAgentChannel設定為Direct的心跳訊號,它是代理程式的公用 IP 位址。

範例日誌搜尋

下表提供解決方案收集之記錄的範例記錄搜尋。

Query Description
心跳 | 獨特電腦 代理程式總數
心跳 |summarize LastCall = max(TimeGenerated) by Computer |其中 LastCall < 前(24小時) 過去 24 小時內無回應的代理數量
心跳 |summarize LastCall = max(TimeGenerated) by Computer |其中 LastCall < ago(15m) 過去 15 分鐘內無回應客服專員的計數
心跳信號 | 其中 TimeGenerated > ago(24h) 和 計算機 在 ((心跳信號 | 其中 TimeGenerated > ago(24h) | distinct 計算機)) | summarize LastCall = max(TimeGenerated) by 計算機 過去 24 小時內保持在線狀態的電腦
心跳 | 篩選 TimeGenerated > ago(24h) 和 Computer 不在 ((心跳 | 篩選 TimeGenerated > ago(30m) | distinct Computer)) | summarize LastCall = max(TimeGenerated) by Computer 過去 30 分鐘內離線的客服專員總數 (過去 24 小時)
心跳 | summarize AggregatedValue = dcount(Computer) by OSType 依作業系統類型隨時間變化的代理程式數目趨勢
心跳 | summarize AggregatedValue = dcount(Computer) by OSType 依作業系統類型分佈
心跳 |依版本彙總 AggregatedValue = dcount(Computer) 依代理程式版本分發
心跳 |依類別摘要 AggregatedValue = count() 按代理商類別分佈
心跳 |依 ManagementGroupName 彙總 AggregatedValue = dcount(Computer) 管理組群分配
心跳監測 | summarize AggregatedValue = dcount(Computer) by RemoteIPCountry 代理的地理位置
心跳 | where iff(isnotnull(toint(IsGatewayInstalled)), IsGatewayInstalled == true, IsGatewayInstalled == "true") == true | 不同的電腦 已安裝的 Log Analytics 閘道數目

後續步驟

瞭解如何 從 Azure 監視器中的記錄查詢產生警示