使用 Azure 檔案同步,將組織的檔案共用集中在 Azure 檔案服務中,同時保有內部部署檔案伺服器的彈性、效能及相容性。 Azure 檔案同步會將 Windows Server 轉換成 Azure 檔案共用的快速快取。 您可以使用 Windows Server 上可用的任何通訊協定來從本機存取資料,包括 SMB、NFS 和 FTPS。 您可以視需要存取多個散佈於世界各地的快取。
Azure 檔案同步的內建監視
本文描述如何使用 Azure 監視器、儲存體同步服務和 Windows Server 來監視您的 Azure 檔案同步部署。 其中涵蓋下列案例:
- 檢視 Azure 監視器中的 Azure 檔案同步計量。
- 在 Azure 監視器中建立警示,以主動通知您重大情況。
- 使用 Azure 入口網站來檢視 Azure 檔案同步部署的健康情況。
- 使用 Windows Server 上的事件記錄檔和效能計數器來監視 Azure 檔案同步部署的健康情況。
檢視 Azure 檔案同步計量
依預設會啟用 Azure 檔案同步的計量,並且每 15 分鐘傳送至 Azure 監視器一次。
若要在 Azure 監視器中檢視 Azure 檔案同步計量:
- 移至 [Azure 入口網站] 中的 [儲存體同步服務],然後選取 [計量]。
- 選取 [計量] 下拉式清單,然後選取您想要檢視的計量。
當您的監視資料中發現重要條件時,警示會主動通知您。 若要深入了解如何在 Azure 監視器中設定警示,請參閱 Microsoft Azure 中的警示概觀。
警示
若要建立 Azure 檔案同步的警示:
- 移至 Azure 入口網站中的 [儲存體同步服務]。
- 在 [監視] 區段中,選取 [警示],然後選取 [+ 新增警示規則]。
- 選取 [選取條件],然後為警示提供下列資訊:
- 度量
- 維度名稱
- 警示邏輯
- 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將動作群組 (電子郵件、SMS 等) 新增至警示。
- 填入警示詳細資料,例如警示規則名稱、描述和嚴重性。
- 選取 [建立警示規則] 以建立警示。
附註
如果您使用「伺服器名稱」維度設定警示,且伺服器已重新命名,則必須更新警示,才能監視新的伺服器名稱。
儲存體同步服務
若要在 [Azure 入口網站] 中檢視 Azure 檔案同步部署的健康情況,請瀏覽至 [儲存體同步服務]。 可用資訊如下:
已註冊的伺服器健康情況
伺服器端點健康情況
- 持續性同步錯誤
- 暫時性同步錯誤
- 同步活動 (上傳至雲端、下載至伺服器)
- 雲端階層處理節省的空間
- 階層處理錯誤
- 重新叫用錯誤
計量
已註冊的伺服器健康情況
若要在入口網站中檢視已註冊的伺服器健康情況,請瀏覽至 [儲存體同步服務] 的 [已註冊的伺服器] 區段。
- 如果 [已註冊的伺服器] 處於 [線上] 狀態,表示伺服器正順利地與服務進行通訊。
- 如果 [已註冊的伺服器] 狀態為 [顯示離線],則儲存體同步監視器程序 (AzureStorageSyncMonitor.exe) 未執行,或伺服器無法存取 Azure 檔案同步服務。 如需詳細資訊,請參閱疑難排解文件。
伺服器端點健康情況
若要在入口網站中檢視伺服器端點的健康情況,請瀏覽至 [儲存體同步服務] 的 [同步處理群組] 區段,然後選取同步處理群組。
- 入口網站中的 [伺服器端點健康情況] 和 [同步活動] (上傳至雲端、下載至伺服器) 是根據伺服器上遙測事件記錄檔 (識別碼 9102 和 9302) 中所記錄的同步事件。 如果同步處理工作階段因暫時性錯誤 (例如錯誤取消) 而失敗,則只要目前的同步處理工作階段正在進行中 (會套用檔案),伺服器端點就仍會在入口網站中顯示為 [狀況良好]。 事件識別碼 9302 是同步處理進度事件,而在同步處理工作階段完成之後,會記錄事件識別碼 9102。 如需詳細資訊,請參閱同步處理健康情況與同步處理進度。 如果伺服器端點健康情況顯示 [狀況良好] 以外的狀態,請參閱疑難排解文件取得指引。
- 入口網站中的 [持續性同步錯誤] 和 [暫時性同步錯誤] 計數是根據伺服器上遙測事件記錄檔所記錄的事件識別碼 9121。 當同步處理工作階段完成時,每個項目的錯誤都會記錄此事件。 若要在入口網站中檢視錯誤,請移至 [伺服器端點屬性],然後瀏覽至 [錯誤與疑難排解] 區段。 若要解決每個項目的錯誤,請參閱如何查看是否有特定檔案或資料夾未同步?。
- 雲端階層處理節省的空間提供雲端階層處理所節省的磁碟空間量。 提供給 [雲端階層處理節省的空間] 的資料是根據伺服器上遙測事件記錄檔所記錄的事件識別碼 9071。 若要檢視其他雲端階層處理資訊和計量,請移至 [伺服器端點屬性],然後瀏覽至 [雲端階層處理狀態] 區段。 若要深入了解,請參閱監視雲端階層處理。
- 若要在入口網站中檢視 [階層處理錯誤] 和 [重新叫用錯誤],請移至 [伺服器端點屬性],然後瀏覽至 [錯誤與疑難排解] 區段。 [階層處理錯誤] 是根據伺服器上遙測事件記錄檔所記錄的事件識別碼 9003,而 [重新叫用錯誤] 是根據事件識別碼 9006。 如需無法進行階層處理或重新叫用之檔案的詳細資訊,請參閱如何針對無法進行階層處理的檔案進行疑難排解和如何針對無法重新叫用的檔案進行疑難排解。
計量圖表
您可以在儲存體同步服務入口網站中檢視下列計量圖表:
| 度量名稱 | 描述 | 頁面名稱 |
|---|---|---|
| 代理程式版本到期資訊 | 代理程式版本到期前的天數 | 儲存同步服務 - 計量 |
| 同步的位元組 | 傳輸的資料大小(上傳和下載) | 同步群組 - 狀態、伺服器端點 - 同步狀態、儲存同步服務 - 計量 |
| 上次存取時間的快取資料大小 | 依上次存取時間劃分的資料大小 | 伺服器端點 - 雲端分層狀態、儲存同步服務 - 指標 |
| 雲端階層處理快取命中率 | 從快取提供服務與從雲端重新叫用的位元組百分比 | 同步群組 - 狀態、伺服器端點 - 雲端分層狀態、儲存同步服務 - 計量 |
| 雲端階層處理磁碟空間不足模式 | 伺服器上的磁碟空間狀態 | 儲存同步服務 - 計量 |
| 雲端分層召回成功率 | 雲端階層處理重新叫用的成功狀態 | 儲存同步服務 - 計量 |
| 分層的雲端階層處理資料大小 | 分層資料的大小 | 儲存同步服務 - 計量 |
| 上次維護作業分層的雲端階層處理資料大小 | 在上次維護作業期間分層的資料大小。 | 儲存同步服務 - 計量 |
| 雲端階層處理重新叫用大小 | 召回的資料大小 | 同步群組 – 狀態、已註冊的伺服器、儲存體同步服務 - 計量 |
| 雲端階層處理重新叫用大小 (依應用程式) | 應用程式呼叫的資料大小 | 伺服器端點 - 雲端分層狀態、儲存同步服務 - 指標 |
| 雲端階層處理重新叫用輸送量 | 資料召回吞吐量 | 儲存同步服務 - 計量 |
| 輸出明細 | 依使用者重新叫用分層檔案、背景重新叫用和同步下載劃分的輸出明細 | 伺服器端點 - 雲端分層狀態 |
| 同步的檔案 | 傳輸的檔案數量(上傳和下載) | 同步群組 - 狀態、伺服器端點 - 同步狀態、儲存同步服務 - 計量 |
| 檔案無法同步 | 無法同步處理的檔案計數 | 同步群組 - 狀態、伺服器端點 - 同步狀態、儲存同步服務 - 計量 |
| 伺服器快取大小 | 伺服器上快取的資料大小 | 儲存同步服務 - 計量 |
| 伺服器線上狀態 | 從伺服器接收到的活動訊號計數。 | 已註冊的伺服器、儲存同步服務 - 指標 |
| 節省空間 | 本機快取與雲端分層資料的空間節省明細 | 伺服器端點 - 雲端分層狀態 |
| 同步工作階段結果 | 同步工作階段的成功狀態 | 同步群組 - 狀態、儲存體同步服務 - 計量 |
| 依分層原則的分層資料 | 分層檔案的數量及其分層原因 | 伺服器端點 - 雲端分層狀態 |
附註
儲存體同步服務入口網站中的圖表時間範圍為 24 小時。 若要檢視不同的時間範圍或維度,請使用 Azure 監視器。
Windows 伺服器
在已安裝 Azure 檔案同步代理程式的 Windows Server 上,您可以使用事件記錄檔和效能計數器,在該伺服器上檢視伺服器端點的健康情況。
事件記錄
若要監視已註冊的伺服器、同步和雲端階層處理健康情況,請使用遙測事件伺服器記錄。 遙測事件記錄檔位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下。
同步健康情況
同步工作階段完成後,會記錄事件識別碼 9102。 您可以使用此事件來判斷同步處理工作階段是否成功 (HResult = 0) 以及是否有每個項目同步錯誤 (PerItemErrorCount)。 如需詳細資訊,請參閱同步健康情況和每個項目的錯誤文件。
附註
有時候同步處理工作階段會整體失敗或有非零的 PerItemErrorCount。 不過,工作階段仍會繼續進行,而某些檔案會成功同步。 您可以在已套用欄位中看到此情況,例如 AppliedFileCount、AppliedDirCount、AppliedTombstoneCount 和 AppliedSizeBytes。 這些欄位會告訴您工作階段的成功程度。 如果您在某個資料列中看到多個同步處理工作階段失敗,而且有增加的已套用計數,請在您開啟支援票證之前,提供同步處理時間再試一次。
當同步處理工作階段完成時,每個項目的錯誤都會記錄事件識別碼 9121。 您可以使用此事件來判斷無法同步處理且具有此錯誤的檔案數目 (PersistentCount 和 TransientCount)。 您應該調查永續性每個項目錯誤。 如需詳細資訊,請參閱如何查看是否有特定檔案或資料夾未同步?。
如果有使用中的同步工作階段,則會每隔 5 到 10 分鐘記錄事件識別碼 9302 一次。 使用此事件來判斷要同步處理的項目數 (TotalItemCount)、目前已同步處理的項目數 (AppliedItemCount) 以及因每個項目的錯誤而無法同步處理的項目數 (PerItemErrorCount)。 如果同步處理沒有進展 (AppliedItemCount=0),則同步處理工作階段最後會失敗,並且會記錄事件識別碼 9102 與錯誤。 如需詳細資訊,請參閱同步處理進度文件。
已註冊的伺服器健康情況
- 當伺服器查詢服務中的作業時,將會每 30 秒記錄事件識別碼 9301 一次。 如果 GetNextJob 完成,且狀態 = 0,表示伺服器能夠與服務通訊。 如果 GetNextJob 完成但發生錯誤,請查看疑難排解文件以取得指引。
雲端階層處理健康情況
若要監視伺服器上的階層處理活動,請在遙測事件記錄檔中使用事件識別碼 9003、9016 和 9029 (位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下)。
- 事件識別碼 9003 會提供伺服器端點的錯誤分布。 例如:錯誤總數和錯誤碼。 系統會為每個錯誤碼記錄一個事件。
- 事件識別碼 9016 會提供磁碟區的建立映像結果。 例如:可用空間百分比、在工作階段中建立映像的檔案數目,以及無法建立映像的檔案數目。
- 事件識別碼 9029 會提供伺服器端點的虛像化工作階段資訊。 例如:在工作階段中嘗試的檔案數目、在工作階段中進行階層處理的檔案數目,以及已進行階層處理的檔案數目。
若要監視伺服器上的重新叫用活動,請在遙測事件記錄檔中使用事件識別碼 9005、9006、9009、9059 和 9071 (位於事件檢視器中的 Applications and Services\Microsoft\FileSync\Agent 下)。
- 事件識別碼 9005 會提供伺服器端點的回收可靠性。 例如:存取的唯一檔案總數和存取失敗的唯一檔案總數。
- 事件識別碼 9006 會提供伺服器端點的回收錯誤分布。 例如:失敗的要求總數和錯誤碼。 系統會為每個錯誤碼記錄一個事件。
- 事件識別碼 9009 會提供伺服器端點的回收工作階段資訊。 例如:DurationSeconds、CountFilesRecallSucceeded 和 CountFilesRecallFailed。
- 事件識別碼 9059 會提供伺服器端點的應用程式回收分布。 例如:ShareId、應用程式名稱和 TotalEgressNetworkBytes。
- 事件識別碼 9071 會提供伺服器端點的雲端階層處理效率。 例如:TotalDistinctFileCountCacheHit、TotalDistinctFileCountCacheMiss、TotalCacheHitBytes 和 TotalCacheMissBytes。
效能計數器
使用伺服器上的 Azure 檔案同步效能計數器,可監視同步活動。
若要在伺服器上檢視 Azure 檔案同步效能計數器,請開啟效能監視器 (Perfmon.exe)。 您可以在已傳輸的 AFS 位元組和 AFS 同步處理作業物件下找到計數器。
以下是效能監視器中為 Azure 檔案同步提供的效能計數器:
| 效能物件\計數器名稱 | 描述 |
|---|---|
| 傳輸的 AFS 位元組\每秒下載的位元組 | 每秒下載的位元組數。 |
| 傳輸的 AFS 位元組\每秒上傳的位元組 | 每秒上傳的位元組數。 |
| 傳輸的 AFS 位元組\每秒的位元組總數 | 每秒的位元組總數 (上傳和下載)。 |
| AFS 同步作業\每秒下載的同步檔案 | 每秒下載的檔案數。 |
| AFS 同步作業\每秒上傳的同步檔案 | 每秒上傳的檔案數。 |
| AFS 同步作業\每秒的同步檔案作業總數 | 同步的檔案總數 (上傳和下載)。 |
使用 Azure 監視器收集資料
下表說明如何收集資料來監視您的服務,以及收集到後的資料可以用於哪些動作:
| 要收集的資料 | 描述 | 如何收集和路由傳送資料 | 檢視資料的位置 | 支援的資料 |
|---|---|---|---|---|
| 計量資料 | 計量是描述特定時間點的系統某個方面的數值。 您可使用演算法來彙總計量、與其他計量進行比較,並分析一段時間內的趨勢。 | 定期自動收集。 | 計量瀏覽器 | Azure 監視器支援的 Azure 檔案同步計量 |
| 活動記錄資料 | Azure 監視器活動記錄可提供訂閱層級事件的見解。 此活動記錄包含像是何時修改資源或啟動虛擬機器的資訊。 | 自動收集。 | 活動記錄檔 |
如需 Azure 監視器支援的所有計量資料清單,請參閱 Azure 監視器支援的計量。
使用 Azure 監視器工具來分析資料
這些 Azure 監視器工具可在 Azure 入口網站中取得,以協助您分析監視資料:
有些 Azure 服務在 Azure 入口網站中具有內建的監視儀表板。 這些儀表板稱為「深入解析」,您可以在 Azure 入口網站中 Azure 監視器的 [深入解析] 區段內找到這些儀表板。
計量總管可讓您檢視和分析 Azure 資源的計量。 如需詳細資訊,請參閱使用 Azure 監視器計量瀏覽器分析計量。
Log Analytics 可讓您使用 Kusto 查詢語言 (KQL) 來查詢和分析記錄資料。 如需詳細資訊,請參閱開始使用 Azure 監視器中的記錄查詢。
Azure 入口網站具有用於檢視和基本搜尋活動記錄的使用者介面。 若要進行更深入的分析,請將資料路由傳送至 Azure 監視器記錄,並在 Log Analytics 中執行更複雜的查詢。
Application Insights 會監視 Web 應用程式的可用性、效能和使用方式,因此您可以識別和診斷錯誤,無需要等待使用者回報錯誤。
Application Insights 包含各種開發工具的連接點,並與 Visual Studio 整合以支援您的 DevOps 程序。 如需詳細資訊,請參閱 App Service 的應用程式監視 (部分機器翻譯)。
支援更複雜視覺效果的工具包括:
- 儀表板 (機器翻譯) 可讓您將不同類型的資料合併到 Azure 入口網站中的單一窗格。
- 活頁簿,這是能在 Azure 入口網站中建立的可自訂報表。 活頁簿可以包含文字、計量及記錄查詢。
- Grafana 是在操作儀表板中表現相當出色的開放平台工具。 您可以使用 Grafana 來建立儀表板,納入 Azure 監視器以外多個來源的資料。
- Power BI (機器翻譯) 是一項商務分析服務,可提供跨各種資料來源的互動式視覺效果。 您可以將 Power BI 設定為從 Azure 監視器自動匯入記錄資料,以利用這些視覺效果。
匯出 Azure 監視器資料
您可以使用下列項目來將資料從 Azure 監視器匯出到其他工具:
計量:使用計量的 REST API (機器翻譯) 從 Azure 監視器計量資料庫中擷取計量資料。 如需詳細資訊,請參閱 Azure 監視器 REST API 參考 (機器翻譯)。
記錄:使用 REST API 或相關聯的用戶端程式庫 (部分機器翻譯)。
若要開始使用 Azure 監視器 REST API,請參閱 Azure 監視 REST API 逐步解說 (機器翻譯)。
使用 Azure 監視器警示將問題通知您
Azure 監視器警示可讓您識別和解決系統中的問題,並在您的客戶注意到它們之前,在您的監視資料中發現特定情況時主動通知您。 您可以在 Azure 監視器資料平台中設置任何計量或記錄資料來源的警示。 根據您監視的服務和收集到的監視資料,有不同類型的 Azure 監視器警示。 請參閱選擇正確的警示規則類型。
適用於 Azure 檔案同步的建議 Azure 監視器警示規則
下表列出 Azure 檔案同步的常見和建議警示規則。
| 狀況 | 用於警示的計量 |
|---|---|
| 伺服器端點健康情況會在入口網站中顯示錯誤 | 同步工作階段結果 |
| 檔案無法同步至伺服器或雲端端點 | 檔案無法同步 |
| 已註冊的伺服器無法與儲存體同步服務通訊 | 伺服器線上狀態 |
| 雲端階層處理重新叫用大小在一天內超過 500 GiB | 雲端階層處理重新叫用大小 |
如需 Azure 資源的常見警示範例,請參閱記錄警示查詢範例 (機器翻譯)。
大規模實作警示
對於某些服務,若要進行大規模監控,您可以將相同計量警示規則套用至相同 Azure 區域中存在的多個同類型資源。 Azure 監視器基準警示 (AMBA) 提供半自動化方法以大規模實作重要的平台計量警示、儀表板和指導方針。
警示範例
本節提供 Azure 檔案同步的一些範例警示。
附註
如果您建立警示,而其雜訊太多,請調整閾值和警示邏輯。
若要在伺服器端點健康情況在入口網站中顯示錯誤時建立警示:
- 在 Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]。
- 移至 [監視] 區段,然後選取 [警示]。
- 選取 [+ 新增警示規則] 來新建警示規則。
- 按一下 [選取條件] 來設定條件。
- 在 [設定訊號邏輯] 區段內,選取訊號名稱底下的 [同步處理工作階段結果]。
- 選取下列維度設定:
- 維度名稱:伺服器端點名稱
- 運算子:=
- 維度值:所有目前和未來的值
- 瀏覽至 [警示邏輯],然後完成下列項目:
- 閾值設定為 [靜態]
- 運算子:小於
- 彙總類型:最大值
- 閾值:1
- 評估依據:彙總細微性 = 24 小時 | 評估頻率 = 每小時
- 選取 [完成]。
- 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
- 填入警示詳細資料,例如警示規則名稱、描述和嚴重性。
- 選取 [建立警示規則]。
若要在檔案無法同步至伺服器或雲端端點時建立警示:
- 在 Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]。
- 移至 [監視] 區段,然後選取 [警示]。
- 選取 [+ 新增警示規則] 來新建警示規則。
- 選取 [選取條件] 來設定條件。
- 在 [設定訊號邏輯] 區段內,選取訊號名稱底下的 [檔案無法同步]。
- 選取下列維度設定:
- 維度名稱:伺服器端點名稱
- 運算子:=
- 維度值:所有目前和未來的值
- 瀏覽至 [警示邏輯],然後完成下列項目:
- 閾值設定為 [靜態]
- 運算子:大於
- 彙總類型:平均
- 閾值:100
- 評估依據:彙總細微性 = 5 分鐘 | 評估頻率 = 每 5 分鐘
- 選取 [完成]。
- 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
- 填入警示詳細資料,例如警示規則名稱、描述和嚴重性。
- 選取 [建立警示規則]。
若要在已註冊的伺服器無法與儲存體同步服務通訊時建立警示:
- 在 Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]。
- 移至 [監視] 區段,然後選取 [警示]。
- 選取 [+ 新增警示規則] 來新建警示規則。
- 選取 [選取條件] 來設定條件。
- 在 [設定訊號邏輯] 區段內,選取訊號名稱底下的 [伺服器線上狀態]。
- 選取下列維度設定:
- 維度名稱:伺服器名稱
- 運算子:=
- 維度值:所有目前和未來的值
- 瀏覽至 [警示邏輯],然後完成下列項目:
- 閾值設定為 [靜態]
- 運算子:小於
- 彙總類型:最大值
- 閾值 (位元組):1
- 評估依據:彙總細微性 = 1 小時 | 評估頻率 = 每 30 分鐘
- 計量會每隔 15 到 20 分鐘傳送給 Azure 監視器。 請不要將 [評估頻率] 設定為小於 30 分鐘,因為這麼做會產生錯誤警示。
- 選取 [完成]。
- 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
- 填入警示詳細資料,例如警示規則名稱、描述和嚴重性。
- 選取 [建立警示規則]。
若要在一天內的雲端階層處理重新叫用大小超過 500 GiB 時建立警示:
- 在 Azure 入口網站中,瀏覽至對應的 [儲存體同步處理服務]。
- 移至 [監視] 區段,然後選取 [警示]。
- 選取 [+ 新增警示規則] 來新建警示規則。
- 選取 [選取條件] 來設定條件。
- 在 [設定訊號邏輯] 區段內,選取訊號名稱底下的 [雲端階層處理重新叫用大小]。
- 選取下列維度設定:
- 維度名稱:伺服器名稱
- 運算子:=
- 維度值:所有目前和未來的值
- 瀏覽至 [警示邏輯],然後完成下列項目:
- 閾值設定為 [靜態]
- 運算子:大於
- 彙總類型:總計
- 閾值 (位元組):67108864000
- 評估依據:彙總細微性 = 24 小時 | 評估頻率 = 每小時
- 選取 [完成]。
- 選取 [選取動作群組],然後選取現有的動作群組或建立新的動作群組,以將 (電子郵件、SMS 等) 新增至警示。
- 填入警示詳細資料,例如警示規則名稱、描述和嚴重性。
- 選取 [建立警示規則]。