次の方法で共有


Azure Operator Nexus の可観測性

Operator Nexus 監視フレームワークは、オンプレミス インスタンスに関する運用上の分析情報を提供します。 このフレームワークでは、運用 (プラットフォームとワークロード) のデータとメトリックのログ記録、監視、アラート (LMA)、分析、視覚化がサポートされています。

Operator Nexus ロギング、モニタリング、アラート (LMA) フレームワークのスクリーンショット。

図: オペレーター ネクサス ログ、監視、アラート (LMA) フレームワーク

Operator Nexus 監視フレームワークの主なハイライトは次のとおりです。

  • 一元化されたデータ収集: Operator Nexus 監視ソリューションは、中央の場所にあるすべてのデータのコレクションに基づいています。 この場所では、すべてのオンプレミス インスタンスからの監視データを監視できます。
  • 明確に定義されたテスト済みのツール: このソリューションは、クラウドとオンプレミスのインスタンスからのテレメトリ データを収集、分析、および処理する Azure Monitor に依存します。
  • 学習と使用が簡単: このソリューションを使用すると、クラウドとオンプレミスのインスタンスの内部または全体からデータを検索する機能を使用して、問題を簡単に分析およびデバッグできます。
  • 視覚化ツール: ニーズに合わせてカスタマイズされたダッシュボードとブックを作成します。
  • 統合アラート ツール: カスタムしきい値に基づいてアラートを作成します。 すべてのインスタンスでアラート テンプレートを作成して再利用できます。

この記事は、コンポーネントのスタックで構成される Operator Nexus 監視フレームワークを理解するのに役立ちます。

  • Azure Monitor は、Operator Nexus コンポーネントからログ データを収集して集計します
  • Azure Log Analytics ワークスペース (LAW) は、複数の Azure サブスクリプションとテナントからログ データを収集して集計します
  • 分析、視覚化、およびアラートは、集計されたログ データに対して実行されます。

プラットフォームの監視

Operator Nexus を使用すると、 インフラストラクチャ リソースで構成されるデプロイのパフォーマンスを可視化できます。 これらのプラットフォーム リソースからログとメトリックを収集して分析する必要があります。 集約されていないデータと比較して、すべてのソースからのデータの一元的な収集と集計から貴重な分析情報を得ることができます。

これらのログとメトリックは、プラットフォームの状態を監視するために使用されます。 パフォーマンスを確認し、何が間違っているかを分析できます。 状況の原因を分析できます。 視覚化は、必要なアラートと、どのような条件下で構成するのに役立ちます。 たとえば、リソースが異常に動作しているとき、またはしきい値に達したときに生成されるアラートを構成できます。 収集されたログと分析を使用して、環境内の問題をデバッグできます。

監視データ

Operator Nexus の監視機能を使用すると、他の Azure リソースと同じ種類のデータを収集できます。 各インスタンスから収集されたデータは、LAW で表示できます。

Azure リソースの監視については 、こちらをご覧ください

コレクションとルーティング

オペレーターの Nexus 監視機能を使用すると、インフラストラクチャ リソースごとにデータを収集できます。 インフラストラクチャ コンポーネントのセットには、次のものが含まれます。

  • CA、TOR、NPB、管理スイッチ、ターミナル サーバーを含むネットワーク ファブリック。
  • ベア メタル サーバーを含むコンピューティング。
  • Undercloud コントロール プレーン (プラットフォーム全体のデプロイと管理ライフサイクルを担当する Kubernetes クラスター)。

これらのレイヤーからのログ データの収集は、Operator Nexus インスタンスの作成時に既定で有効になります。 これらの収集されたログは、Azure Monitor LAW にルーティングされます。

コンテナー化および仮想化されたネットワーク関数を実行するために作成されたテナント レイヤーからデータを収集することもできます。 収集できるログ データには、次のものが含まれます。

  • Virtual Machines からの syslog の収集 (VNF または CNF ワークロードに使用)。
  • Kubernetes クラスターと、上にデプロイされたアプリケーションからのログのコレクション。

テナント Kubernetes クラスターと Virtual Machines からのログの収集を有効にする必要があります。 手順に従って 、Azure 監視エージェントをデプロイする必要があります。 データは Azure LAW で収集されます。

オペレーターネクサスログストレージ

Azure Monitor ログのデータはテーブルに格納され、各テーブルには独自の一意のプロパティ セットがあります。

Azure Monitor のすべてのリソース ログには、同じフィールドの後にサービス固有のフィールドがあります。 共通スキーマを参照してください。

Operator Nexus プラットフォームのログは、次の表に格納されます。

Description
Syslog Log Analytics エージェントを使用した Linux コンピューターでの Syslog イベント
ContainerInventory 各コンテナーの詳細と現在の状態。
ContainerLog コンテナーの stdout ストリームと stderr ストリームから収集されたログ行
ContainerNodeInventory コンテナー ホストとして機能するノードの詳細。
InsightMetrics サーバー、K8s、コンテナーから収集されたメトリック。
KubeEvents Kubernetes イベントとそのプロパティ。
KubeMonAgentEvents エラーと警告のために Azure Monitor Kubernetes エージェントによってログに記録されたイベント。
KubeNodeInventory Kubernetes クラスターの一部であるノードの詳細
KubePodInventory Kubernetes ポッドとそのプロパティ
KubePVInventory Kubernetes 永続ボリュームとその特性。
KubeServices Kubernetes サービスとそのプロパティ
心拍 Log Analytics エージェントによって、1 分ごとにエージェントの正常性を報告するレコードがログに記録されます。

オペレーターネクサスメトリック

ログ セクションの "InsightMetrics" テーブルには、ベア メタル マシンとクラウド下の Kubernetes クラスターから収集されたメトリックが含まれています。 さらに、Azure Monitor メニューから [メトリック] タブを開くと、アンダークラウドから収集されたいくつかの選択されたメトリックを確認できます。

Azure Monitor メトリックの選択のスクリーンショット。

図: Azure Monitor メトリックの選択

このツールの使用方法の詳細については、 Azure Monitor メトリック ス エクスプローラー を使用したメトリックの分析に関するページを参照してください。

Workbooks

ワークブックは、テキストやログ クエリ、メトリック、パラメーターを組み合わせてデータ分析およびさまざまな種類の豊富なビジュアライゼーションを作成します。 Operator Nexus のログ記録と監視用のサンプル Azure Resource Manager ブック テンプレートを使用して、Azure LAW 内に Azure ブックをデプロイできます。

Alerts

Operator Nexus アラート ルールには、サンプルの Azure Resource Manager アラーム テンプレートを使用できます。 アラートのしきい値と条件を指定する必要があります。 その後、これらのアラート テンプレートをオンプレミス環境にデプロイできます。

ハードウェア容量アラート

デバイスのハードウェア容量のしきい値は 60%に設定され、TrafficPolicy の制限しきい値は 35%に設定されます。 すべてのアラートは syslog を介して発行されます。

ログアナリティクス ワークスペース

Log Analytics ワークスペース (LAW) は、Azure Monitor やその他の Azure サービスからデータをログに記録する固有の環境です。 各ワークスペースには独自のデータ リポジトリと構成がありますが、複数のサービスのデータを組み合わせることができます。 各ワークスペースは、複数のデータ テーブルで構成されます。

1 つの LAW を作成して、オペレーターの要件に基づいて関連するすべてのデータまたは複数のワークスペースを収集できます。