次の方法で共有


Azure デバイス レジストリでの信頼性

Azure Device Registry は 、クラウド内の資産とデバイスに関する情報を格納します。 Device Registry は、1 つのレジストリ内のクラウドに資産を Azure リソースとしてプロジェクトします。 単一のレジストリは、デバイスと資産のメタデータ、および資産管理機能の信頼のソースです。 デバイス レジストリは、 Azure IoT 操作と組み合わせて使用できます。

Azure を使用する場合、 信頼性は共有責任です。 Microsoft では、回復性と回復性をサポートするさまざまな機能を提供しています。 使用するすべてのサービスでこれらの機能がどのように機能するかを理解し、ビジネス目標とアップタイムの目標を達成するために必要な機能を選択する必要があります。

この記事では、一時的な障害、可用性ゾーンの停止、リージョンの停止など、さまざまな障害や問題に対するデバイス レジストリの回復性を確保する方法について説明します。

Note

Azure IoT Operations には、Device Registry 以外のさまざまなコンポーネントが含まれています。 Azure IoT Operations コンポーネントの高可用性とデータ損失ゼロの機能の詳細については、「Azure IoT Operations についてよく寄せられる質問」を参照してください。

一時的な障害に対する回復性

一時的な障害は、コンポーネントにおける短い断続的な障害です。 これらはクラウドのような分散環境で頻繁に発生し、運用の通常の範囲であり、 一時的な障害は、短時間の経過後に自分自身を修正します。 アプリケーションが一時的な障害に対処できることが重要です。これは通常、影響を受けた要求を再試行することで対処します。

クラウドでホストされるすべてのアプリケーションは、クラウドでホストされている API、データベース、およびその他のコンポーネントと通信する際に、Azure の一時的な障害処理のガイダンスに従う必要があります。 詳細については、「一時的な障害を処理するための推奨事項」を参照してください。

クライアントは、Azure Resource Manager を使用して Device Registry と対話します。 一般に、Azure portal、Azure CLI、または Azure SDK を使用して Device Registry リソースを操作します。これらのツールは、一時的な障害の自動処理を提供します。 Resource Manager API を直接使用する場合は、必ず一時的な障害を処理してください。

可用性ゾーンの障害に対する回復性

可用性ゾーン は、Azure リージョン内のデータセンターの物理的に分離されたグループです。 1 つのゾーンで障害が発生した際には、サービスを残りのゾーンのいずれかにフェールオーバーできます。

Azure Device Registry は既定でゾーン冗長です。つまり、複数の 可用性ゾーン間でデータが自動的にレプリケートされます。 このセットアップでは、高可用性を提供することで、サービスの回復性が向上します。 あるゾーンで障害が発生した場合、サービスは別のゾーンからシームレスに動作し続けることができます。

Azure デバイス レジストリのゾーン冗長のセットアップと構成は Microsoft が管理します。 このゾーンの冗長性を有効にするために、これ以上構成を行う必要はありません。 最高レベルの可用性と信頼性を提供するようにサービスが構成されていることは、Microsoft が保証します。

リージョンのサポート

次のリージョンの一覧は、Device Registry の可用性ゾーンをサポートしています。

南北アメリカ ヨーロッパ
米国東部 ドイツ中西部
米国東部 2 北ヨーロッパ
米国西部 西ヨーロッパ
米国西部 2
米国西部 3

Cost

Device Registry にゾーン冗長性を使用する場合、追加のコストはかからなくなります。

可用性ゾーン構成のサポート

新しいリソース: Azure IoT Operations で Device Registry リソースを作成すると、既定でゾーン冗長が自動的に含まれます。 これ以上構成を行う必要はありません。

すべてのゾーンが正常な場合の動作

次の情報では、ゾーン冗長デバイス レジストリがあり、すべての可用性ゾーンが動作している場合の動作について説明します。

  • ゾーン間のトラフィック ルーティング: 要求は、各可用性ゾーンに自動的に分散されます。 要求は、任意の可用性ゾーンの Device Registry インスタンスに送信される場合があります。

  • ゾーン間のデータ レプリケーション: デバイス データは、可用性ゾーン間で同期的にレプリケートされます。

ゾーン障害時の動作

次の情報では、ゾーン冗長デバイス レジストリがあり、可用性ゾーンで障害が発生した場合の動作について説明します。

  • 検出と応答: Device Registry は可用性ゾーンの障害を検出して自動的に応答するため、可用性ゾーンのフェールオーバーを開始するために何もする必要はありません。
  • 通知: ゾーンがダウンしても、Microsoft から自動的に通知されることはありません。 ただし、 Azure Service Health を使用して、ゾーンの障害を含むサービスの全体的な正常性を把握し、 Service Health アラート を設定して問題を通知することができます。
  • アクティブな要求: 一部のアクティブな要求は削除される可能性があるため、他の一時的な障害と同じ方法で再試行する必要があります。 アプリケーションが一時的な障害に対する回復性があることを確認するには、「 一時的な障害に対する回復性」を参照してください。

  • 予想されるデータ損失: ゾーンの障害によってデータが失われるとは考えられません。

  • 予想されるダウンタイム: ゾーン障害が発生しても、リソースにダウンタイムが発生することはありません。

ゾーンの回復

可用性ゾーンが復旧すると、Device Registry は可用性ゾーンの操作を自動的に復元します。

ゾーンエラーのテスト

Device Registry プラットフォームは、可用性ゾーン間のトラフィック ルーティング、フェールオーバー、フェールバックを管理します。 何も開始する必要はありません。 この機能はフル マネージドであるため、可用性ゾーンの障害プロセスを検証する必要はありません。

リージョン全体の障害に対する回復性

Device Registry は単一リージョン サービスです。 リージョンが使用できなくなった場合、Device Registry リソースも使用できなくなります。

ただし、レジストリのデータは、ペアになっているリージョンにレプリケートされます。 リージョンの停止が長引いた場合、Microsoft はペアリージョンへのフェールオーバーを選択する場合があります。 この場合、レジストリはペアのリージョンで引き続き使用できます。

リージョンのサポート

既定のレプリケーションとフェールオーバーは、デバイス レジストリが使用できるすべてのリージョンでサポートされています。 これらのリージョンはすべてペアになっているためです。

Cost

リージョン間のデータ レプリケーションまたはフェールオーバーには、追加のコストはかからなくなります。

レプリケーションの構成とフェールオーバーの準備

既定では、リージョン間のデータ レプリケーションは、ペアを持つリージョンに Device Registry リソースを作成するときに自動的に構成されます。 このプロセスは既定のオプションであり、ユーザーの介入は必要ありません。

すべてのリージョンが正常な場合の動作

このセクションでは、リージョン間のレプリケーションとフェールオーバーのためにデバイス レジストリが構成されていて、プライマリ リージョンが動作している場合に想定される内容について説明します。

  • リージョン間のデータ レプリケーション: データは、ペアになっているリージョンに自動的にレプリケートされます。 レプリケーションは非同期的に行われます。これは、フェールオーバーが発生した場合に一部のデータ損失が予想されることを意味します。

  • リージョン間のトラフィック ルーティング: 通常の操作では、トラフィックはプライマリ リージョンにのみ流れます。

リージョン障害時の動作

このセクションでは、リージョン間のレプリケーションとフェールオーバー用にデバイス レジストリが構成されていて、プライマリ リージョンで障害が発生した場合に想定される内容について説明します。

  • 検出と応答: Microsoft は、プライマリ リージョンが失われた場合にフェールオーバーを実行することを決定できます。 このプロセスは、プライマリ リージョンの損失後に数時間かかる場合もあれば、一部のシナリオではさらに長くなる場合があります。 Device Registry リソースのフェールオーバーは、他の Azure サービスと同時に実行されない場合があります。

  • 通知: リージョンの障害イベントは、Azure Service Health を使用して監視できます。 リージョン レベルの問題の通知を受け取るアラートを設定します。

  • アクティブな要求: フェールオーバー中にプライマリ リージョンが処理している要求はすべて失われる可能性があります。 クライアントは、フェールオーバーの完了後に要求を再試行する必要があります。

  • 予想されるデータ損失: データは、ペアになっているリージョンに非同期的にレプリケートされます。 その結果、フェールオーバー後に一部のデータ損失が予想されます。 リージョンのフェールオーバー後に 15 分未満のデータ損失が発生する可能性があります。

  • 予想されるダウンタイム: リージョンが失われたときから、ペアになっているリージョンでリソースが使用可能になったときまで、約 24 時間のダウンタイムが予想されます。

  • トラフィックの再ルーティング: フェールオーバー プロセス中に、デバイス レジストリは、ペアのリージョンを指す DNS レコードを更新します。 後続のすべての要求は、ペアになっているリージョンに送信されます。

    レジストリのフェールオーバー操作が完了した後、デバイスとバックエンド アプリケーションのすべての操作は、手動による介入を必要とせずに動作し続ける必要があります。

リージョンの復旧

プライマリ リージョンが復旧すると、デバイス レジストリによってリージョン内の操作が自動的に復元されます。

リージョン障害のテスト

Device Registry プラットフォームは、ペアになっているリージョン間のトラフィック ルーティング、フェールオーバー、フェールバックを管理します。 何も開始する必要はありません。 この機能は完全に管理されているため、ペアになっているリージョンの障害プロセスを検証する必要はありません。