Freigeben über


Zuverlässigkeit in Azure-Geräteregistrierung

Die Azure Device Registry speichert Informationen zu Objekten und Geräten in der Cloud. Geräteregistrierung projiziert Ressourcen als Azure-Ressourcen in der Cloud innerhalb einer einzigen Registrierung. Die einzige Registrierung ist eine Quelle der Wahrheit für Geräte- und Objektmetadaten und Ressourcenverwaltungsfunktionen. Die Geräteregistrierung kann in Verbindung mit Azure IoT Operations verwendet werden.

Wenn Sie Azure verwenden, ist Zuverlässigkeit eine gemeinsame Verantwortung. Microsoft bietet eine Reihe von Funktionen zur Unterstützung von Resilienz und Wiederherstellung. Sie sind dafür verantwortlich, zu verstehen, wie diese Funktionen in allen von Ihnen verwendeten Diensten funktionieren, und die Funktionen auswählen, die Sie benötigen, um Ihre Geschäftsziele und Uptime-Ziele zu erfüllen.

In diesem Artikel wird beschrieben, wie Sie die Geräteregistrierung für eine Vielzahl potenzieller Ausfälle und Probleme widerstandsfähig machen, einschließlich vorübergehender Fehler, Ausfall der Verfügbarkeitszone und Regionsausfälle.

Note

Azure IoT Operations umfasst verschiedene andere Komponenten, die über die Geräteregistrierung hinausgehen. Ausführliche Informationen zu den Features für Hochverfügbarkeit und Verhindern von Datenverlust von Azure IoT Einsatz-Komponenten finden Sie unter Häufig gestellten Fragen zu Azure IoT Einsatz.

Resilienz für vorübergehende Fehler

Vorübergehende Fehler sind kurze, zeitweilige Fehler in Komponenten. Sie treten häufig in einer verteilten Umgebung wie der Cloud auf und sind ein normaler Bestandteil von Vorgängen. Vorübergehende Fehler korrigieren sich nach kurzer Zeit. Es ist wichtig, dass Ihre Anwendungen vorübergehende Fehler behandeln können, in der Regel durch Wiederholen betroffener Anforderungen.

Alle in der Cloud gehosteten Anwendungen sollten die Anleitung zur vorübergehenden Fehlerbehandlung von Azure befolgen, wenn sie mit cloudgehosteten APIs, Datenbanken und anderen Komponenten kommunizieren. Weitere Informationen finden Sie unter Empfehlungen zum Umgang mit vorübergehenden Fehlern.

Clients interagieren mit der Geräteregistrierung mithilfe von Azure Resource Manager. Häufig verwenden Sie das Azure-Portal, die Azure CLI oder Azure SDKs, um mit Geräteregistrierungsressourcen zu interagieren, und diese Tools bieten eine automatische Behandlung vorübergehender Fehler. Wenn Sie die Ressourcen-Manager-APIs direkt verwenden, stellen Sie sicher, dass vorübergehende Fehler behandelt werden.

Ausfallsicherheit bei Ausfällen von Verfügbarkeitszonen

Verfügbarkeitszonen sind physisch getrennte Gruppen von Rechenzentren innerhalb einer Azure-Region. Wenn eine Zone ausfällt, kann für die Dienste ein Failover zu einer der verbleibenden Zonen erfolgen.

Die Azure Device Registry ist standardmäßig zonenredundant. Dies bedeutet, dass ihre Daten automatisch in mehreren Verfügbarkeitszonen repliziert werden. Dadurch wird die Resilienz des Diensts verbessert, indem Hochverfügbarkeit bereitgestellt wird. Wenn in einer Zone ein Fehler auftritt, kann der Dienst weiterhin nahtlos in einer anderen Zone ausgeführt werden.

Microsoft verwaltet Setup und Konfiguration für Zonenredundanz in Azure-Geräteregistrierung. Sie müssen keine weitere Konfiguration durchführen, um diese Zonenredundanz zu aktivieren. Microsoft stellt sicher, dass der Dienst für höchste Verfügbarkeit und Zuverlässigkeit konfiguriert ist.

Regionsunterstützung

Die folgende Liste der Regionen unterstützt Verfügbarkeitszonen in der Geräteregistrierung:

Americas Europe
East US Deutschland West Central
USA (Ost) 2 North Europe
West US West Europe
USA, Westen 2
USA, Westen 3

Cost

Es gibt keine zusätzlichen Kosten, um Zonenredundanz für die Geräteregistrierung zu verwenden.

Konfigurieren der Unterstützung von Verfügbarkeitszonen

Neue Ressourcen: Wenn Sie eine Geräteregistrierungsressource in Azure IoT Operations erstellen, enthält sie standardmäßig Zonenredundanz. Sie müssen keine weitere Konfiguration durchführen.

Verhalten, wenn alle Zonen fehlerfrei sind

In den folgenden Informationen wird beschrieben, was passiert, wenn Sie über eine zonenredundante Geräteregistrierung verfügen und alle Verfügbarkeitszonen betriebsbereit sind:

  • Datenverkehrsrouting zwischen Zonen: Anfragen werden automatisch über jede Verfügbarkeitszone verteilt. In einer beliebigen Verfügbarkeitszone kann eine Anforderung an eine Instanz des Geräteregisters gesendet werden.

  • Datenreplikation zwischen Zonen: Gerätedaten werden synchron über Verfügbarkeitszonen repliziert.

Verhalten bei einem Zoneausfall

In den folgenden Informationen wird beschrieben, was passiert, wenn sie über eine zonenredundante Geräteregistrierung verfügen und eine Verfügbarkeitszone einen Ausfall erlebt.

  • Erkennung und Reaktion: Da die Geräteregistrierung Fehler in einer Verfügbarkeitszone erkennt und automatisch reagiert, müssen Sie nichts tun, um ein Verfügbarkeitszonenfailover zu initiieren.
  • Benachrichtigung: Microsoft benachrichtigt Sie nicht automatisch, wenn eine Zone deaktiviert ist. Sie können jedoch Azure Service Health verwenden, um die allgemeine Integrität des Diensts zu verstehen, einschließlich aller Zonenfehler, und Sie können Dienststatuswarnungen einrichten, um Sie über Probleme zu informieren.
  • Aktive Anforderungen: Einige aktive Anforderungen werden möglicherweise verworfen und müssen daher auf die gleiche Weise wie andere vorübergehende Fehler wiederholt werden. Um sicherzustellen, dass Ihre Anwendung für vorübergehende Fehler widerstandsfähig ist, lesen Sie " Resilienz für vorübergehende Fehler".

  • Erwarteter Datenverlust: Es wird nicht erwartet, dass ein Zonenfehler zu Datenverlusten führt.

  • Erwartete Ausfallzeiten: Es wird nicht erwartet, dass ein Zonenfehler zu Ausfallzeiten für Ihre Ressourcen führt.

Zonenwiederherstellung

Wenn die Verfügbarkeitszone wiederhergestellt wird, stellt die Geräteregistrierung Vorgänge in der Verfügbarkeitszone automatisch wieder her.

Test auf Zonenfehler

Die Device-Registry-Plattform verwaltet Datenverkehrrouting, Failover und Failback über Verfügbarkeitszonen hinweg. Sie brauchen nichts zu initiieren. Da dieses Feature vollständig verwaltet wird, müssen Sie keine Fehlerprozesse der Verfügbarkeitszone überprüfen.

Widerstandsfähigkeit bei regionalen Ausfällen

Die Geräteregistrierung ist ein Dienst für eine einzelne Region. Wenn die Region nicht verfügbar ist, sind Ihre Geräteregistrierungsressourcen ebenfalls nicht verfügbar.

Die Daten Ihrer Registrierung werden jedoch in die gekoppelte Region repliziert. Im Falle eines länger anhaltenden Ausfalls in einer Region kann Microsoft entscheiden, auf die gekoppelte Region auszuweichen. In diesem Fall ist Ihre Registrierung weiterhin in der gekoppelten Region verfügbar.

Regionsunterstützung

Die Standardreplikation und das Failover werden in allen Regionen unterstützt, in denen die Geräte-Registrierung verfügbar ist, da alle diese Regionen miteinander gekoppelt sind.

Cost

Es gibt keine zusätzlichen Kosten für die regionsübergreifende Datenreplikation oder das Failover.

Konfigurieren der Replikation und Vorbereiten des Failovers

Standardmäßig wird die regionsübergreifende Datenreplikation automatisch konfiguriert, wenn Sie Geräteregistrierungsressourcen in einer Region mit einem Paar erstellen. Dieser Vorgang ist eine Standardoption und erfordert keinen Eingriff von Ihnen.

Verhalten, wenn alle Regionen funktionsfähig sind

In diesem Abschnitt wird beschrieben, was Sie erwarten müssen, wenn eine Geräteregistrierung für die regionsübergreifende Replikation und das Failover konfiguriert ist und die primäre Region betriebsbereit ist.

  • Datenreplikation zwischen Regionen: Daten werden automatisch in den gekoppelten Bereich repliziert. Die Replikation erfolgt asynchron, was bedeutet, dass bei einem Failover ein Datenverlust erwartet wird.

  • Datenverkehrsrouting zwischen Regionen: In normalen Vorgängen fließt der Datenverkehr nur in die primäre Region.

Verhalten während eines Regionenausfalls

In diesem Abschnitt wird beschrieben, was Sie erwarten müssen, wenn eine Geräteregistrierung für die regionsübergreifende Replikation und das Failover konfiguriert ist, und es gibt einen Ausfall in der primären Region.

  • Erkennung und Reaktion: Microsoft kann sich entscheiden, ein Failover durchzuführen, wenn die primäre Region verloren geht. Dieser Vorgang kann mehrere Stunden nach dem Verlust der primären Region oder sogar länger in einigen Szenarien dauern. Das Failover von Geräteregistrierungsressourcen erfolgt möglicherweise nicht gleichzeitig mit anderen Azure-Diensten.

  • Benachrichtigung: Regionsfehlerereignisse können über azure Service Health überwacht werden. Richten Sie Warnungen ein, um Benachrichtigungen über Probleme auf Regionsebene zu erhalten.

  • Aktive Anforderungen: Alle Anforderungen, die der primäre Bereich während eines Failovers verarbeitet, gehen wahrscheinlich verloren. Clients sollten nach Abschluss des Failovers Anforderungen wiederholen.

  • Erwarteter Datenverlust: Daten werden asynchron in den gekoppelten Bereich repliziert. Daher wird nach dem Failover ein Datenverlust erwartet. Nach einem Regionsfailover können Sie weniger als 15 Minuten Datenverlust erwarten.

  • Erwartete Ausfallzeit: Rechnen Sie mit einer Ausfallzeit von ungefähr 24 Stunden ab dem Zeitpunkt, an dem die Region ausfällt, bis die Ressource in der gekoppelten Region verfügbar ist.

  • Datenverkehrsumleitung: Während des Failovervorgangs aktualisiert die Geräteregistrierung DNS-Einträge, um auf den gekoppelten Bereich zu verweisen. Alle nachfolgenden Anfragen werden an die gekoppelte Region gesendet.

    Nach Abschluss des Failover-Vorgangs für das Register wird erwartet, dass alle Operationen des Geräts und der Backend-Anwendungen ohne manuelle Eingriffe weiter funktionieren.

Regionswiederherstellung

Wenn die primäre Region wiederhergestellt wird, stellt die Geräteregistrierung Vorgänge in der Region automatisch wieder her.

Test auf Regionsfehler

Die Device-Registry-Plattform verwaltet Datenverkehrrouting, Failover und Failback über gekoppelte Regionen hinweg. Sie brauchen nichts zu initiieren. Da dieses Feature vollständig verwaltet wird, müssen Sie keine Fehlerprozesse mit gekoppelten Regionen überprüfen.