Die Dickerson-Hierarchie der Zuverlässigkeit
- 3 Minuten
Die Karte für den Lernpfad "Zuverlässigkeit verbessern" basiert auf einem Modell aus der Website-Zuverlässigkeitstechnik, die dickerson Hierarchy of Reliability genannt wird. Mikey Dickerson war ein SRE, der gründungsadministrator der United States Digital Services wurde. Er schuf diese Hierarchie, während er vor einer der größten Zuverlässigkeitskrisen steht.
Das Modell wird nach Abraham Maslows Hierarchie der Bedürfnisse gemustert, die die menschliche Motivation anhebt. Wie bei der Hierarchie von Maslow müssen Sie sicherstellen, dass jede der unteren Ebenen zuerst behoben wurde, um die Hierarchie zu verbessern. Die Ebenen, auf denen wir uns in diesem Lernpfad von unten nach oben konzentrieren, sind:
Überwachung
Diese Stufe ist die wichtige Grundlage, auf der die anderen Ebenen ruhen. Es ist die Quelle von Informationen, die es Ihnen ermöglicht, konkrete Gespräche über Zuverlässigkeit in Ihrer Organisation basierend auf objektiven Daten zu führen. Wenn Sie etwas ändern möchten, können Sie sich auf diese Weise ein Bild über die Auswirkung machen. In noch starkem Sinne ist diese Praxis, wie Sie wissen, ob die Dinge besser werden oder nicht. Erst wenn Sie über gute Kenntnisse zum Thema „Überwachung“ verfügen, können Sie den Rest der Aufgaben abschließen.
Reaktion auf Vorfälle
Jede Produktionsumgebung hat einen Ausfall irgendeiner Art. Es gibt keine Disputierung dieser Tatsache. Die Fragen werden dann "was tun Sie, wenn ein Vorfall auftritt? Was geschieht, wenn Systeme ausfallen und Kunden betroffen sind? Sie benötigen einen Standardprozess, der effektiv darin ist, die Prioritäten festzulegen, die richtigen Ressourcen einzubinden und dann die Problematik zu beheben. Gleichzeitig möchten Sie auch sicherstellen, dass Sie mit den Projektbeteiligten über das Problem kommunizieren.
Überprüfung nach dem Vorfall (Lernen von Fehlern)
Dieser Prozess ermöglicht es uns, unsere Betriebspraktiken zu erhöhen, indem wir die Erfahrungen der einzelnen wichtigen Vorfälle gemeinsam untersuchen, überprüfen und diskutieren. Die Überprüfung nach dem Vorfall ermöglicht es uns, von Fehlern zu lernen und ist entscheidend für die Zuverlässigkeit der Arbeit.
Test/Release (Bereitstellung)
Die nächste Stufe nach oben konzentriert sich auf unsere Test-, Release- und Bereitstellungsprozesse. Sie können sich diese Ebene vorstellen als "wie gut sind Sie bei der Erstellung der Systeme und Prozesse, die Probleme erfassen können, bevor sie Vorfälle verursachen?"
Kapazitätsplanung/Skalierung
Erfolg und das mit ihm einhergehende Wachstum kann ebenso eine Bedrohung für die Zuverlässigkeit sein wie jedes Problem eines Systems. Ein Kunde kann den Unterschied zwischen einem System nicht erkennen, das unten liegt, da es einen Fehler im Code gibt, und einer, der unten ist, weil er nicht in der Lage ist, die Last zu vieler Personen zu verarbeiten, die versuchen, gleichzeitig darauf zuzugreifen. Diese Hierarchieebene weist uns darauf hin, dass wir auf die Kapazitätsplanung und Skalierung als Methoden zur Bewältigung dieser Bedrohung achten.
Entwicklungsprozess und Benutzerfreundlichkeit
Es gibt zwei weitere Ebenen in der Hierarchie, die nicht im Lernpfad "Zuverlässigkeit verbessern" behandelt werden: der Entwicklungsprozess und die Arbeit, die zu einer guten Benutzererfahrung (UX) führt. Diese beiden Themen werden nicht im Lernpfad "Zuverlässigkeit verbessern " besprochen, aber andere gute Lernmodule zu diesen Themen sind verfügbar.
Wir haben ein separates Lernmodul für jede Ebene in der Hierarchie der Zuverlässigkeit erstellt. Wir hoffen, dass Sie uns für alle fünf Module in diesem Lernpfad beitreten.