Udostępnij przez


Włączanie odporności stref dla obciążeń platformy Azure

Aby zwiększyć odporność aplikacji na awarie sprzętowe związane ze strefą, zakłócenia sieci i klęski żywiołowe, ważne jest, aby zaprojektować obciążenia platformy Azure pod kątem odporności strefy. W przypadku dystrybucji zasobów w wielu strefach dostępności w regionie zmniejsza się ryzyko awarii pojedynczej strefy wpływającej na usługi krytyczne.

Chociaż najlepszym rozwiązaniem jest rozwiązywanie problemów z odpornością strefy podczas początkowego planowania i wdrażania obciążeń, często należy przekonwertować istniejące nieodporne obciążenia na konfiguracje odporne na strefy. Ogólnie rzecz biorąc, wdrażanie odporności strefowej dla istniejących obciążeń jest proste, a Microsoft nadal upraszcza ten proces. Jednak każda zmiana obciążenia może powodować ryzyko. Po zrozumieniu związanego z nimi ryzyka będziesz w stanie ocenić i określić priorytet obciążeń i usług w ramach tych obciążeń, a następnie zastosować odporność strefową do zasobów o największym wpływie.

W tym artykule opisano kluczowe zagadnienia dotyczące włączania odporności strefy w obciążeniach platformy Azure. Pomaga również zaplanować i wdrożyć pomyślne przejście do bardziej odpornej architektury.

Wskazówka

Jeśli obecnie projektujesz swoje obciążenia lub planujesz przeprowadzenie przeglądu projektu bieżących obciążeń, to ważne jest, aby postępować zgodnie z zaleceniami dotyczącymi projektowania nadmiarowości w ramach Azure Well-Architected Framework (WAF). Przewodnik zaleceń dla zapory sieci web ułatwia projektowanie redundancji obciążeń na wielu poziomach, koncentrując się na krytycznych procesach. W celu zapewnienia obsługi wdrożenia strefy dostępności przedstawiono również strategie, takie jak wdrożenia w wielu regionach i sygnatury wdrażania.

Co to jest odporność strefy?

Usługi platformy Azure mogą być odporne na awarie stref dostępności na dwa podstawowe sposoby:

  • Usługi strefowo nadmiarowe: Wiele usług platformy Azure obsługuje nadmiarowość stref. Te usługi automatycznie replikują dane między strefami dostępności, dystrybuują żądania przychodzące i przejdą w tryb failover do różnych stref podczas awarii strefy. Każda usługa obsługuje te możliwości w sposób zrozumiały dla tej konkretnej usługi. Niektóre usługi są domyślnie strefowo nadmiarowe, podczas gdy inne usługi mogą wymagać skonfigurowania nadmiarowości strefy.

  • Usługi strefowe: Niektóre usługi platformy Azure są strefowe, co oznacza, że można je przypiąć do określonej strefy dostępności. Aby uzyskać odporność na poziomie strefy przy użyciu usługi strefowej, wdróż oddzielne wystąpienia usługi w wielu strefach dostępności. Może być również konieczne zarządzanie dystrybucją ruchu, replikacją danych i trybem failover między wystąpieniami.

Niektóre usługi można wdrożyć w konfiguracji strefowo nadmiarowej lub strefowej. W większości przypadków najlepiej wdrożyć usługi strefowo nadmiarowe, gdy można.

Aby uzyskać więcej informacji, zobacz Typy obsługi stref dostępności.

Procedura włączania strefy

Wykonaj poniższe kroki, aby systematycznie przeglądać obciążenia platformy Azure, ustalać priorytety pod kątem odporności strefy i włączać odporność strefy dla każdego składnika.

Wymagania wstępne

Przed rozpoczęciem wykonaj następujące czynności:

  • Zidentyfikuj każde obciążenie. Obciążenie odnosi się do kolekcji zasobów aplikacji, danych i infrastruktury pomocniczej, które działają razem w celu osiągnięcia zdefiniowanych wyników biznesowych. Aby uzyskać więcej informacji na temat obciążeń i sposobu ich definiowania, zobacz Well-Architected Framework workloads (Obciążenia platformyWell-Architected Framework).

  • Określanie priorytetów przepływów użytkownika i systemu poszczególnych obciążeń. Zapoznaj się ze ścieżkami krytycznymi i zależnościami obciążeń, aby określić, które składniki mają najpierw zapewnić odporność na strefy. Aby uzyskać więcej informacji na temat używania analizy przepływu krytycznego do określania priorytetów przepływów pracy, zobacz Określanie priorytetów obciążeń pod kątem odporności strefy.

  • Przypisz ocenę krytycznej do każdego obciążenia i przepływu. Ta ocena pomaga zrozumieć wpływ potencjalnej awarii na Twoją firmę i kieruje decyzjami dotyczącymi tego, które obciążenia należy priorytetyzować, aby zapewnić odporność strefy. Należy również wziąć pod uwagę dopuszczalną ilość przestojów podczas ponownego konfigurowania obciążeń.

    Możesz użyć taksonomii do klasyfikowania obciążeń na podstawie ich krytyczności. Takie podejście ułatwia skoncentrowanie wysiłków na najważniejszych usługach.

    Rozważmy następującą przykładowy taksonomię, aby sklasyfikować obciążenia.

    Typ obciążenia Description Wpływ zakłóceń
    Krytyczne dla misji Krytyczne przepływy i obciążenia, które muszą być wysoce niezawodne, zawsze dostępne, odporne na awarie i operacyjne Wszelkie zakłócenia podstawowych funkcji natychmiast ryzykuje katastrofalne szkody biznesowe lub wprowadza zagrożenia dla ludzkiego życia.
    Krytyczne dla działania firmy Podstawowe przepływy i obciążenia, które działają ważne funkcje biznesowe Zakłócenia mogą spowodować utratę finansową lub uszkodzenie marki.
    Działalność biznesowa Przyczynia się do wydajności operacji biznesowych, ale poza bezpośrednią obsługą klientów Może tolerować pewien poziom zakłóceń.
    Administracyjny Wewnętrzne przepływy produkcyjne i obciążenia nie są dostosowane do operacji biznesowych Może tolerować zakłócenia.

    Aby uzyskać więcej informacji na temat klasyfikowania obciążeń zgodnie z oceną krytycznej, zobacz Przypisywanie oceny krytycznej do każdego przepływu.

  • Sprawdź, czy regiony, w których znajdują się zasoby platformy Azure, obsługują strefy dostępności. Zapoznaj się z listą regionów platformy Azure. Jeśli region nie obsługuje stref dostępności, rozważ przeniesienie zasobów do regionu, który to robi. Aby uzyskać więcej informacji, zobacz Przenoszenie zasobów platformy Azure między grupami zasobów, subskrypcjami lub regionami.

Krok 1. Określanie priorytetów usług platformy Azure w celu uzyskania odporności strefy

Po określeniu, od których przepływów obciążenia najbardziej ważne jest dla Twojej firmy, możesz skoncentrować się na usługach platformy Azure, od których zależą te przepływy. Niektóre usługi platformy Azure mają większe znaczenie dla Twoich aplikacji niż inne. Określ priorytety tych usług, aby zapewnić, że aplikacje pozostaną dostępne i odporne, jeśli wystąpi awaria strefy.

Skorzystaj z poniższych wskazówek, aby określić priorytety grup usług platformy Azure w oparciu o ich krytyczne znaczenie dla obciążeń. Podczas określania priorytetu usług dla odporności strefy należy wziąć pod uwagę konkretną architekturę aplikacji i wymagania biznesowe.

  1. Zacznij od usług sieciowych. Obciążenia mają tendencję do udostępniania usług sieciowych, więc zwiększenie odporności tych usług może poprawić odporność wielu obciążeń jednocześnie.

    Wiele podstawowych usług sieciowych jest automatycznie z redundantną strefą, lecz powinny być skupione na składnikach takich jak bramy Azure ExpressRoute, Azure VPN Gateway, Azure Application Gateway, Azure Load Balancer i Azure Firewall.

  2. Zwiększ odporność magazynu danych operacyjnych. Operacyjne magazyny danych zawierają cenne dane, których często używa wiele obciążeń, więc poprawa dostępności tych magazynów danych może pomóc wielu obciążeniom.

    Aby uzyskać odporność magazynu danych operacyjnych, skoncentruj się na usługach takich jak Azure SQL Database, Azure SQL Managed Instance, Azure Storage, Azure Data Lake Storage, Azure Cosmos DB, Azure PostgreSQL — elastyczny serwer, Azure MySQL — serwer elastyczny i azure Cache for Redis.

  3. Określanie priorytetów usług obliczeniowych. Te usługi są często łatwe do replikacji i dystrybucji między strefami, ponieważ są bezstanowe.

    Usługi obliczeniowe obejmują usługi Azure Virtual Machines, Azure Virtual Machine Scale Sets, Azure Kubernetes Service (AKS), Azure App Service, App Service Environment, Azure Functions, Azure Service Fabric i Azure Container Apps.

  4. Przejrzyj pozostałe zasoby krytyczne dla działania firmy, z których korzystają przepływy krytyczne. Te zasoby mogą nie być tak krytyczne, jak zasoby wymienione wcześniej, ale nadal odgrywają rolę w funkcjonalności aplikacji i należy je wziąć pod uwagę pod kątem odporności strefy.

  5. Przejrzyj pozostałe zasoby operacyjne firmy. Podejmij świadome decyzje dotyczące tego, czy mają być odporne na awarie strefowe. Ten przegląd obejmuje usługi, które mogą nie być bezpośrednio związane z krytycznymi obciążeniami, ale nadal przyczyniają się do ogólnej wydajności i niezawodności aplikacji.

Krok 2. Ocena metod konfiguracji strefy

Po określeniu priorytetów obciążeń i usług platformy Azure zidentyfikuj podejście wymagane do włączenia obsługi strefy dostępności dla każdej usługi i dowiedz się, co należy zrobić, aby skonfigurować odporność strefy.

Każdy przewodnik po usłudze niezawodności platformy Azure zawiera sekcję opisjącą sposób włączania odporności strefy dla tej usługi. Ta sekcja ułatwia zrozumienie nakładu pracy wymaganego do zapewnienia odporności każdej strefy usługi, dzięki czemu można odpowiednio zaplanować strategię. Aby uzyskać więcej informacji na temat określonej usługi, zobacz Przewodniki dotyczące usługi niezawodności platformy Azure.

Skorzystaj z tabeli konfiguracji strefy , aby szybko zrozumieć podejścia do typowych usług platformy Azure.

Ważne

Jeśli obciążenie obejmuje składniki wdrożone w konfiguracji strefowej (lub pojedynczej strefy), zaplanuj, aby te składniki były odporne na awarie stref. Typowym podejściem jest wdrożenie osobnych instancji w innej strefie dostępności i przełączanie między nimi w razie potrzeby.

Krok 3. Testowanie opóźnienia

Kiedy zwiększasz odporność obciążeń na poziomie stref, rozważ opóźnienia między strefami dostępności. Czasami niektóre starsze systemy nie mogą tolerować niewielkiej ilości dodatkowych opóźnień, które wprowadza ruch między strefami, zwłaszcza w przypadku włączenia replikacji synchronicznej w warstwie danych. Jeśli podejrzewasz, że opóźnienie między strefami może mieć wpływ na obciążenie, uruchom testy przed i po włączeniu odporności strefy. Aby uzyskać więcej informacji na temat wpływu opóźnienia między strefami na aplikację i podejścia w celu ograniczenia problemów z opóźnieniami między strefami, zobacz Zasoby strefowe i odporność strefy.

Podejścia do konfiguracji strefy dla usług platformy Azure

Każda usługa platformy Azure obsługuje określony typ obsługi strefy dostępności, która jest oparta na zamierzonym użyciu usługi i architekturze wewnętrznej. Jeśli masz zasób, który nie jest skonfigurowany do używania stref dostępności (lub zasobu niezonowego ), możesz ponownie skonfigurować go przy użyciu obsługi stref dostępności. Przewodnik po niezawodności dla tej usługi zawiera wskazówki lub linki do instrukcji konfiguracji strefy dostępności.

Ta sekcja zawiera omówienie różnych typów metod konfiguracji strefy i podejścia do poszczególnych usług.

Ważne

Po włączeniu nadmiarowości strefy w zasobie ten zasób staje się automatycznie odporny na awarie strefy. Jeśli używasz konfiguracji strefowej do przypinania zasobu do określonej strefy dostępności, zasób nie jest automatycznie strefowo nadmiarowy. Należy zapewnić odporność na awarię strefy. W przypadku usług strefowych ten artykuł odzwierciedla złożoność i koszt przypisania do strefy. Aby uzyskać więcej informacji na temat dodatkowych kroków w celu osiągnięcia odporności strefy, zobacz przewodnik dotyczący niezawodności usługi.

Tabela konfiguracji strefy zawiera listę obsługiwanych metod konfiguracji strefy dla wielu usług platformy Azure i zawiera link do każdego przewodnika dotyczącego niezawodności dla tej usługi. Przewodnik po niezawodności zawiera informacje o sposobie konfigurowania zasobów usługi niezonowej w celu włączenia obsługi stref dostępności.

W poniższej tabeli opisano każde podejście do konfiguracji strefy, w tym poziom nakładu pracy i przestoju wymaganego do włączenia stref dostępności.

Metoda Description Typowy poziom nakładu pracy Może wymagać przestoju
Zawsze odporna strefa Usługa jest domyślnie odporna na strefy w regionach, które obsługują strefy dostępności. Nie trzeba podejmować żadnych działań. Żaden Nie.
Włączanie Wymagane są minimalne zmiany konfiguracji, takie jak włączanie nadmiarowości strefy w ustawieniach. Proces nie ma wpływu na dostępność, ale należy wziąć pod uwagę wpływ na koszty lub wydajność. Low Nie.
Modyfikacji Prawdopodobnie wymagane są pewne zmiany konfiguracji, takie jak ponowne wdrażanie zasobów zależnych lub modyfikowanie ustawień sieci. Średni Tak
Przesunięcia Wymagane istotne zmiany, takie jak ponowne wdrażanie całych zasobów, aplikacji lub usług lub migrowanie danych do nowych usług. High Tak

Omówienie kosztów włączania obsługi strefy dostępności dla usługi. W przypadku wielu usług włączenie stref dostępności nie powoduje dodania kosztów. Jednak niektóre usługi wymagają określonej warstwy, określonej liczby jednostek pojemności lub obu tych jednostek. Inne usługi pobierają różne stawki w przypadku korzystania ze stref dostępności. W tabeli w następnej sekcji wymieniono typowy wpływ kosztów dla każdej usługi.

Uwaga / Notatka

Informacje przedstawione w tym artykule zawierają podsumowanie typowego podejścia do obsługi strefy dostępności i przedstawiono typowy wpływ na koszty. Jednak niektóre czynniki mogą mieć wpływ na sposób działania konkretnego rozwiązania. Na przykład niektóre usługi są wyświetlane jako zawsze odporne na strefy, ale to oznaczenie ma zastosowanie tylko w określonych regionach lub dla określonych warstw usługi. Użyj tych tabel jako punktu wyjścia, ale przejrzyj inne wymienione zasoby, aby zrozumieć konkretne szczegóły.

Podejście do konfiguracji usług platformy Azure według strefy

Poniższa tabela zawiera podsumowanie obsługi strefy dostępności dla wielu usług platformy Azure i zapewnia podejście, w tym wpływ na koszty, w celu włączenia obsługi strefy dostępności dla każdej usługi.

Usługa Może być strefowo nadmiarowy Może być strefowy Typowe podejście do konfiguracji strefy Typowy wpływ na koszty
Wyszukiwanie AI w usłudze Azure Tak Zawsze odporna strefa N/A
Azure API Management Tak Tak Modyfikacji Wymagana minimalna warstwa
Konfiguracja aplikacji Azure Tak Zawsze odporna strefa N/A
Azure App Service Tak Włączanie Wymagana minimalna warstwa i liczba instancji
Azure App Service – Środowisko App Service Tak Włączanie Wymagana minimalna liczba wystąpień
Azure Application Gateway Tak Tak Zawsze odporna strefa N/A
Azure Backup Tak Przesunięcia Umiarkowany wzrost kosztów
Azure Bastion Tak Tak Przesunięcia Brak wpływu na koszty
Azure Batch Tak Przesunięcia Brak wpływu na koszty dla tej samej liczby maszyn wirtualnych
Azure Blob Storage Tak Włączanie Umiarkowany wzrost kosztów
Azure Cache for Redis — Enterprise Tak Przesunięcia Brak wpływu na koszty
Azure Cache for Redis — Standardowa i Premium Tak Włączanie Wymagana minimalna warstwa
Azure Container Apps Tak Przesunięcia Wymagana minimalna liczba replik
Azure Container Instances Tak Przesunięcia Brak wpływu na koszty
Azure Container Registry Tak Zawsze odporna strefa N/A
Azure Cosmos DB for NoSQL Tak Modyfikacji Brak w przypadku korzystania z automatycznego skalowania lub zapisów w wielu regionach
Azure Data Factory Tak Zawsze odporna strefa N/A
Azure Data Lake Storage Tak Włączanie Umiarkowany wzrost kosztów
Azure Database for MySQL — serwer elastyczny Tak Przesunięcia Wymaga instancji podstawowej oraz instancji o wysokiej dostępności (HA)
Azure Database for PostgreSQL — serwer elastyczny Tak Włączanie Wymaga wystąpień podstawowego i wysokiej dostępności
Azure Databricks Tak Włączanie Brak wpływu na koszty dla tej samej liczby maszyn wirtualnych; umiarkowany wzrost kosztów magazynu
Azure Disk Storage (dyski zarządzane) Tak Tak Włączanie Umiarkowany wzrost kosztów
Elastyczna sieć SAN platformy Azure Tak Przesunięcia Umiarkowany wzrost kosztów
Azure Event Hubs: warstwa dedykowana Tak Zawsze odporna strefa Wymagana minimalna liczba jednostek wydajności (CU)
Azure Event Hubs: wszystkie inne warstwy Tak Zawsze odporna strefa N/A
Brama usługi Azure ExpressRoute Tak Tak Modyfikacji Zależy od warstwy
Azure Files Tak Włączanie Umiarkowany wzrost kosztów
Zapora platformy Azure Tak Tak Modyfikacji Brak wpływu na koszty
Azure Functions Tak Przesunięcia Wymagana minimalna warstwa i liczba instancji
Azure HDInsight Tak Przesunięcia Brak wpływu na koszty dla tej samej liczby węzłów
Azure IoT Hub Tak Zawsze odporna strefa N/A
Azure Key Vault Tak Zawsze odporna strefa N/A
Azure Kubernetes Service (AKS) Tak Przesunięcia Brak wpływu na koszty
Azure Load Balancer Tak Tak Modyfikacji Brak wpływu na koszty
Azure Logic Apps — warstwa Zużycie Tak Zawsze odporna strefa N/A
Azure Logic Apps — warstwa Standardowa Tak Przesunięcia Wymagana minimalna warstwa i liczba instancji
Azure Managed Grafana Tak Wdróż ponownie Umiarkowany wzrost kosztów
Azure Monitor: Log Analytics Tak Zawsze odporna strefa
Azure NetApp Files Tak Przesunięcia Zależy od konfiguracji replikacji
Azure Queue Storage Tak Włączanie Umiarkowany wzrost kosztów
Azure Service Bus Tak Zawsze odporne na strefy N/A
Azure Service Fabric Tak Tak Przesunięcia Brak wpływu na koszty dla tej samej liczby maszyn wirtualnych
Azure Site Recovery Tak Przesunięcia Brak wpływu na koszt usługi Site Recovery, umiarkowany wzrost kosztów magazynu replik
Azure SQL Database: warstwa krytyczne dla działania firmy Tak Włączanie Brak wpływu na koszty
Azure SQL Database: warstwa ogólnego przeznaczenia Tak Włączanie Umiarkowany wzrost kosztów
Azure SQL Database: warstwa Hiperskala Tak Przesunięcia Wymagana minimalna liczba replik
Azure SQL Database: warstwa Premium Tak Włączanie Brak wpływu na koszty
Wystąpienie zarządzane Azure SQL Tak Włączanie Umiarkowany wzrost kosztów
Azure Table Storage Tak Włączanie Umiarkowany wzrost kosztów
Zestawy skalowania maszyn wirtualnych Azure Tak Tak Przesunięcia Brak wpływu na koszty dla tej samej liczby maszyn wirtualnych
Maszyny wirtualne platformy Azure Tak Przesunięcia Brak wpływu na koszty dla tej samej liczby maszyn wirtualnych
Azure Virtual Network Tak Zawsze odporna strefa N/A
Publiczny adres IP Tak Tak Zawsze odporna strefa N/A