Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Na platformie Azure zasób strefowy to zasób przypięty do jednej strefy. Ponieważ zasób strefowy znajduje się w pojedynczej strefie dostępności, nie jest odporny na strefy. Jeśli strefa zawierająca zasób ma problem, zasób prawdopodobnie doświadczy przestoju.
Niektóre usługi platformy Azure wymagają lub umożliwiają wdrażanie zasobów strefowych. Możesz zdecydować się na wdrożenie zasobu strefowo z powodu zagadnień związanych z opóźnieniami lub określonych wymagań dotyczących usługi. Możesz przypiąć poszczególne zasoby lub zestawy powiązanych zasobów do pojedynczej strefy.
W tym artykule opisano scenariusze, w których można wybrać wdrożenie zasobów strefowych zamiast zasobów strefowo nadmiarowych. Podkreśla również zagadnienia i obowiązki wymagane do zapewnienia odporności rozwiązania na awarie stref.
Typy wdrożeń zasobów
Na platformie Azure tylko niektóre typy wdrożeń zapewniają odporność strefy. W poniższej tabeli porównaliśmy trzy typy wdrożeń zasobów i opisano ich odporność strefy, dystrybucję stref, opcje konfiguracji i zalecenia.
| Typ wdrożenia zasobu | Obsługa odporności strefy | Rozkład strefy | Sposób konfigurowania | Rekomendacja |
|---|---|---|---|---|
| Zone-redundant | Zawsze odporne na strefy | Zasoby strefowo nadmiarowe są rozmieszczone w wielu strefach i są odporne na awarie stref. Jeśli wystąpi awaria w jednej strefie, usługa może nadal działać w innych strefach. | Niektóre zasoby o strefowej nadmiarowości zapewniają automatyczną redundancję w różnych strefach dostępności, podczas gdy inne zasoby wymagają ręcznego włączenia nadmiarowości strefowej. Sprawdź wskazówki dotyczące niezawodności usługi, aby sprawdzić, czego wymaga usługa, aby włączyć odporność. | Zawsze używaj zasobów strefowo nadmiarowych, jeśli to możliwe, zwłaszcza we wdrożeniach produkcyjnych. |
| Zonal | Nieautomatyczne. To twoja odpowiedzialność, aby włączyć odporność strefy, jeśli tak zdecydujesz. Zasoby strefowe są odizolowane od błędów w innych strefach, ale awaria własnej strefy może spowodować przestój. |
Należy wybrać strefę dla zasobu. | Jeśli masz wiele zasobów, które muszą być wyrównane do strefy (umieszczone w tej samej strefie), musisz skonfigurować tę samą strefę dla każdego zasobu. | Używaj zasobów strefowych tylko wtedy, gdy istnieje wyraźna potrzeba. Aby zapewnić rozwiązanie odporne na awarie stref, należy zaprojektować i wdrożyć rozwiązanie wielostrefowe. |
| Niezonowe (regionalne) | Żaden | Jeśli region zapewnia obsługę strefy dostępności, platforma Azure może używać dowolnej strefy w regionie. | Nie ma dostępnej konfiguracji strefy dla zasobów niezonowych. | Ponieważ zasoby niezonowe nie mogą być odporne na strefy, unikaj niezonalnych wdrożeń dla wszystkich obciążeń produkcyjnych w regionach, które mają strefy dostępności. |
Aby uzyskać więcej informacji na temat stref dostępności i wdrożeń zasobów, zobacz Strefy dostępności.
Obciążenia łączące zasoby strefowo nadmiarowe i strefowe
Wiele obciążeń roboczych łączy zasoby strefowo-redundantne i strefowe. Na przykład obciążenie może obejmować zestaw strefowych maszyn wirtualnych dla warstwy bazy danych, strefowo nadmiarowy serwer internetowy hostowany w usłudze Azure App Service oraz strefowo nadmiarowy moduł równoważenia obciążenia do wysyłania ruchu do maszyn wirtualnych bazy danych.
W przypadku łączenia zasobów strefowych i strefowo nadmiarowych w obciążeniu należy wziąć pod uwagę zachowanie poszczególnych zasobów i ogólnego rozwiązania w przypadku wystąpienia problemu ze strefą dostępności. Zazwyczaj usługi strefowo nadmiarowe automatycznie odtwarzają się po awarii strefy, przy minimalnej lub zerowej utracie danych, a firma Microsoft zarządza całym procesem. W przypadku zasobów strefowych odpowiadasz za konfigurowanie zautomatyzowanego trybu failover lub wykonywanie działań związanych z odzyskiwaniem ręcznym. Aby dowiedzieć się, jak każda usługa zachowuje się podczas awarii strefy, zrozumieć Twoje obowiązki a obowiązki firmy Microsoft, oraz monitorować kondycję usług podczas zdarzeń awaryjnych, zobacz przewodnik dotyczący niezawodności usług.
Kiedy należy używać wdrożenia strefowego
Używaj zasobów strefowych tylko wtedy, gdy istnieje wyraźna potrzeba. Typowe przyczyny wdrożenia z jedną strefą obejmują przypadki, w których zasób musi być strefowy, usługa jest dostępna tylko w określonej strefie lub obciążenie jest bardzo wrażliwe na opóźnienia między strefami.
Ważne
Niektóre usługi Azure umożliwiają wybór między wdrożeniami strefowymi i strefowo redundantnymi. Jeśli nie masz silnego powodu, aby korzystać z wdrożenia strefowego, użyj wdrożenia z nadmiarowością strefową.
Zasoby wymagające wdrożeń strefowych
Niektóre usługi platformy Azure obsługują tylko wdrożenia strefowe i nie udostępniają wdrożeń strefowo nadmiarowych.
Maszyny wirtualne są zasobem strefowym. Zestawy skalowania maszyn wirtualnych umożliwiają tworzenie zestawów maszyn wirtualnych. Zestawy skalowania maszyn wirtualnych mogą być skonfigurowane do działania w wielu strefach, co oznacza, że maszyny wirtualne w zestawie są rozlokowane w różnych strefach. Zestawy skalowania to dobry sposób na osiągnięcie odporności strefy dla wielu obciążeń opartych na maszynach wirtualnych.
Wskazówka
W przypadku wdrażania wielu maszyn wirtualnych realizujących podobne funkcje zalecamy używanie zestawów skalowania rozciągających się na strefy zamiast pojedynczych instancji maszyn wirtualnych wdrażanych osobno.
Innym przykładem jest usługa Azure NetApp Files, która obsługuje wdrażanie woluminów w jednej strefie. Usługa umożliwia również replikowanie między wieloma strefowymi woluminami.
Niektóre usługi udostępniają opcje dostępne tylko w określonych strefach. Na przykład określone typy maszyn wirtualnych używające zaawansowanych procesorów graficznych (GPU) mogą być dostępne tylko w określonych strefach w regionie, co oznacza, że nie można ich wdrożyć w wielu strefach. Aby sprawdzić, które regiony i strefy obsługują potrzebne typy maszyn wirtualnych, użyj następujących zasobów:
Aby sprawdzić typy maszyn wirtualnych dostępne w każdym regionie, zobacz Dostępność produktów według regionów.
Aby sprawdzić obsługiwane typy i rozmiary maszyn wirtualnych w każdej strefie określonego regionu, zobacz Sprawdzanie dostępności jednostki SKU maszyny wirtualnej.
Jeśli potrzebny typ maszyny wirtualnej jest dostępny tylko w pojedynczej strefie w regionie, którego używasz, możesz rozważyć wdrożenie strefowe dla tej maszyny wirtualnej, a następnie znaleźć inne sposoby, aby maszyna wirtualna mogła być odporna na awarie strefy. Należy jednak nadal upewnić się, że inne części rozwiązania są odporne na awarie w strefach.
Aby uzyskać więcej informacji, zobacz Usługi platformy Azure, które obsługują strefy dostępności.
Opóźnienie między strefami
Jeśli masz obciążenie, które jest niezwykle wrażliwe na opóźnienia, możesz użyć zasobów strefowych zamiast zasobów strefowo nadmiarowych, nawet jeśli usługa obsługuje wdrożenia strefowo nadmiarowe.
Sieć o małych opóźnieniach łączy strefy dostępności z opóźnieniem międzystrefowym, zwykle poniżej dwóch milisekund. W przypadku większości obciążeń opóźnienie między strefami nie jest problemem. Zalety odporności rozprzestrzeniania zasobów w różnych strefach dostępności są ważniejsze niż minimalny wpływ na wydajność wysyłania ruchu między strefami. Jednak kilka obciążeń jest bardzo wrażliwych na opóźnienia między strefami. Te obciążenia mogą obejmować następujące scenariusze:
Starsze aplikacje lokalne: Niektóre starsze obciążenia mogą zawierać aplikacje, które zostały pierwotnie zaprojektowane dla środowiska lokalnego. Te obciążenia zakładają, że składniki, takie jak bazy danych i inne aplikacje i usługi, są kolokowane na tym samym hoście lub w bliskiej odległości fizycznej.
Bardzo duża replikacja synchroniczna: Aplikacje stanowe i bazy danych czasami wykonują bardzo dużą liczbę zapisów przy użyciu replikacji synchronicznej. Replikacja synchroniczna oznacza, że dane są zapisywane w wielu replikach przed ukończeniem operacji zapisu. Dystrybucja replik w różnych strefach dostępności zwiększa odporność, ale w przypadku korzystania z replikacji synchronicznej opóźnienie między strefami może zwiększyć opóźnienie zapisu obciążenia. To zwiększone opóźnienie nie jest zwykle znaczące, ale ze względu na sposób projektowania niektórych aplikacji czasami może stać się problematyczne na dużą skalę.
Ważne
Nietypowe jest to, że obciążenia są wrażliwe na opóźnienia między strefami. Nie zakładaj, że twoje obciążenie jest dotknięte, chyba że przetestujesz opóźnienie dla swoich konkretnych potrzeb i wymagań obciążenia.
Jeśli podejrzewasz, że opóźnienie między strefami ma wpływ na obciążenie, przetestuj jego wpływ w realistycznym środowisku, wykonując następujące kroki dla określonego obciążenia:
Zdefiniuj dopuszczalne wymagania dotyczące wydajności. Ruch między strefami zwiększa niewielkie opóźnienie, ale jest niewielki w przypadku większości obciążeń. Zdefiniuj, jak wygląda akceptowalna wydajność dla twojego obciążenia roboczego.
Uruchom test wydajnościowy w jednej strefie dostępności. Ustanów zestaw podstawowych metryk wydajności.
Ważne
Przetestuj obciążenie, w tym aplikacje, protokoły, konfigurację i region świadczenia usługi Azure. Użyj realistycznego obciążenia. Testy porównawcze i testy syntetyczne nie są wystarczające, ponieważ nie pokazują, jak działa rozwiązanie.
Włącz replikację między strefami. W zależności od używanych komponentów można włączyć strefową nadmiarowość lub przenieść repliki między strefami.
Ponowne uruchamianie testów wydajnościowych. Zbierz te same metryki, jakie zebrałeś wcześniej.
Porównaj wpływ wydajności na wymagania. Użyj wymagań i danych wydajności, aby podjąć świadomą decyzję o kompromisie między opóźnieniami a odpornością na awarie strefy.
Jeśli test pokazuje, że opóźnienie jest niedopuszczalnie wysokie dla obciążenia, rozważ wykonanie następujących czynności:
Spróbuj użyć innego zestawu stref. Może istnieć niewielka zmienność opóźnienia między różnymi strefami, ponieważ mogą mieć różne odległości fizyczne od siebie.
Wskazówka
Jeśli testujesz w ramach subskrypcji platformy Azure, zapoznaj się z logicznym mapowaniem stref fizycznych , aby upewnić się, że testujesz zestawy oczekiwanych stref fizycznych.
Jeśli istnieje inny region świadczenia usługi Azure spełniający ogólne potrzeby dotyczące rezydencji danych i innych czynników, spróbuj użyć wielu stref w tym regionie.
Zastanów się, czy możesz przeprojektować aplikację, aby zminimalizować wymaganą komunikację między strefami. Na przykład można skonsolidować wiele małych operacji bazy danych w jedną operację. Takie podejście może zmniejszyć wpływ opóźnienia na obciążenie.
Jeśli żadna z tych akcji nie pomoże, rozważ uruchomienie określonego obciążenia lub składników w jednej strefie dostępności przy użyciu strefowych maszyn wirtualnych i innych obsługiwanych usług platformy Azure. Następnie ponosisz odpowiedzialność za zapewnienie odporności składników strefowych na awarie strefowe. Zapoznaj się z resztą tego artykułu, aby zrozumieć swoje obowiązki i niektóre podejścia do rozważenia.
Twoje obowiązki związane z wdrożeniem strefowym
Zasób strefowy jest zagrożony przestojem, gdy w strefie dostępności występuje awaria. Podczas wdrażania zasobu strefowego odpowiadasz za odporność obciążenia na awarie na poziomie strefy.
Ważne
Zasoby strefowe nie są z natury odporne na awarie stref. Należy zaprojektować sposoby ograniczania ryzyka awarii strefy, opracowując plan, który uwzględnia scenariusze awarii strefy.
Aby zapewnić odporność zasobów strefowych na awarie strefowe, należy wziąć pod uwagę następujące elementy:
Wdrażanie i konfiguracja wielu zasobów: Ręczne wdrażanie oddzielnych zasobów strefowych w różnych strefach lub regionach. Ustal, jak zachować spójność konfiguracji w każdym zasobie. Użycie infrastruktury jako kodu (IaC) jest najlepszym rozwiązaniem, ponieważ umożliwia szybkie wdrażanie wielu identycznych zasobów.
Routing i dystrybucja ruchu: Należy wybrać składnik modułu równoważenia obciążenia, upewnić się, że jest odporny na strefy i skonfigurować go do wysyłania ruchu między zasobami w różnych strefach. Typowo konfiguruje się zasady routingu (takie jak aktywne-aktywne lub aktywne-pasywne), zautomatyzowane kontrole kondycji oraz procesy przełączania awaryjnego. Aby uzyskać więcej informacji, zobacz Opcje równoważenia obciążenia.
Replikacja lub kopia zapasowa danych: W przypadku zasobów stanowych odpowiadasz za ochronę przechowywanych w nich danych i zapewnienie, że są one bezpiecznie przechowywane w wielu strefach. Typowym podejściem jest skonfigurowanie replikacji do innego wystąpienia usługi w innej strefie dostępności. W niektórych sytuacjach można zamiast tego polegać na kopiach zapasowych. Jednak kopie zapasowe wymagają dłuższego czasu odzyskiwania podczas awarii strefy, co oznacza konieczność wyższego docelowego czasu odzyskiwania (RTO). Powodują one również większą utratę danych, co wymaga wyższego celu punktu odzyskiwania (RPO).
Implementacja procesu wykrywania awarii strefy i procesu reagowania: Należy określić, jak monitorować kondycję zasobów strefowych, definiować warunki oznaczające je jako w złej kondycji i wyzwalać akcje odpowiedzi, takie jak przywracanie operacji w innej strefie lub regionie.
Procesy odzyskiwania strefy: Po odzyskaniu strefy ponosisz odpowiedzialność za wszelkie wymagane akcje odzyskiwania, takie jak przywrócenie do zasobów w strefie podstawowej.
Typowe podejścia do odporności wdrożenia strefowego
Aby podejmować świadome decyzje dotyczące osiągnięcia odporności strefy dla zasobów strefowych, należy wziąć pod uwagę następujące czynniki:
Przejrzyj twój cały zakres pracy. Dowiedz się, jak każdy składnik zachowuje się podczas zdarzeń w dół strefy, w tym strefowo nadmiarowych, strefowych i nieregionalnych zasobów. Skorzystaj z przewodnika dotyczącego niezawodności dla każdej usługi, aby dowiedzieć się, jak działa usługa w scenariuszach awarii strefowych i jak monitorować kondycję usług pod kątem takich awarii.
Omówienie dozwolonej utraty danych podczas awarii strefy. Twój RPO określa, ile utraty danych można zaakceptować.
Wiele zasobów strefowo nadmiarowych platformy Azure zapewnia zerowy RPO (Recovery Point Objective) dla awarii stref, co oznacza, że nie dochodzi do utraty danych. Zazwyczaj osiąga się ten RPO przez synchroniczne replikowanie wszystkich zmian w strefach.
Podczas planowania wdrożenia strefowego należy upewnić się, że w przypadku awarii strefy można spełnić wymagania obciążenia dotyczące celu punktu odzyskiwania (RPO).
Poznaj dozwolony przestój podczas awarii strefy. Twój RTO określa, ile przestojów możesz zaakceptować.
Zasoby strefowo nadmiarowe platformy Azure zwykle zapewniają bardzo małą wartość czasu odzyskiwania operacyjnego (RTO) dla awarii strefy i zwykle wymagają zaledwie kilku sekund przestoju.
Podczas planowania wdrożenia strefowego należy upewnić się, że można spełnić wymagania celu czasu odzyskiwania obciążenia. Jeśli masz niski RTO, może być konieczność stosowania zautomatyzowanych procesów wykrywania i odzyskiwania. Wyższy RTO (Czas Odzyskiwania) zapewnia większą elastyczność procesów reakcji.
Omówienie kosztów. Zasoby strefowe są zwykle rozliczane indywidualnie, dlatego wdrażanie wielu zasobów strefowych może zwiększyć koszt zasobu.
Projektowanie wdrożenia strefowego pod kątem odporności
Podczas projektowania wdrożenia strefowego pod kątem odporności należy rozważyć, czy używasz stref dostępności do osiągnięcia wysokiej dostępności , czy odzyskiwania po awarii. Rozróżnienie między tymi pojęciami opiera się na wymaganiach RTO i RPO.
Jeśli masz wymagania dotyczące niskiego RTO i niskiego RPO, musisz traktować strefy dostępności jako konstrukcję wysokiej dostępności. Jeśli jednak cel czasu odzyskiwania i cel punktu odzyskiwania są wyższe, możesz traktować strefy dostępności jako konstrukcję odzyskiwania po awarii . Aby uzyskać więcej informacji, zobacz Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii. Warstwa obciążenia roboczego może pomóc w określeniu wymagań i niezbędnych działań.
Projektowanie pod kątem wysokiej dostępności
Rozważ wdrożenie własnej architektury o wysokiej dostępności w wielu strefach. Architektura o wysokiej dostępności wymaga automatycznej oraz częstej replikacji danych między składnikami wdrożonymi w wielu strefach, i automatycznego przełączania na tryb awaryjny między tymi składnikami w przypadku awarii strefy.
Niektóre aplikacje wdrażane na maszynach wirtualnych strefowych zapewniają wbudowaną obsługę wysokiej dostępności, na przykład dzięki obsłudze replik. Jeśli na przykład używasz programu SQL Server na maszynach wirtualnych platformy Azure, grupy dostępności zapewniają routing ruchu i możliwości trybu failover. Możesz wybrać, czy chcesz użyć replikacji synchronicznej, czy asynchronicznej. Aby uzyskać więcej informacji, zobacz Ciągłość działania, wysoka dostępność i odzyskiwanie po awarii dla programu SQL Server na maszynach wirtualnych platformy Azure.
Projektowanie po kątem odzyskiwania po awarii
Odzyskiwanie po awarii różni się od wysokiej dostępności, ponieważ większy przestój i utrata danych są akceptowalne w scenariuszu awarii. RTO i RPO są zwykle mierzone w godzinach lub dłużej.
Plan odzyskiwania po awarii pomaga przygotować się do różnych scenariuszy i zdefiniować sposób reagowania przy użyciu kombinacji zautomatyzowanych i ręcznych procesów.
Poniższe metody odzyskiwania po awarii mogą pomóc podczas planowania wdrożenia strefowego:
Odzyskiwanie po awarii między strefami usługi Azure Site Recovery: Takie podejście jest przydatne, gdy potrzebna jest asynchroniczna replikacja na poziomie dysku między maszynami wirtualnymi w różnych strefach. Aby uzyskać więcej informacji, zobacz Włączenie odzyskiwania po awarii maszyn wirtualnych Azure między strefami dostępności.
Odzyskiwanie po awarii między regionami usługi Site Recovery: Usługa Site Recovery obsługuje odzyskiwanie po awarii między regionami i opiera się na replikacji asynchronicznej. Takie podejście umożliwia przejście w tryb failover do strefy w innym regionie świadczenia usługi Azure zamiast innej strefy w regionie podstawowym. Aby uzyskać więcej informacji, zobacz Replikowanie maszyn wirtualnych platformy Azure do innego regionu świadczenia usługi Azure.
Odzyskiwanie po awarii oparte na kopii zapasowej: Jeśli rozwiązanie może tolerować wysoki RTO i wysoki RPO, rozważ użycie kopii zapasowych jako strategii odzyskiwania po awarii. Jeśli strefa ulegnie awarii, możesz przywrócić kopie zapasowe do innej strefy lub regionu. Należy również rozważyć, czy wstępnie utworzyć inne zasoby platformy Azure w swoim rozwiązaniu, czy też utworzyć je podczas procesu przełączania awaryjnego.
W architekturze strefowej często odpowiadasz za przechowywanie i replikowanie tych kopii zapasowych.
Azure Backup to powszechnie używana zarządzana usługa tworzenia kopii zapasowych. Obsługuje strefowo nadmiarowe kopie zapasowe i kopie zapasowe replikowane geograficznie w sparowanych regionach świadczenia usługi Azure. Niektóre aplikacje, takie jak SQL Server na maszynach wirtualnych Azure, obejmują również wbudowane funkcje dedykowane kopiom zapasowym dla aplikacji.