Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule dowiesz się, jak zaprojektować rozciągnięty klaster vSAN dla prywatnej chmury Azure VMware Solution.
Background
Globalna infrastruktura Azure jest podzielona na regiony. Każdy region wspiera usługi dla określonego obszaru geograficznego. W każdym regionie Azure buduje izolowane i redundantne wyspy infrastruktury, które nazywane są strefami dostępności (AZ). AZ działa jako granica do zarządzania zasobami. Dostępne zasoby obliczeniowe i inne zasoby dla strefy dostępności (AZ) są ograniczone i mogą zostać wyczerpane przez zapotrzebowanie klientów. AZ jest zbudowane w taki sposób, aby było niezależnie odporne, co oznacza, że awarie w jednym AZ nie wpływają na inne AZ.
Dzięki rozwiązaniu Azure VMware Hosty ESXi wdrożone w standardowym klastrze vSphere tradycyjnie znajdują się w jednej strefie dostępności platformy Azure (AZ) i są chronione przez wysoką dostępność vSphere. Nie chroni jednak obciążeń przed awarią modułu AZ platformy Azure. Aby zabezpieczyć się przed awarią AZ, pojedynczy klaster vSAN można skonfigurować, aby rozciągał się na dwie oddzielne strefy dostępności, co nazywa się rozproszonym klastrem vSAN.
Klastry rozciągnięte umożliwiają konfigurację domen awaryjnych vSAN pomiędzy dwoma strefami dostępności, aby powiadomić serwer vCenter, że hosty znajdują się w każdej strefie dostępności (AZ). Każda domena awarii jest nazwana po AZ, w którym się znajduje, aby zwiększyć przejrzystość. Gdy rozszerzasz klaster vSAN na dwa AZ w obrębie jednego regionu, w przypadku awarii jednego z AZ, jest to traktowane jako zdarzenie vSphere HA i maszyna wirtualna zostaje ponownie uruchomiona w drugim AZ.
Korzyści rozciągniętych klastrów:
- Zwiększ dostępność aplikacji.
- Zapewnij zerowy cel punktu odzyskiwania (RPO) dla aplikacji przedsiębiorstw bez konieczności ich przeprojektowania lub wdrażania drogich rozwiązań do odzyskiwania po awarii.
- Chmura prywatna z rozciągniętymi klastrami jest zaprojektowana tak, aby zapewniać dostępność na poziomie 99,99% dzięki odporności na awarie strefy dostępności.
- Pozwól klientom skupić się na kluczowych wymaganiach i funkcjach aplikacji, zamiast na dostępności infrastruktury.
Aby chronić przed scenariuszami typu "split-brain" i wspomagać ocenę kondycji witryny, zarządzany vSAN Witness jest tworzony w trzeciej strefie dostępności. Mając kopię danych w każdej strefie dostępności (AZ), vSphere HA próbuje odzyskać dane po każdej awarii poprzez proste ponowne uruchomienie maszyny wirtualnej.
Poniższy diagram przedstawia klaster vSAN rozciągnięty na dwa AZy.
Diagram przedstawia zarządzany rozciągnięty klaster vSAN utworzony w trzeciej strefie dostępności, z danymi kopiowanymi do wszystkich trzech stref.
Poniższy diagram przedstawia normalny przepływ ruchu sieciowego w obrębie klastra vSAN rozciągniętego na dwa obszary dostępności (AZ).
Podsumowując, rozproszone klastry upraszczają potrzeby ochrony, zapewniając te same zaufane mechanizmy kontroli i możliwości oprócz skalowania i elastyczności infrastruktury platformy Azure.
Ważne jest, aby zrozumieć, że prywatne chmury rozproszonego klastra oferują jedynie dodatkową warstwę odporności, ale nie uwzględniają wszystkich scenariuszy awarii. Na przykład, prywatne chmury obliczeniowe z rozciągniętymi klastrami.
- Nie zabezpieczaj przed awariami na poziomie regionu w ramach Azure ani przed scenariuszami utraty danych spowodowanymi problemami aplikacyjnymi lub niewłaściwie zaplanowanymi politykami przechowywania.
- Zapewnia ochronę przed awarią jednej strefy, ale nie jest zaprojektowany do zapewniania ochrony przed podwójnymi lub postępującymi awariami. Przykład:
Mimo różnych warstw redundancji wbudowanych w strukturę, jeśli awaria między strefami dostępności (AZ) prowadzi do podziału na witrynie zapasowej, vSphere HA zaczyna wyłączać maszyny wirtualne obciążenia na tej witrynie.
Poniższy diagram przedstawia scenariusz podziału dodatkowej witryny.
Jeśli partycjonowanie witryny zapasowej doprowadziło do awarii witryny podstawowej lub spowodowało całkowite partycjonowanie, vSphere HA podejmie próbę ponownego uruchomienia maszyn wirtualnych z obciążeniem roboczym na witrynie zapasowej. Jeśli vSphere HA spróbowałoby ponownie uruchomić maszyny wirtualne obciążenia na stronie zapasowej, postawiłoby maszyny wirtualne obciążenia w niestabilnym stanie.
Na poniższych diagramach przedstawiono preferowane scenariusze awarii strony oraz całkowitego podziału sieci.
Poniższy diagram pokazuje przepływ ruchu sieciowego w ramach klastra vSAN rozciągniętego podczas całkowitej awarii witryny.
Należy zauważyć, że tego rodzaju awarie, choć rzadkie, nie mieszczą się w zakresie ochrony oferowanej przez prywatną chmurę z rozciągniętym klastrem. Ze względu na tego typu rzadkie awarie, rozwiązanie z rozciągniętym klastrem powinno być traktowane jako wielostrefowe (multi-AZ) rozwiązanie wysokiej dostępności opierające się na vSphere HA. Ważne jest, aby zrozumieć, że rozwiązanie oparte na rozszerzonym klastrze nie jest przeznaczone do zastępowania kompleksowej strategii odzyskiwania po awarii obejmującej wiele regionów, która może być stosowana w celu zapewnienia dostępności aplikacji. Przyczyną jest to, że rozwiązanie odzyskiwania po awarii zwykle ma oddzielne płaszczyzny zarządzania i sterowania w oddzielnych regionach świadczenia usługi Azure. Klastry rozciągnięte Azure VMware Solution mają pojedynczy samolot zarządzania i kontroli rozciągnięty pomiędzy dwoma strefami dostępności w tym samym regionie Azure. Na przykład jeden serwer vCenter, jeden klaster menedżera NSX, jedna para maszyn wirtualnych NSX Edge.
Dostępność regionu rozszerzonych klastrów
Klastry rozciągnięte Azure VMware Solution są dostępne w następujących regionach:
UK South (na AV36, i AV36P)
Europa Zachodnia (na AV36 oraz AV36P)
Niemcy Zachodnio-środkowe (na AV48)
Australia East (na AV36P)
Wschodnie USA (on AV36P)
Obsługiwane polityki przechowywania
Następujące zasady SPBM są obsługiwane z PFTT ustawionym na "Dual Site Mirroring" i SFTT na "RAID 1 (Mirroring)" jako domyślne zasady dla klastra.
- Ustawienia tolerancji na katastrofy dla witryny (PFTT):
- Replikacja w dwóch lokalizacjach
- Brak - zachowaj dane w preferowanych
- Brak - przechowuj dane o preferencjach negatywnych
- Lokalne awarie do tolerowania (SFTT):
- 1 błąd — RAID 1 (dublowanie)
- 1 awaria – RAID 5 (kody korygujące), wymaga minimum czterech hostów w każdej strefie AZ
- 2 awarie – RAID 1 (Odbicie)
- 2 błędy – RAID 6 (Erasure coding), wymaga co najmniej sześciu hostów w każdej strefie dostępności
- 3 awarie – RAID 1 (Mirroring)
Często zadawane pytania
Czy planowane są inne regiony?
Obecnie istnieje pięć regionów obsługiwanych dla rozciągniętych klastrów.
Jakiego rodzaju SLA dostarcza rozwiązanie Azure VMware dla rozciągniętych klastrów?
Prywatna chmura stworzona przy użyciu rozciągniętego klastra vSAN jest zaprojektowana tak, aby oferować 99,99% dostępności infrastruktury, gdy spełnione są następujące warunki:
- Minimalna liczba sześciu węzłów jest wdrażana w klastrze (po 3 w każdej strefie dostępności).
- Gdy zasady dotyczące przechowywania danych VM określają PFTT jako "Dual-Site Mirroring" i SFTT jako 1 dla maszyn wirtualnych obciążenia.
- Zgodność z Dodatkowymi Wymaganiami ujętymi w szczegółach SLA dla rozwiązania Azure VMware Solution jest wymagana, aby osiągnąć cele związane z dostępnością.
Czy mogę wybrać strefę dostępności, w której zostanie wdrożona chmura prywatna?
Nr Rozciągnięty klaster jest tworzony między dwiema strefami dostępności, podczas gdy trzecia strefa wykorzystywana jest do wdrożenia węzła świadek. Ponieważ wszystkie strefy są efektywnie wykorzystywane do wdrożenia środowiska klastrowego ze zwiększoną dostępnością, klient nie ma możliwości wyboru. Zamiast tego klient decyduje się wdrożyć hosty w wielu strefach dostępności (AZ) podczas tworzenia chmury prywatnej.
Jakie ograniczenia powinienem znać?
- Gdy chmura prywatna zostanie utworzona z rozciągniętym klastrem, nie można jej zmienić na standardową chmurę prywatną w klastrze. Podobnie, standardowa prywatna chmura klastrowa nie może zostać zmieniona na rozciągniętą prywatną chmurę klastrową po jej utworzeniu.
- Skalowanie w górę i w dół wydłużonych klastrów może odbywać się tylko parami. Minimalnie sześć węzłów i maksymalnie 16 węzłów jest obsługiwanych w środowisku rozciągniętego klastra. Aby uzyskać więcej informacji, zobacz Ograniczenia subskrypcji i usług Azure, limity, kwoty i ograniczenia.
- Maszyny wirtualne obciążenia klienta są ponownie uruchamiane z średnim priorytetem vSphere HA. Maszyny wirtualne zarządzania mają najwyższy priorytet ponownego uruchamiania.
- Rozwiązanie opiera się na vSphere HA i vSAN na potrzeby ponownego uruchamiania i replikacji. Cel czasu odtworzenia (RTO) jest określany na podstawie czasu potrzebnego vSphere HA do ponownego uruchomienia maszyny wirtualnej (VM) w ocalałej strefie dostępności (AZ) po awarii jednej strefy AZ.
- Obecnie nieobsługiwane w środowisku klastra rozszerzonego.
- Niedawno wprowadzone funkcje, takie jak publiczny adres IP na NSX Edge i zewnętrzna pamięć masowa, takie jak magazyny danych ANF.
- Dodatki do odzyskiwania po awarii, takie jak VMware SRM, Zerto i JetStream.
- Usługa NSX Edge Scale-OUT dodawania dodatkowych krawędzi NSX nie jest obecnie obsługiwana.
- Otwórz zgłoszenie serwisowe z portalu Azure dla następujących scenariuszy (upewnij się, że wybierzesz rozciągnięte klastry jako typ problemu):
- Połącz chmurę prywatną z rozciągniętą klastrową chmurą prywatną.
- Połącz dwie rozproszone chmury prywatne klastra.
Uwaga / Notatka
Połączenie usługi Azure VMware Solution między rozproszonymi chmurami prywatnymi klastra jest obsługiwane tylko wtedy, gdy oba rozproszone klastry są hostowane w tym samym zestawie zasobników lub nie mają między nimi wspólnego zasobnika. Nie jest obsługiwana, jeśli chmura prywatna współużytkuje tylko jeden wspólny zasobnik.
Jakiego rodzaju opóźnienia należy oczekiwać między strefami dostępności (AZ)?
Klastry rozciągnięte vSAN działają przy czasie podróży w obie strony (RTT) wynoszącym 5 milisekund oraz przepustowości na poziomie 10 Gb/s lub większej między AZs, które hostują maszyny wirtualne obciążenia. Wdrożenie rozproszonego klastra usługi Azure VMware Solution jest zgodne z zasadą przewodnią. Należy wziąć pod uwagę te informacje podczas wdrażania aplikacji (z wykorzystaniem SFTT do podwójnego lustrzanego odbicia lokacji, które korzystają z synchronicznych zapisów), mających rygorystyczne wymagania dotyczące opóźnień.
Czy mogę mieszać klastry rozproszone i standardowe w chmurze prywatnej?
Nr Kombinacja rozproszyonych i standardowych klastrów nie jest obsługiwana w tej samej chmurze prywatnej. Wybrano rozciągnięte lub standardowe środowisko klastrowe podczas tworzenia prywatnej chmury. Po utworzeniu chmury prywatnej z rozciągniętym klastrem zakłada się, że wszystkie klastry utworzone w tej chmurze prywatnej są również rozciągnięte.
Ile kosztuje to rozwiązanie?
Klienci są obciążani opłatami na podstawie liczby węzłów wdrożonych w prywatnej chmurze.
Czy zostaną naliczone opłaty za węzeł świadek oraz za ruch między strefami AZ?
Nr Klienci nie widzą opłaty za węzeł świadek i ruch między AZ. Węzeł dowodowy jest w pełni zarządzany jako usługa, a Azure VMware Solution zapewnia wymagane zarządzanie cyklem życia węzła dowodowego. Ponieważ całe rozwiązanie jest zarządzane przez usługę, klient musi zidentyfikować tylko odpowiednie zasady SPBM, które mają być ustawione dla maszyn wirtualnych obciążenia. Reszta jest zarządzana przez Microsoft.