Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Usługa Azure NAT Gateway to w pełni zarządzana usługa translatora adresów sieciowych (NAT), która zapewnia wychodzącą łączność internetową dla zasobów połączonych z prywatną siecią wirtualną. Usługa udostępnia zarówno źródłowe tłumaczenie adresów sieciowych (SNAT) dla połączeń wychodzących, jak i docelowe tłumaczenie adresów sieciowych (DNAT) dla pakietów odpowiedzi, ale tylko dla połączeń wychodzących. Ponieważ znajduje się ona na krytycznych ścieżkach sieciowych, usługa Azure NAT Gateway została zaprojektowana tak, aby była wysoce odporną usługą.
W przypadku korzystania z platformy Azure niezawodność jest wspólną odpowiedzialnością. Firma Microsoft oferuje szereg możliwości wspierania odporności systemów i odzyskiwania. Odpowiadasz za zrozumienie, jak te możliwości działają w ramach wszystkich używanych usług oraz za wybór tych, które są potrzebne do osiągnięcia Twoich celów biznesowych i celów dotyczących niezawodności.
W tym artykule opisano, jak można zapewnić odporność usługi Azure NAT Gateway na różne potencjalne awarie i problemy, w tym przejściowe błędy i awarie strefy dostępności. Wyróżniono również niektóre kluczowe informacje dotyczące umowy dotyczącej poziomu usług (SLA) usługi Azure NAT Gateway.
Ważne
Podczas rozważania niezawodności bramy translatora adresów sieciowych należy również wziąć pod uwagę niezawodność maszyn wirtualnych, dysków, innej infrastruktury sieciowej i aplikacji uruchamianych na maszynach wirtualnych. Poprawa odporności samej bramy NAT może mieć ograniczony wpływ, jeśli inne składniki nie są równo odporne. W zależności od wymagań dotyczących odporności może być konieczne wprowadzenie zmian konfiguracji w wielu obszarach.
Ważne
Standardowe SKU V2 Brama NAT platformy Azure jest w fazie podglądu. Zobacz dodatkowe warunki użytkowania dla wersji zapoznawczych platformy Microsoft Azure, aby zapoznać się z postanowieniami prawnymi dotyczącymi funkcji platformy Azure, które są w wersji beta, wersji zapoznawczej lub w inny sposób nie zostały jeszcze wydane w wersji ogólnodostępnej.
Zalecenia dotyczące wdrażania produkcyjnego
W przypadku obciążeń produkcyjnych zalecamy:
-
Użyj jednostki SKU StandardV2, która automatycznie włącza nadmiarowość strefową w obsługiwanych regionach.
Uwaga / Notatka
Zapoznaj się z kluczowymi ograniczeniami StandardV2 NAT Gateway przed jej użyciem, aby upewnić się, że konfiguracja jest obsługiwana.
- Skonfiguruj swoją bramę NAT z wystarczającą liczbą publicznych adresów IP, aby obsłużyć szczytowe wymagania dotyczące połączeń, co zmniejsza prawdopodobieństwo problemów z dostępnością z powodu wyczerpania portów SNAT.
- Użyj publicznych adresów IP SKU StandardV2 z bramą NAT StandardV2. Publiczne adresy IP SKU Standard nie są obsługiwane z bramą NAT StandardV2.
Omówienie architektury niezawodności
W tej sekcji opisano niektóre ważne aspekty działania usługi, które są najbardziej istotne z perspektywy niezawodności. W sekcji przedstawiono architekturę logiczną, która zawiera niektóre z zasobów i funkcji wdrażanych i używanych. Omówiono również architekturę fizyczną, która zawiera szczegółowe informacje na temat działania usługi za kulisami.
Architektura logiczna
Brama NAT to zasób, który wdrażasz. Aby użyć bramy NAT jako trasy domyślnej dla wychodzącego ruchu internetowego, przypisz ją do co najmniej jednej podsieci w swojej sieci wirtualnej. Nie musisz konfigurować żadnych tras niestandardowych ani innych konfiguracji routingu.
Architektura fizyczna
Wewnętrznie, brama NAT składa się z jednego lub więcej wystąpień, które reprezentują podstawową infrastrukturę wymaganą do obsługi usługi.
Usługa Azure NAT Gateway implementuje architekturę rozproszoną przy użyciu sieci zdefiniowanej programowo w celu zapewnienia wysokiej niezawodności i skalowalności. Usługa działa w wielu domenach błędów, umożliwiając jej przetrwanie wielu awarii składników infrastruktury bez wpływu na usługę. Platforma Azure zarządza podstawowymi operacjami usług, w tym dystrybucją między domenami błędów i nadmiarowością infrastruktury.
Aby uzyskać więcej informacji na temat architektury i nadmiarowości usługi Azure NAT Gateway, zobacz Zasób usługi Azure NAT Gateway.
Odporność na błędy przejściowe
Błędy przejściowe to krótkotrwałe, sporadyczne awarie w komponentach. Występują one często w środowisku rozproszonym, takich jak chmura, i są one normalną częścią operacji. Błędy przejściowe naprawiają się po krótkim czasie. Ważne jest, aby aplikacje mogły obsługiwać błędy przejściowe, zwykle ponawiając próby żądań, których dotyczy problem.
Wszystkie aplikacje hostowane w chmurze powinny postępować zgodnie ze wskazówkami dotyczącymi obsługi błędów przejściowych platformy Azure podczas komunikowania się z dowolnymi interfejsami API hostowanymi w chmurze, bazami danych i innymi składnikami. Aby uzyskać więcej informacji, zobacz Zalecenia dotyczące obsługi błędów przejściowych.
Wyczerpanie portów SNAT jest sytuacją, w której aplikacje tworzą wiele niezależnych połączeń z tym samym adresem IP i portem, wyczerpując porty SNAT dostępne dla wychodzącego adresu IP. Wyczerpanie portów SNAT może manifestować się jako błąd przejściowy w aplikacji. Aby zmniejszyć prawdopodobieństwo przejściowych błędów związanych z tłumaczeniem adresów sieciowych, należy:
Zminimalizuj prawdopodobieństwo wyczerpania portów SNAT. Skonfiguruj aplikacje tak, aby obsługiwały bezproblemowo funkcję SNAT, implementując buforowanie połączeń i właściwe zarządzanie cyklem życia połączenia.
Wdróż wystarczające publiczne adresy IP. Jedna brama translatora adresów sieciowych obsługuje wiele publicznych adresów IP, a każdy publiczny adres IP udostępnia oddzielny zestaw portów SNAT.
Monitoruj wskaźnik dostępności ścieżki danych bramy NAT. Usługa Azure Monitor umożliwia wczesne wykrywanie potencjalnych problemów z łącznością. Skonfiguruj alerty dotyczące niepowodzeń połączeń i wyczerpania portów SNAT, aby aktywnie identyfikować i rozwiązywać przejściowe warunki błędów przed ich wpływem na łączność wychodzącą aplikacji. Aby dowiedzieć się więcej, zobacz Co to są metryki i alerty usługi Azure NAT Gateway?.
Unikaj ustawiania wysokich wartości limitu czasu bezczynności. Wartości limitu czasu bezczynności, które są znacznie wyższe niż domyślne 4 minuty dla połączeń poprzez bramę NAT, mogą przyczynić się do wyczerpania portów SNAT podczas dużego ruchu sieciowego.
Aby uzyskać kompleksowe wskazówki dotyczące zarządzania połączeniami i rozwiązywania problemów specyficznych dla usługi Azure NAT Gateway, zobacz Rozwiązywanie problemów z łącznością z usługą Azure NAT Gateway.
Odporność na błędy strefy dostępności
Strefy dostępności są fizycznie oddzielnymi grupami centrów danych w regionie świadczenia usługi Azure. Gdy jedna strefa ulegnie awarii, usługi mogą przejść w tryb failover do jednej z pozostałych stref.
Usługa Azure NAT Gateway obsługuje strefy dostępności zarówno w konfiguracjach strefowo nadmiarowych, jak i strefowych:
Strefowa redundancja: W przypadku korzystania z jednostki SKU StandardV2 usługi Azure NAT Gateway redundancja strefowa jest włączana automatycznie. Redundancja strefowa rozkłada instancje bramy NAT w strefach dostępności regionu. W przypadku korzystania z konfiguracji strefowo nadmiarowej można zwiększyć odporność i niezawodność obciążeń produkcyjnych.
Strefowy: Kiedy używasz SKU Standard (wersja 1), możesz opcjonalnie utworzyć konfigurację strefową. Strefowa brama NAT jest wdrażana w jednej wybranej strefie dostępności. Po wdrożeniu bramy translatora adresów sieciowych w określonej strefie zapewnia ona jawnie łączność wychodzącą do Internetu z tej strefy. Strefowe publiczne adresy IP z innej strefy dostępności nie są dozwolone. Cały ruch z połączonych podsieci jest kierowany przez bramę NAT, nawet jeśli znajduje się w innej strefie dostępności.
Jeśli brama NAT w strefie dostępności doświadczy awarii, wszystkie maszyny wirtualne w połączonych podsieciach nie będą w stanie połączyć się z Internetem, nawet jeśli te maszyny wirtualne znajdują się w działających prawidłowo strefach dostępności.
Ważne
Przypinanie do pojedynczej strefy dostępności jest zalecane tylko wtedy, gdy opóźnienie między strefami jest zbyt wysokie dla Twoich potrzeb i po sprawdzeniu, czy opóźnienie nie spełnia wymagań. Sam zasób strefowy nie zapewnia odporności na awarię strefy dostępności. Aby zwiększyć odporność zasobu strefowego, należy wyraźnie wdrożyć oddzielne zasoby w wielu strefach dostępności i skonfigurować routing ruchu oraz mechanizm przełączenia awaryjnego. Aby uzyskać więcej informacji, zobacz Zasoby strefowe i odporność strefy.
W przypadku wdrażania maszyn wirtualnych w kilku strefach dostępności i konieczności używania strefowych bram NAT można utworzyć stosy strefowe w każdej strefie dostępności. Aby utworzyć stosy strefowe, należy wdrożyć:
- Wiele podsieci: Zamiast używać jednej podsieci obejmującej strefy dostępności, należy utworzyć oddzielne podsieci.
- Strefowe bramy NAT: każda podsieć otrzymuje własną bramę NAT wdrożoną w tej samej strefie dostępności, co podsieć.
- Ręczne przypisywanie maszyny wirtualnej: jawnie umieszczasz każdą maszynę wirtualną w odpowiedniej strefie dostępności i odpowiadającej jej podsieci.
Jeśli wdrożysz bramę translatora adresów sieciowych w warstwie Standardowa (wersja 1) i nie określisz strefy dostępności, brama translatora adresów sieciowych będzie wtedy niezonowa, co oznacza, że platforma Azure wybierze strefę dostępności. Jeśli w regionie wystąpi awaria dowolnej strefy dostępności, może to mieć wpływ na bramę NAT. Nie zalecamy konfiguracji niezonowej, ponieważ nie zapewnia ochrony przed awariami strefy dostępności.
Requirements
Obsługa regionów: Bramy NAT z redundantnością strefową i strefowe można wdrożyć w dowolnym regionie, który obsługuje strefy dostępności.
SKU: Aby wdrożyć zróżnicowaną pod względem stref dostępności bramę NAT, należy użyć SKU StandardV2. Aby wdrożyć strefową bramę NAT, należy użyć SKU w wersji Standard. Zalecamy użycie jednostki SKU StandardV2.
Publiczne adresy IP: Wymagania dotyczące publicznych adresów IP dołączonych do bramy NAT zależą od jednostki SKU i konfiguracji wdrożenia.
Jednostka SKU bramy NAT Typ obsługi strefy dostępności Wymagania dotyczące publicznego adresu IP StandardV2 Strefowo nadmiarowy Należy wdrożyć w warstwie StandardV2 z publicznym adresem IP Standard Strefowy Standardowy publiczny adres IP musi być strefowo nadmiarowy lub strefowy w tej samej strefie, co brama NAT Standard Niezonowe Standardowy publiczny adres IP może być strefowo nadmiarowy lub strefowy w dowolnej strefie
Koszt
Nie ma dodatkowych kosztów związanych z obsługą stref dostępności w przypadku bramy NAT platformy Azure. Aby uzyskać więcej informacji na temat cen, zobacz Cennik usługi Azure NAT Gateway.
Konfiguruj obsługę stref dostępności
Nowe zasoby: Kroki wdrażania zależą od konfiguracji strefy dostępności, której chcesz użyć dla bramy translatora adresów sieciowych.
Z nadmiarowością stref: Aby wdrożyć nową bramę NAT z nadmiarowością stref przy użyciu SKU StandardV2, zobacz Tworzenie bramy NAT platformy Azure Standard V2.
Strefowy: Aby wdrożyć nową strefową bramę NAT przy użyciu SKU w wersji Standard, zapoznaj się z Tworzenie bramy translatora adresów sieciowych. Podczas tworzenia bramy NAT wybierz jej strefę dostępności zamiast opcji Brak strefy.
Włącz obsługę strefy dostępności: Nie można zmienić konfiguracji strefy dostępności usługi Azure NAT Gateway po wdrożeniu. Aby zmodyfikować konfigurację strefy dostępności, należy wdrożyć nową bramę translatora adresów sieciowych z ustawieniami żądanej strefy.
Aby przeprowadzić uaktualnienie bramy NAT z wersji Standard do StandardV2, należy również utworzyć nowy publiczny adres IP korzystający z SKU StandardV2.
Zachowanie, gdy wszystkie strefy są w dobrej kondycji
W tej sekcji opisano, czego można oczekiwać, gdy bramy NAT są skonfigurowane pod kątem obsługi strefy dostępności, a działają wszystkie strefy dostępności.
Routing ruchu między strefami: sposób, w jaki ruch z maszyny wirtualnej jest przekazywany przez bramę NAT, zależy od konfiguracji strefy dostępności używanej przez tę bramę.
Strefa-redundantna: Ruch można kierować przez instancję bramy NAT w dowolnej strefie dostępności.
Strefowy: Każde wystąpienie bramy NAT działa niezależnie w przypisanej strefie dostępności. Ruch wychodzący z zasobów podsieci jest kierowany przez strefę bramy NAT, nawet jeśli maszyna wirtualna jest w innej strefie.
Replikacja danych między strefami: usługa Azure NAT Gateway nie wykonuje replikacji danych między strefami, ponieważ jest to usługa bezstanowa na potrzeby łączności wychodzącej. Każda instancja bramy NAT działa niezależnie w swojej strefie dostępności, bez konieczności synchronizacji z instancjami w innych strefach.
Zachowanie podczas awarii strefy
W tej sekcji opisano, czego można oczekiwać, gdy brama NAT jest skonfigurowana do obsługi stref dostępności i wystąpi awaria takiej strefy.
Wykrywanie i reagowanie: Odpowiedzialność za wykrywanie i reagowanie zależy od konfiguracji strefy dostępności używanej przez bramę translatora adresów sieciowych.
Strefowo nadmiarowy: Usługa Azure NAT Gateway wykrywa błędy w strefie dostępności i reaguje na nie. Nie musisz nic robić, aby zainicjować przełączenie awaryjne w strefie dostępności.
Strefowe: Odpowiadasz za wdrażanie trybu failover w aplikacjach, umożliwiającego korzystanie z alternatywnych metod łączności lub bram NAT w innych strefach.
Powiadomienie: Firma Microsoft nie powiadamia cię automatycznie, gdy strefa nie działa. Możesz jednak użyć usługi Azure Resource Health do monitorowania kondycji pojedynczego zasobu i skonfigurować alerty usługi Resource Health w celu powiadamiania o problemach. Możesz również użyć usługi Azure Service Health , aby zrozumieć ogólną kondycję usługi, w tym wszelkie błędy strefy, i skonfigurować alerty usługi Service Health w celu powiadamiania o problemach.
Możesz również użyć metryki dostępności ścieżki danych bramy NAT do monitorowania jej kondycji. Alerty dotyczące metryki dostępności ścieżki danych można skonfigurować w celu wykrywania problemów z łącznością.
Aktywne żądania: To, co się stanie z aktywnymi żądaniami, zależy od konfiguracji strefy dostępności używanej przez bramę translatora adresów sieciowych.
Nadmiarowość strefowa: Wszystkie aktywne połączenia wychodzące za pośrednictwem wystąpień w uszkodzonej strefie są przerywane, a klienci muszą ponowić próbę. Kolejne próby połączenia przepływają przez instancję bramy NAT w innej strefie zapasowej.
Strefowy: Aktywne połączenia wychodzące przez uszkodzoną bramę NAT strefową zostają utracone. Musisz zdecydować, czy i jak ponownie ustanowić łączność za pośrednictwem alternatywnych ścieżek łączności. Aplikacje powinny implementować logikę ponawiania prób w celu obsługi błędów połączenia.
Jeśli ruch jest przekierowywany, ponieważ wychodzący publiczny adres IP ulegnie zmianie, konieczne może być ponowne negocjowanie wszystkich sesji TCP.
Oczekiwana utrata danych: Nie dochodzi do utraty danych, ponieważ usługa Azure NAT Gateway jest usługą bezstanową na potrzeby łączności wychodzącej. Stan połączenia jest odtwarzany po ponownym nawiązaniu połączeń.
Oczekiwany przestój: Oczekiwany przestój zależy od konfiguracji strefy dostępności używanej przez bramę translatora adresów sieciowych.
Nadmiarowość strefowa: Istniejące połączenia z uszkodzonej strefy mogą przestać działać. Użytkownicy mogą natychmiast ponawiać próby nawiązania połączenia, a żądania będą kierowane do instancji w innej strefie. Wszystkie pozostałe połączenia ze stref w dobrej kondycji utrzymują się.
Strefowego: Łączność wychodząca zostanie utracona do momentu odzyskania strefy lub do czasu przekierowania ruchu za pośrednictwem alternatywnych metod łączności lub bram NAT w innych strefach.
Przekierowywanie ruchu: Zachowanie przekierowania ruchu zależy od konfiguracji strefy dostępności używanej przez bramę NAT.
Strefowo redundantny: Nowe żądania połączenia są kierowane przez bramę NAT w strefie dostępności o dobrej kondycji.
Jest mało prawdopodobne, że maszyny wirtualne w strefie dostępności, której dotyczy problem, nadal będą działać. Jednak w przypadku częściowej awarii strefy, która powoduje niedostępność Azure NAT Gateway, podczas gdy maszyny wirtualne nadal działają, wszystkie połączenia wychodzące z maszyn wirtualnych w zainfekowanej strefie są kierowane przez instancję bramy NAT w innej strefie.
Strefa: Jesteś odpowiedzialny za wdrożenie mechanizmu failover na poziomie aplikacji, takiego jak alternatywne metody łączności lub bramy NAT w innych strefach.
Odzyskiwanie strefy
W przypadku operacji powrotu po awarii nie jest wymagana żadna interwencja ręczna, ponieważ usługa Azure NAT Gateway jest usługą bezstanową.
Po odzyskaniu strefy dostępności instancje bramy sieciowej NAT w tej strefie automatycznie stają się dostępne dla nowych połączeń wychodzących. Połączenia nawiązane za pośrednictwem instancji bram NAT w innych strefach podczas awarii będą nadal używać bieżących ścieżek łączności, aż do naturalnego zakończenia się połączeń.
Testowanie pod kątem niepowodzeń strefy
Opcje testowania błędów strefy zależą od konfiguracji strefy dostępności używanej przez wystąpienie.
Strefowo nadmiarowy: Platforma Azure NAT Gateway zarządza routingiem ruchu, przełączaniem awaryjnym oraz powrotem po awarii dla strefowo nadmiarowych bram NAT. Ponieważ ta funkcja jest w pełni zarządzana, nie trzeba inicjować ani sprawdzać procesów awarii strefy dostępności.
Strefowego: Odpowiadasz za przygotowywanie i testowanie planów trybu failover w przypadku wystąpienia awarii strefy.
Odporność na awarie całego regionu
Azure NAT Gateway to usługa z jednym regionem, która działa w granicach określonego regionu świadczenia usługi Azure. Usługa nie zapewnia wbudowanych możliwości obejmujących wiele regionów ani automatycznego przełączania awaryjnego między regionami. Jeśli region stanie się niedostępny, bramy NAT w tym regionie są również niedostępne.
Jeśli projektujesz podejście sieciowe z wieloma regionami, powinieneś wdrożyć niezależne bramy NAT w każdym regionie.
Umowa dotycząca poziomu usług
Umowa dotycząca poziomu usług (SLA) dla usług platformy Azure opisuje oczekiwaną dostępność każdej usługi oraz warunki, które rozwiązanie musi spełnić, aby osiągnąć te oczekiwania dotyczące dostępności. Aby uzyskać więcej informacji, zobacz Umowy SLA dotyczące usług online.
Usługa Azure NAT Gateway jest objęta umową SLA Azure VNet NAT. Umowa SLA dotycząca dostępności ma zastosowanie tylko wtedy, gdy masz co najmniej dwie maszyny wirtualne w dobrej kondycji i wyklucza wyczerpanie portów SNAT z obliczeń przestojów.