Udostępnij przez


Pule rezerwowe dla zestawów skalowania maszyn wirtualnych

Ważne

Aby pule rezerwowe mogły pomyślnie tworzyć zasoby i zarządzać nimi, wymagany jest dostęp do skojarzonych zasobów w ramach subskrypcji. Upewnij się, że do dostawcy zasobów puli rezerwowej przypisano odpowiednie uprawnienia, aby pula rezerwowa działała prawidłowo. Aby uzyskać szczegółowe instrukcje, zobacz konfigurowanie uprawnień roli dla pul rezerwowych.

Pule rezerwowe dla zestawów skalowania maszyn wirtualnych umożliwiają zwiększenie wydajności skalowania przez utworzenie puli wstępnie aprowizowania maszyn wirtualnych. Maszyny wirtualne w puli oczekiwania zakończą wszystkie procesy po aprowizacji, takie jak instalowanie aplikacji, pobieranie pakietów danych itp. Po pełnej aprowizacji maszyn wirtualnych są one utrzymywane w stanie uruchomionym, zatrzymanym (zdealokowane) lub hibernacji (wersja zapoznawcza). Gdy zestaw skalowania wymaga większej liczby wystąpień, wystąpienia w puli rezerwowej są automatycznie przenoszone do zestawu skalowania. Pula rezerwowa znacznie skraca czas potrzebny na skalowanie poziome zestawu skalowania maszyn wirtualnych (VMSS).

W przypadku obsługi puli rezerwowej uruchomionych maszyn wirtualnych maszyny są natychmiast gotowe do odbierania ruchu po przeniesieniu do zestawu skalowania. Jeśli utrzymywana jest pula rezerwowa zatrzymanych (cofnięto przydział) lub zhibernowanych maszyn wirtualnych, to są one automatycznie uruchamiane lub wznawiane po przejściu do zestawu skalowania.

Rejestracja dostawcy

Zarejestruj dostawcę zasobów puli rezerwowej w ramach subskrypcji przy użyciu usługi Azure Cloud Shell. Rejestracja może potrwać do 30 minut, aby została pomyślnie potwierdzona jako zakończona. Możesz ponownie uruchomić poniższe polecenia, aby określić, kiedy funkcja została pomyślnie zarejestrowana.

Register-AzResourceProvider -ProviderNamespace Microsoft.StandbyPool

Skalowanie

Przenoszenie maszyn wirtualnych między pulą rezerwową do zestawu skalowania odbywa się automatycznie po wyzwoleniu zdarzenia skalowalnego w poziomie. Nie jest wymagana dodatkowa konfiguracja. Jeśli w puli rezerwowej jest dostępne wystąpienie, które zakończyło wszystkie kroki aprowizacji, zestaw skalowania domyślnie używa tego wystąpienia podczas skalowania w górę.

Podczas skalowania w dół wystąpienia są usuwane z zestawu skalowania na podstawie zasad skalowania i uzupełniania puli rezerwowej w celu spełnienia skonfigurowanej maksymalnej gotowej pojemności. Jeśli w dowolnym momencie zestaw skalowania musi być skalowany poza liczbę wystąpień w puli rezerwowej, zestaw skalowania jest domyślnie ustawiony na standardowe metody skalowania w poziomie i tworzy nowe wystąpienia.

Pule rezerwowe udostępniają tylko maszyny wirtualne z puli, które są zgodne ze skonfigurowanym żądanym stanem zasilania. Jeśli na przykład żądany stan zasilania jest ustawiony jako zatrzymany (cofnięto przydział), pula rezerwowa daje tylko wystąpienia zestawu skalowania pasujące do bieżącego stanu zasilania. Jeśli maszyny wirtualne znajdują się w stanie tworzenia, awarii lub innego stanu niż oczekiwany, zestaw skalowania domyślnie tworzy nową maszynę wirtualną.

Rozmiar puli rezerwowej

Istnieją trzy ustawienia określające, ile wystąpień znajduje się w puli rezerwowej w dowolnym momencie. Obejmuje to liczbę wystąpień zestawu skalowania, minimalną gotową pojemność i maksymalną gotową pojemność.

Liczba wystąpień zestawu skalowania to liczba wystąpień, które są obecnie wdrażane w zestawie skalowania. Jest to właściwość poziomu zestawu skalowania, którą można zmienić w dowolnym momencie przez skalowanie w górę lub skalowanie w dół. Niezależnie od sposobu zarządzania regułami skalowania dla zestawu skalowania pula rezerwowa śledzi liczbę wdrożonych wystąpień i odpowiednio je dostosowuje.

Minimalna gotowa pojemność to parametr zdefiniowany przez użytkownika. Domyślnie minimalna gotowa pojemność dla każdej nowej puli rezerwowej wynosi zero. Ustawiając minimalną gotową pojemność, informuje ona pulę rezerwową, że powinna obsługiwać co najmniej wiele wystąpień. Jeśli na przykład masz minimalną gotową pojemność wynoszącą 5, to kiedy maszyna wirtualna zostanie przeniesiona z puli do zestawu skalowania, co zmniejsza minimalną gotową pojemność do mniej niż 5, pula rezerwowa automatycznie tworzy kolejne wystąpienie i zaczyna je przygotowywać do skalowania w poziomie.

Maksymalna pojemność gotowości jest parametrem zdefiniowanym przez użytkownika. To ustawienie informuje pulę rezerwowej, ile wystąpień powinno być utrzymywanych w puli. Maksymalna pojemność gotowości jest bezpośrednio powiązana z liczbą wystąpień zestawu skalowania. Jeśli masz maksymalną gotową pojemność 20 i obecnie masz 10 wystąpień w zestawie skalowania, rozmiar puli będzie równy 10. Jeśli zestaw skalowania jest skalowany w dół do 5, rozmiar puli wzrośnie do 15. W miarę zwiększania się zestawu skalowania i zmniejszania liczby wystąpień jest nadal dostosowywana dynamicznie.

Ustawienie opis
maksymalna gotowa pojemność Maksymalna liczba maszyn wirtualnych do utworzenia w puli.
minimalna gotowa pojemność Minimalna liczba maszyn wirtualnych do utrzymania w puli.
instanceCount (liczba wystąpień) Bieżąca liczba maszyn wirtualnych wdrożonych już w zestawie skalowania.
Rozmiar puli rezerwowej Rozmiar puli rezerwowej = maxReadyCapacityinstanceCount

Stany maszyny wirtualnej

Maszyny wirtualne w puli rezerwowej mogą być utrzymywane w stanie uruchomionym, zahibernowanym lub zatrzymanym (odinstalowanym).

Cofnięto przydział: cofnięto przydział maszyn wirtualnych i przechowuje wszystkie skojarzone dyski, interfejsy sieciowe i wszystkie statyczne adresy IP. Efemeryczne dyski systemu operacyjnego nie obsługują stanu cofnięcia przydziału.

Zrzut ekranu przedstawiający przepływ pracy podczas korzystania z cofniętych pul maszyn wirtualnych.

Uruchomione: używanie maszyn wirtualnych w stanie uruchomienia jest zalecane, gdy wymagania dotyczące opóźnienia i niezawodności są ścisłe. Maszyny wirtualne w stanie uruchomienia pozostają w pełni aprowizowane.

Zrzut ekranu przedstawiający przepływ pracy podczas korzystania z uruchomionych pul maszyn wirtualnych.

Hibernated (wersja zapoznawcza): Używanie maszyn wirtualnych w stanie hibernacji jest zalecane w przypadku systemów z długim czasem rozruchu z powodu aplikacji intensywnie korzystających z pamięci. Te aplikacje można uruchomić na maszynach wirtualnych i uśpić. Te hiberowane maszyny wirtualne mogą być następnie szybko uruchamiane w razie potrzeby, a aplikacje są już uruchomione w żądanym stanie.

Uwaga / Notatka

Aby użyć stanu hibernacji maszyny wirtualnej w puli gotowości, instancje muszą być w pełni uprawnione i skonfigurowane do obsługi hibernacji. Aby uzyskać więcej informacji, zobacz dokumentację hibernacji maszyny wirtualnej platformy Azure.

Zrzut ekranu przedstawiający przepływ pracy podczas korzystania z hibernacji pul maszyn wirtualnych.

Strefy dostępności

W przypadku korzystania z pul rezerwowych z zestawem skalowania maszyn wirtualnych obejmującym strefy dostępności wystąpienia w puli są rozłożone w tych samych strefach, z których korzysta zestaw skalowania maszyn wirtualnych.

Gdy skalowanie w poziomie jest wyzwalane w jednej ze stref, używana jest maszyna wirtualna w puli w tej samej strefie. Jeśli maszyna wirtualna jest potrzebna w strefie, w której nie masz już żadnych maszyn wirtualnych w puli, zestaw skalowania tworzy nową maszynę wirtualną bezpośrednio w zestawie skalowania.

Cennik

Opłaty są naliczane na podstawie zasobów wdrożonych w puli rezerwowej. Na przykład maszyny wirtualne w stanie uruchomienia generują koszty obliczeń, sieci i magazynu. Maszyny wirtualne w stanie cofnięcia przydziału nie generują żadnych kosztów obliczeniowych, ale żadne dyski trwałe lub konfiguracje sieciowe nadal generują koszty. W związku z tym pula uruchomionych maszyn wirtualnych wiąże się z większym kosztem niż pula zdezaktywowanych maszyn wirtualnych. Aby uzyskać więcej informacji na temat rozliczeń maszyn wirtualnych, zobacz stany i stan rozliczeń usługi Azure Virtual Machines.

Ograniczenia i zagadnienia

W przypadku korzystania z pul rezerwowych z zestawami skalowania maszyn wirtualnych należy pamiętać o konkretnych ograniczeniach i zagadnieniach:

  • Domeny błędów: pule rezerwowe nie są obsługiwane w przypadku zestawów skalowania maszyn wirtualnych skonfigurowanych z liczbą domen błędów większą niż 1.
  • Region i subskrypcja: pula rezerwowa musi znajdować się w tym samym regionie i subskrypcji, do którego jest dołączony zestaw skalowania maszyn wirtualnych. Konfiguracje między regionami lub subskrypcjami nie są obsługiwane.
  • Pojedyncza pula rezerwowa: Zestaw Skalowania Maszyn Wirtualnych może mieć tylko jedną pulę rezerwową jednocześnie dołączaną. Dołączanie wielu pul rezerwowych do tego samego zestawu skalowania nie jest obsługiwane.
  • Tryb orkiestracji: pule rezerwowe są obsługiwane tylko w przypadku zestawów skalowania maszyn wirtualnych przy użyciu orkiestracji elastycznej. Jednolita orkiestracja nie jest obsługiwana.
  • Autoskalowanie: możesz dołączyć pulę rezerwową do zestawu skalowania z włączonym autoskalowaniem. Zaleca się używanie tylko pul zdezaktywowanych lub uśpionych w kombinacji z autoskalowaniem. Uruchomione maszyny wirtualne w puli zostaną uwzględnione w obliczeniach autoskalowania i mogą spowodować nieoczekiwane zmiany w skalowaniu.

Następne kroki

Dowiedz się, jak utworzyć pulę rezerwową.