Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ten artykuł zawiera wskazówki dotyczące optymalizowania użycia i kosztów usługi Azure Kubernetes Service (AKS). Obejmuje ona wskazówki dotyczące następujących tematów:
- Automatyczne skalowanie
- Ustalanie rozmiaru klastra z prawej strony
- Optymalizacje procesora GPU
- Wielodostępność
- Rabaty na platformę Azure
Automatyczne skalowanie
Automatyczne skalowanie podów w poziomie
Narzędzie Horizontal Pod Autoscaler (HPA) monitoruje zapotrzebowanie na zasoby i automatycznie aktualizuje zasób obciążeniowy, skalując liczbę zasobników zgodnie z potrzebą. Odpowiedź na zwiększone obciążenie polega na wdrożeniu większej liczby podów. Jeśli obciążenie się zmniejszy i liczba podów jest wyższa od skonfigurowanego minimum, autoskaler informuje zasób roboczy o skalowaniu w dół.
Interfejs API metryk pobiera dane z kubeleta co 60 sekund, a mechanizm HPA sprawdza interfejs API metryk co 15 sekund pod kątem wszelkich wymaganych zmian domyślnie. Oznacza to, że HPA odświeża się co 60 sekund. Podczas konfigurowania HPA dla wdrożenia należy zdefiniować minimalną i maksymalną liczbę replik, które mogą działać, oraz metryki używane przez HPA do określenia, kiedy skalować.
Aby uzyskać więcej informacji, zobacz Horizontal Pod Autoscaling oraz Autoskalowanie zasobników w usłudze AKS.
Kubernetes: automatyczne skalowanie oparte na zdarzeniach
Kubernetes Event-driven Autoscaler (KEDA) stosuje automatyczne skalowanie oparte na zdarzeniach do twoich obciążeń. KEDA współpracuje z HPA i może rozszerzać funkcjonalność bez zastępowania lub duplikowania.
Możesz użyć dodatku KEDA dla usługi AKS, aby skalować aplikacje i korzystać z bogatego katalogu skalowania usługi Azure KEDA. Aby uzyskać więcej informacji, zobacz Autoskalowanie aplikacji za pomocą dodatku KEDA i Instalowanie dodatku KEDA dla usługi AKS.
Automatyczne skalowanie pionowe podów
Narzędzie Do automatycznego skalowania zasobników pionowych (VPA) automatycznie ustawia żądania zasobów i limity dla kontenerów na obciążenie w oparciu o wcześniejsze użycie. VPA zwalnia zasoby CPU i pamięć dla podów, aby zapewnić efektywne wykorzystanie klastrów AKS. Z czasem VPA przedstawia zalecenia dotyczące użycia zasobów.
Aby uzyskać więcej informacji, zobacz Pionowe autoskalowanie zasobników w usłudze Azure Kubernetes Service (AKS) i Używanie narzędzia Vertical Pod Autoscaler (VPA) w usłudze Azure Kubernetes Service (AKS).
Optymalizacja rozmiaru klastra
Dopasuj rozmiar klastra
Ważne jest, aby dopasować rozmiar swoich klastrów w celu optymalizacji kosztów i wydajności. Możesz ręcznie zmienić rozmiar klastra, dodając lub usuwając węzły, aby spełniały potrzeby aplikacji. Możesz również automatycznie skalować klaster, aby automatycznie dostosować liczbę węzłów w odpowiedzi na zmieniające się wymagania.
Aby uzyskać więcej informacji, zobacz Zmienianie rozmiaru klastrów usługi Azure Kubernetes Service (AKS).
Skalowanie automatyczne klastra
Dzięki funkcji automatycznego skalowania klastra można automatycznie skalować pule węzłów na podstawie użycia zasobów i ograniczeń, takich jak skalowanie w górę, aby zaplanować oczekujące zasobniki lub skalowanie w dół, aby zmniejszyć koszty nieużywanych węzłów. Profil narzędzia do automatycznego skalowania klastra to zestaw parametrów, które można dostroić w celu kontrolowania zachowania narzędzia do automatycznego skalowania klastra.
Aby uzyskać więcej informacji, zobacz Temat Skalowanie automatyczne klastra w usłudze Azure Kubernetes Service (AKS) — omówienie i Używanie narzędzia do automatycznego skalowania klastra w usłudze Azure Kubernetes Service (AKS).
Automatyczne aprowizowanie węzłów (wersja zapoznawcza)
Automatyczne aprowizowanie węzłów (NAP) ( wersja zapoznawcza) oparte na projekcie Firmy Karpenter typu open source ułatwia aprowizowanie odpowiedniej infrastruktury na podstawie oczekujących wymagań dotyczących zasobów zasobników obciążeń. Dzięki wydajnemu pakowaniu pojemników można skonsolidować obciążenia w odpowiedniej infrastrukturze, aby zmniejszyć koszty operacyjne.
Aby uzyskać więcej informacji, zobacz Automatyczne aprowizowanie węzłów (wersja zapoznawcza) w usłudze Azure Kubernetes Service (AKS).
Optymalizacje procesora GPU
Partycjonowanie i udostępnianie procesora GPU
Partycjonowanie GPU pomaga w zwalczaniu niewykorzystania zasobów, dzieląc lub udostępniając GPU w różnych obciążeniach. W poniższych sekcjach opisano różne sposoby partycjonowania i udostępniania procesorów GPU w usłudze AKS.
Fragmentowanie czasu
Operator GPU firmy NVIDIA umożliwia dzielenie czasu procesorów GPU w klastrach Kubernetes. W przypadku fragmentacji czasowej administrator systemu może zdefiniować zestaw replik dla GPU, z których każda może być przekazywana niezależnie do podu w celu uruchamiania obciążeń. Możesz zastosować domyślne konfiguracje podziału czasu dla całego klastra oraz konfiguracje specyficzne dla węzła.
Aby uzyskać więcej informacji, zobacz Time-slicing GPU in Kubernetes (Czas fragmentowania procesorów GPU na platformie Kubernetes).
Usługa wieloprocesorowa (MPS)
Pojedynczy proces może nie wykorzystywać całej pojemności pamięci i przepustowości obliczeniowej dostępnej na procesorze GPU. Usługa Multi-Process Service (MPS) umożliwia logiczny podział pamięci i zasobów obliczeniowych między zadania oraz pozwala operacjom jądra i kopiowania pamięci z różnych procesów nakładać się na siebie na procesorze GPU. MpS pomaga osiągnąć wyższe wykorzystanie procesora GPU i krótszy czas działania.
Aby uzyskać więcej informacji, zobacz Multi-Process Service (MPS).
Procesory GPU z wieloma wystąpieniami (MIG)
Wieloinstancyjne GPU (MIGs) umożliwiają podział procesorów GPU opartych na architekturze NVIDIA Ampere i nowszych na oddzielne i bezpieczne instancje GPU do zastosowań aplikacji CUDA.
Aby uzyskać więcej informacji, zobacz Operator GPU z MIG i Tworzenie puli węzłów GPU z wieloma wystąpieniami w usłudze Azure Kubernetes Service (AKS).
Wielodzierżawność
Wielodzierżawność odnosi się do udostępniania infrastruktury między najemcami, zespołami i jednostkami biznesowymi. W poniższej tabeli przedstawiono różne sposoby implementowania wielodostępności w usłudze AKS:
| Typ wielodostępności | Poziom wielodostępności | Gęstość zasobnika klastra | Alokacja kosztu | Idealny przypadek użycia | Potencjalne zagrożenia |
|---|---|---|---|---|---|
| Dedykowany klaster | Twarda wielodostępność | Obniżyć | Najprostszym | Pełne granice izolacji zabezpieczeń i prosta alokacja kosztów | • Rozrastanie klastra na dużą skalę zwiększa koszty zarządzania • Niższa gęstość zasobników i więcej nadmiernie przydzielonych zasobów |
| Dedykowana pula węzłów | Miękka wielodostępność | Średni | Średni | Średnia gęstość pod | • Wymaga zaufania między dzierżawami • Wymaga dodatkowych konfiguracji klastra, takich jak zasady sieciowe, zarządzanie przydziałami, kontrola dostępu oparta na rolach (RBAC) itp. |
| Dedykowana przestrzeń nazw | Miękka wielodostępność | Wyższa | Trudniejsze | Udostępnianie infrastruktury w celu zmaksymalizowania wykorzystania zasobów | • Niebezpieczne dla wrogich środowisk domyślnie • Wymaga dodatkowych konfiguracji klastra, takich jak zasady sieciowe, zarządzanie przydziałami, kontrola dostępu oparta na rolach (RBAC) itp. |
Dedykowany klaster
W przypadku dedykowanej wielodostępności klastrów klastry są przeznaczone na jedno obciążenie lub zespół.
W poniższej tabeli przedstawiono zalety i wady użycia dedykowanego klastra:
| Zalety | Minusy |
|---|---|
| • Łatwiejsza metoda izolacji • Prosta alokacja kosztów i rozliczenie • Doskonałe rozwiązanie w przypadku, gdy dzierżawcy nie ufają sobie nawzajem (często z perspektywy zabezpieczeń i udostępniania zasobów) |
• Wysokie koszty związane z zarządzaniem i kosztami finansowymi • Ogólnie niska gęstość zasobników i nadmiarowe zasoby |
Dedykowana pula węzłów
Dzięki dedykowanej puli węzłów ze współdzieleniem zasobów klastry są współużytkowane przez wielu użytkowników.
W poniższej tabeli przedstawiono zalety i wady użycia dedykowanej puli węzłów:
| Zalety | Minusy |
|---|---|
| • Średnia gęstość strąków • Część współużytkowanej infrastruktury • Stosowanie tagów platformy Azure do pul węzłów przeznaczonych dla jednej dzierżawy (propagacja tagów do węzłów i utrwalanie ich za pomocą uaktualnień) |
• Wymaga zaufania między najemcami • Wymaga dodatkowych konfiguracji klastra, takich jak zasady sieciowe, zarządzanie przydziałami, kontrola dostępu oparta na rolach (RBAC) itp. |
Dedykowana przestrzeń nazw
Dzięki dedykowanej przestrzeni nazw w trybie wielodostępności klastry są współużytkowane przez wielu najemców, a przestrzenie nazw służą jako granica izolacji.
W poniższej tabeli przedstawiono zalety i wady używania dedykowanej przestrzeni nazw:
| Zalety | Minusy |
|---|---|
| • Większa gęstość modułów • Najlepsze opakowanie binpacking • Udostępnianie infrastruktury w celu zmaksymalizowania wykorzystania zasobów |
• Niebezpieczne dla wrogich środowisk domyślnie • Wymaga dodatkowych środków bezpieczeństwa, jeśli nie można ufać wszystkim dzierżawcom |
Rabaty na platformę Azure
Aby uzyskać większe oszczędności, skorzystaj z rabatów Azure, takich jak plany oszczędnościowe Azure, Zarezerwowane Instancje i Korzyści Hybrydowe Azure.
| Typ rabatu platformy Azure | Szczegóły |
|---|---|
| Plany oszczędności Azure | • Zobowiązanie z góry 1–3 lata • Oszczędź do 65% w porównaniu z płatnościami na zasadzie użycia • Elastyczne, bez ograniczeń rodziny jednostek SKU ani regionów • Najlepsze dla obciążeń o spójnych kosztach oraz zasobach w różnych SKU i regionach |
| Wystąpienia zarezerwowane | • Zobowiązanie z góry 1–3 lata • Oszczędzaj do 72% w porównaniu z modelem rozliczeń pay-as-you-go • Ograniczone do określonych rodzin jednostek SKU i regionów • Najlepsze dla stabilnych obciążeń działających w trybie ciągłym (bez nieoczekiwanych zmian SKU lub regionu) |
| Korzyści użycia hybrydowego platformy Azure | • Korzystanie z własnych lokalnych licencji systemu Windows Server i programu SQL Server na platformę Azure • Użyj jakichkolwiek kwalifikujących się licencji lokalnych, które mają aktywny pakiet Software Assurance (SA) lub kwalifikującą się subskrypcję |
Następne kroki
Aby dowiedzieć się więcej o kosztach w usłudze AKS, zapoznaj się z następującymi artykułami: