Udostępnij przez


Profile obciążeń w usłudze Azure Container Apps

Profil obciążenia określa typ i ilość zasobów obliczeniowych i pamięci dostępnych dla aplikacji kontenera wdrożonych w środowisku usługi Azure Container Apps. Możesz skonfigurować różne profile tak, aby odpowiadały różnym potrzebom aplikacji.

Typy profilów

Usługa Azure Container Apps obsługuje trzy typy profilów obciążeń: Zużycie, Dedykowane i Flex.

Każdy typ profilu określa sposób skalowania aplikacji, poziomu izolacji zasobów i sposobu naliczania opłat.

  • Profile użycia używają architektury bezserwerowej. Aplikacje w tym profilu są automatycznie skalowane na żądanie, zwiększając lub zmniejszając zasoby, oraz opcjonalnie mogą być skalowane do zera w przypadku bezczynności. Płacisz tylko za zasoby używane przez uruchomione aplikacje. Rozliczanie bezserwerowe dotyczy również bezserwerowych procesorów GPU dla wyspecjalizowanych obciążeń. Ponieważ płacisz tylko za zasoby używane przez aplikacje, profil Zużycie jest odpowiedni dla aplikacji, które doświadczają dużych serii żądań lub scenariuszy, w których poziom obciążeń jest nieprzewidywalny.

  • Profile dedykowane są uruchamiane na zarezerwowanych zasobach obliczeniowych we własnej dedykowanej puli. Wybierasz rozmiar i typ maszyny wirtualnej, wdrażasz wiele aplikacji dla profilu i płacisz za jednostkę profilu. Profile dedykowane mogą być bardziej ekonomiczne dla stałych obciążeń i obsługiwać przypadki użycia ogólnego przeznaczenia, zoptymalizowane pod kątem pamięci i procesora GPU.

  • Profil elastyczny (wersja zapoznawcza) łączy prostotę rozliczeń i konfiguracji profilu Zużycie z wieloma cechami wydajności profilów dedykowanych. Profile elastyczne są rozliczane jak profil Zużycie, plus dedykowana opłata za zarządzanie, uruchamiane w jednolitym środowisku obliczeniowym, oferują okna planowanej konserwacji oraz dedykowaną obsługę sieciową i dostęp do większych rozmiarów replik. Profile elastyczne wymagają podsieci co najmniej /25.

Każde środowisko usługi Container Apps zawiera domyślny profil Zużycie. Profile dedykowanego GPU lub konsumpcji można dodawać, a profile elastyczne, gdy są dostępne, aby spełnić potrzeby aplikacji.

Uwaga

Profil elastyczny jest obecnie dostępny tylko w następujących regionach: Central US EUAP, East US2 EUAP, Azja Wschodnia i West Central US.

Czynniki konstrukcyjne profilu obciążenia

Różne typy profilów obciążeń oferują różne czynniki kształtu, takie jak o ogólnym przeznaczeniu, zoptymalizowane pod kątem pamięci, zoptymalizowane dla GPU lub mieszane.

Typ profilu Czynniki formularzy opis Potencjalne użycie
Zużycie Ogólnego przeznaczenia Automatycznie dodawane do nowych środowisk i działa na bezserwerowej infrastrukturze Consumption. Aplikacje, które nie wymagają określonych wymagań sprzętowych.
Zużycie procesor GPU Procesory GPU bezserwerowe skalowane do zera są dostępne w regionach takich jak Zachodnie stany USA, Australia Wschodnia i Szwecja Środkowa. Aby wyświetlić pełną listę dostępnych regionów, zobacz regiony obsługiwane przez bezserwerowe procesory GPU Aplikacje wymagające przyspieszenia procesora GPU.
Oddany Ogólnego przeznaczenia Profile zrównoważone pod względem zasobów CPU i pamięci. Aplikacje, które wymagają większych ilości procesora CPU lub pamięci.
Oddany Optymalizowane pod kątem pamięci Profile ze zwiększonymi zasobami pamięci dla danych w pamięci lub modeli uczenia maszynowego. Aplikacje z wysokimi wymaganiami dotyczącymi pamięci.
Oddany procesor GPU Profile z obliczeniami z obsługą procesora GPU są dostępne tylko w wybranych regionach. Profile dedykowane z obsługą procesora GPU muszą być skonfigurowane podczas tworzenia środowiska. Aplikacje, które wymagają przyspieszenia procesora GPU i dedykowanego sprzętu.

Uwaga

W przypadku korzystania z profilów z obsługą procesora GPU upewnij się, że aplikacja uruchamia najnowszą wersję cuda.

Szczegóły profilu

W poniższych tabelach podsumowano dostępne profile obciążeń według typu profilu, grupując podobne rozmiary, aby ułatwić określenie, która opcja jest dla Ciebie najlepsza. Pola vCPU i pamięci pokazują zakres zasobów w różnych rozmiarach profili.

Szczegóły profilu zużycia

Nazwy profilów Zakres vCPU Zakres pamięci Typ procesora GPU Regions Alokacja
Zużycie 0.25-4 0.5-8 GiB Wszystkie obsługiwane regiony na replikę
Consumption-GPU-NC24-A100, Consumption-GPU-NC8as-T4 8–24 56–220 GiB NVIDIA T4, A100 Aby wyświetlić pełną listę dostępnych regionów, zobacz regiony obsługiwane przez bezserwerowe procesory GPU na replikę

Wszystkie profile użycia obsługują bezserwerowe skalowanie i są rozliczane na podstawie użycia na każdą replikę.

Szczegóły profilu dedykowanego

Classification Nazwy profilów Zakres vCPU Zakres pamięci Typ procesora GPU Regions Alokacja
Ogólnego przeznaczenia D4, D8, D16, D32 4–32 16–128 GiB Żaden Wszystkie obsługiwane regiony na węzeł
Zoptymalizowana pamięć E4, E8, E16, E32 4–32 32–256 GiB Żaden Wszystkie obsługiwane regiony na węzeł
Poufne obliczenia DC4, DC8, DC16, DC32, DC48, DC64, DC96 4-96 16-384 GiB Żaden UAENorth na węzeł
procesor GPU NC24-A100, NC48-A100, NC96-A100 24–96 220–880 GiB A100 Zachodnie stany USA 3, Europa Północna na węzeł

Uwaga

Profile dedykowane z obsługą GPU przydzielają pojemność na zasadzie indywidualnych przypadków. Aby zażądać wymaganej pojemności, musisz przesłać bilet pomocy technicznej.

Szczegóły profilu elastycznego (wersja zapoznawcza)

Nazwy profilów Zakres vCPU Zakres pamięci Regions Alokacja
Elastyczny 0.25-4 0.5-16 GiB Środkowe stany USA (EUAP), Wschodnie stany USA 2 (EUAP), Azja Wschodnia, Zachodnio-środkowe stany USA na replikę

Użycie zasobów i skalowanie

Możesz ograniczyć użycie pamięci i procesora CPU dla każdej aplikacji w profilu obciążenia. Ponieważ wiele aplikacji może współużytkować pojedyncze wystąpienie profilu, może być konieczne dostosowanie ustawień pamięci profilu w celu zapewnienia odpowiednich zasobów dla wszystkich aplikacji.

Należy pamiętać, że łączna ilość zasobów dostępnych dla aplikacji jest nieco mniejsza niż alokacja profilu, ponieważ środowisko uruchomieniowe rezerwuje niektóre zasoby obliczeniowe. Gdy zapotrzebowanie przekracza bieżące zasoby, system automatycznie dodaje więcej instancji profilu. W miarę spadku zapotrzebowania system usuwa wystąpienia. Skalowanie można kontrolować, ustawiając minimalną i maksymalną liczbę wystąpień. Rozliczenia są oparte na liczbie uruchomionych wystąpień profilu.

Sieć

Środowiska profilów obciążeń uwidaczniają dodatkowe funkcje sieciowe, takie jak trasy zdefiniowane przez użytkownika, w celu zabezpieczenia ruchu przychodzącego i wychodzącego. Aby uzyskać szczegółowe informacje, zobacz dokumentację sieci .

Następne kroki