Udostępnij przez


Omówienie maszyny wirtualnej serii HBv4

Dotyczy: ✔️ Maszyny wirtualne Linux ✔️ Maszyny wirtualne Windows ✔️ Elastyczne zestawy skalowania ✔️ Jednolite zestawy skalowania

Serwer serii HBv4 zawiera 2 * 96-rdzeniowe procesory EPYC 9V33X dla łącznie 192 fizycznych rdzeni "Zen4" z pamięcią podręczną AMD 3D-V. Jednoczesne wielowątkowość (SMT) jest wyłączona w HBv4. Te 192 rdzeni są podzielone na 24 sekcje (12 na gniazdo), każda sekcja zawiera osiem rdzeni procesora z jednolitym dostępem do 96 MB pamięci podręcznej L3. Serwery usługi Azure HBv4 również uruchamiają następujące ustawienia systemu BIOS firmy AMD:

Nodes per Socket (NPS) = 2
L3 as NUMA = Disabled
NUMA domains within VM OS = 4
C-states = Enabled

W rezultacie serwer uruchamia się z czterema domenami NUMA (2 na gniazdo), każda o rozdzieleniu 48 rdzeni. Każda jednostka NUMA ma bezpośredni dostęp do sześciu kanałów fizycznego DRAM.

Aby zapewnić miejsce na działanie funkcji hypervisor platformy Azure bez zakłócania działania maszyny wirtualnej, rezerwujemy 16 rdzeni fizycznych na serwer.

Topologia maszyny wirtualnej

Na poniższym diagramie przedstawiono topologię serwera. Rezerwujemy te 16 rdzeni hosta hypervisora (żółty) symetrycznie w obu gniazdach CPU, wybierając pierwsze dwa rdzenie z określonych rdzeni złożonych matryc (CCD) w każdej domenie NUMA. Pozostałe rdzenie przeznaczone są dla maszyn wirtualnych serii HBv4 (zielony).

Zrzut ekranu topologii serwera serii HBv4

Granica CCD różni się od granicy NUMA. W systemie HBv4 grupa sześciu (6) kolejnych CCDs jest skonfigurowana jako domena NUMA, zarówno na poziomie serwera hosta, jak i na maszynie wirtualnej gościa. Dlatego wszystkie rozmiary maszyn wirtualnych HBv4 eksponują cztery jednolite domeny NUMA, które są widoczne dla systemu operacyjnego i aplikacji, jak pokazano poniżej, każdy z różną liczbą rdzeni w zależności od określonego rozmiaru maszyny wirtualnej HBv4.

Zrzut ekranu topologii maszyny wirtualnej serii HBv4

Każdy rozmiar maszyny wirtualnej HBv4 jest podobny w układzie fizycznym, funkcjach i wydajności innego procesora CPU niż PROCESOR AMD EPYC 9V33X w następujący sposób:

Rozmiar maszyny wirtualnej serii HBv4 Domeny NUMA Rdzenie na domenę NUMA Podobieństwo z procesorem AMD EPYC
Standard_HB176rs_v4 4 44 Podwójne gniazdo EPYC 9V33X
Standard_HB176-144rs_v4 4 36 Podwójne gniazdo EPYC 9V33X
Standard_HB176-96rs_v4 4 24 Podwójne gniazdo EPYC 9V33X
Standard_HB176-48rs_v4 4 12 Podwójne gniazdo EPYC 9V33X
Standard_HB176-24rs_v4 4 6 Podwójne gniazdo EPYC 9V33X

Uwaga / Notatka

  • Ograniczone rozmiary maszyn wirtualnych rdzeni zmniejszają tylko liczbę rdzeni fizycznych uwidocznionych dla maszyny wirtualnej. Wszystkie globalne zasoby udostępnione (pamięć RAM, przepustowość pamięci, pamięć podręczna L3, łączność GMI i xGMI, InfiniBand, sieć Ethernet platformy Azure, lokalny dysk SSD) pozostają stałe. Dzięki temu klient może wybrać rozmiar maszyny wirtualnej najlepiej dostosowany do danego zestawu wymagań dotyczących obciążeń lub licencjonowania oprogramowania.
  • Obecnie występuje problem z mapowaniem rdzeni w Standard_HB176rs_v4 rozmiaru nadrzędnego serii HBv4.

Wirtualne mapowanie architektury NUMA każdego rozmiaru maszyny wirtualnej HBv4 jest mapowane na podstawową fizyczną topologię NUMA. Nie ma potencjalnej mylącej abstrakcji topologii sprzętu.

Dokładna topologia dla różnych rozmiarów maszyn wirtualnych HBv4 jest wyświetlana w następujący sposób przy użyciu danych wyjściowych lstopo:

lstopo-no-graphics --no-io --no-legend --of txt

Wybierz, aby wyświetlić wynik lstopo dla Standard_HB176rs_v4

Dane wyjściowe lstopo dla maszyny wirtualnej HBv4-176

Wybierz, aby wyświetlić dane wyjściowe lstopo dla Standard_HB176-144rs_v4

Dane wyjściowe lstopo dla maszyny wirtualnej HBv4-144

Wybierz, aby wyświetlić wynik lstopo dla Standard_HB176-96rs_v4

Dane wyjściowe lstopo dla maszyny wirtualnej HBv4-64

Wybierz, aby wyświetlić wynik działania lstopo dla Standard_HB176-48rs_v4

Dane wyjściowe lstopo dla maszyny wirtualnej HBv4-32

Wybierz, aby wyświetlić dane wyjściowe lstopo dla Standard_HB176-24rs_v4

Dane wyjściowe lstopo dla maszyny wirtualnej HBv4-24

Sieć InfiniBand

Maszyny wirtualne HBv4 oferują również karty sieciowe NVIDIA Mellanox NDR InfiniBand (ConnectX-7) działające na maksymalnie 400 Gigabits/s. Karta sieciowa jest przekazywana do maszyny wirtualnej za pośrednictwem SRIOV, umożliwiając ruch sieciowy w celu obejścia funkcji hypervisor. W rezultacie klienci ładują standardowe sterowniki Mellanox OFED na maszynach wirtualnych HBv4, ponieważ byłyby to środowisko bez systemu operacyjnego.

Maszyny wirtualne HBv4 obsługują routing adaptacyjny, dynamiczny transport połączony (DCT, oprócz standardowych transportów RC i UD) oraz sprzętowe odciążanie zbiorczych mpI do dołączonego procesora adaptera ConnectX-7. Te funkcje zwiększają wydajność aplikacji, skalowalność i spójność, a ich użycie jest zalecane.

Magazyn tymczasowy

Maszyny wirtualne HBv4 oferują trzy fizyczne lokalne urządzenia SSD. Jedno urządzenie jest wstępnie sformatowane, aby służyło jako plik strony i było wyświetlane na maszynie wirtualnej jako ogólne urządzenie SSD.

Dwa inne, większe dyski SSD są udostępniane jako niesformatowane urządzenia NVMe bloku za pośrednictwem NVMeDirect. Ponieważ blokowe urządzenie NVMe pomija funkcję hypervisor, ma wyższą przepustowość, większą liczbę operacji we/wy na sekundę i mniejsze opóźnienia na operację we/wy na sekundę.

W przypadku parowania w tablicy rozłożonej dysk SSD NVMe zapewnia do 12 GB/s odczytów i 7 GB/s operacji zapisu oraz maksymalnie 186 000 operacji we/wy na sekundę (odczyty) i 201 000 operacji we/wy na sekundę (zapisów) na potrzeby głębokości kolejek.

Specyfikacje sprzętowe

Specyfikacje sprzętowe Maszyny wirtualne serii HBv4
Rdzenie 176, 144, 96, 48 lub 24 (wyłączono protokół SMT)
CPU AMD EPYC 9V33X
Częstotliwość procesora CPU (inne niż AVX) Podstawa 2,55 GHz, szczytowa moc 3,7 GHz
Pamięć 768 GB (pamięć RAM na rdzeń zależy od rozmiaru maszyny wirtualnej)
Dysk lokalny 2 * 1,8 TB NVMe (blok), 480 GB SSD (plik stronicowy)
InfiniBand 400 Gb/s Mellanox ConnectX-7 NDR InfiniBand
Sieć Sieć Ethernet 100 Gb/s (80 Gb/s do użycia) Azure Second Gen SmartNIC

Specyfikacje oprogramowania

Specyfikacje oprogramowania Maszyny wirtualne serii HBv4
Maksymalny rozmiar zadania MPI 52 800 rdzeni (300 maszyn wirtualnych w jednym zestawie skalowania maszyn wirtualnych z singlePlacementGroup=true)
Obsługa interfejsu MPI HPC-X (2.13 lub nowszy), Intel MPI (2021.7.0 lub nowszy), OpenMPI (4.1.3 lub nowszy), MVAPICH2 (2.3.7 lub nowszy), MPICH (4.1 lub nowszy)
Dodatkowe struktury UCX, libfabric, PGAS lub inne środowiska uruchomieniowe oparte na rozwiązaniu InfiniBand
Obsługa usługi Azure Storage Dyski w warstwie Standardowa i Premium (maksymalnie 32 dyski), Azure NetApp Files, Azure Files, Azure HPC Cache, Azure Managed Lustre File System
Obsługiwany i zweryfikowany system operacyjny AlmaLinux 8.6, 8.7, Ubuntu 20.04+
Zalecany system operacyjny pod kątem wydajności AlmaLinux HPC 8.7, Ubuntu-HPC 20.04+
Obsługa programu Orchestrator Azure CycleCloud, Azure Batch, AKS; opcje konfiguracji klastra

Uwaga / Notatka

  • Te maszyny wirtualne obsługują tylko generację 2.
  • Oficjalne wsparcie na poziomie jądra firmy AMD rozpoczyna się od RHEL 8.6 i AlmaLinux 8.6, który jest pochodną RHEL.
  • System Windows Server 2012 R2 nie jest obsługiwany na maszynach wirtualnych HBv4 i innych maszynach wirtualnych z więcej niż 64 rdzeniami (wirtualnymi lub fizycznymi). Aby uzyskać więcej informacji, zobacz Obsługiwane systemy operacyjne gościa systemu Windows dla Hyper-V w systemie Windows Server. System Windows Server 2022 jest wymagany w przypadku rozmiarów rdzeni 144 i 176, system Windows Server 2016 działa również dla 24, 48 i 96 rdzeni, system Windows Server działa tylko dla 24 i 48 rdzeni.

Ważne

Zalecana nazwa URN obrazu: almalinux:almalinux-hpc:8_7-hpc-gen2:8.7.2023060101, Aby wdrożyć ten obraz za pośrednictwem interfejsu wiersza polecenia platformy Azure, upewnij się, że uwzględniono następujące parametry : --plan 8_7-hpc-gen2 --product almalinux-hpc --publisher almalinux. W przypadku testów skalowania użyj zalecanej nazwy URN wraz z nowym tarballem HPC-X.

Uwaga / Notatka

  • Obsługa NDR jest dodawana w wersji UCX 1.13 lub nowszej. Starsze wersje UCX będą zgłaszać powyższy błąd środowiska uruchomieniowego. Błąd UCX: Nieprawidłowa aktywna szybkość [1677010492.951559] [updsb-vm-0:2754 :0] ib_iface.c:1549 UCX ERROR Invalid active_speed on mlx5_ib0:1: 128.
  • Ibstat pokazuje niską szybkość (SDR): starsze wersje Mellanox OFED (MOFED) nie obsługują NDR i mogą zgłaszać wolniejsze prędkości IB. Użyj wersji MOFED MOFED 5.6-1.0.3.3 lub nowszej.

Dalsze kroki