Udostępnij przez


Rozszerzenie sterownika InfiniBand dla systemu Linux

To rozszerzenie instaluje sterowniki InfiniBand OFED na maszynach wirtualnych serii HB z włączonymi InfiniBand i SR-IOV (rozmiary 'r') oraz maszynach serii N działających na systemie Linux. W zależności od rodziny maszyn wirtualnych rozszerzenie instaluje odpowiednie sterowniki dla karty sieciowej Connect-X. Nie instaluje sterowników InfiniBand ND na maszynach wirtualnych z serii HB i N bez obsługi SR-IOV.

Instrukcje dotyczące ręcznej instalacji sterowników OFED są dostępne w temacie Włączanie funkcji InfiniBand na maszynach wirtualnych HPC.

Dostępne jest również rozszerzenie do instalowania sterowników InfiniBand dla maszyn wirtualnych z systemem Windows.

Uwaga / Notatka

Wypróbuj pomoc maszyny wirtualnej, aby uzyskać szybszą diagnostykę. Zalecamy uruchomienie asysty maszyny wirtualnej dla systemu Windows lub asystenta maszyny wirtualnej dla systemu Linux. Te narzędzia diagnostyczne oparte na skryptach ułatwiają identyfikowanie typowych problemów, które mają wpływ na agenta gościa maszyny wirtualnej platformy Azure i ogólną kondycję maszyny wirtualnej.

Jeśli występują problemy z wydajnością maszyn wirtualnych, przed skontaktowaniem się z pomocą techniczną uruchom te narzędzia.

Wymagania wstępne

System operacyjny

To rozszerzenie obsługuje następujące dystrybucje systemu operacyjnego, w zależności od obsługi sterowników dla określonej wersji systemu operacyjnego. Aby uzyskać najnowszą listę obsługiwanych wersji systemu operacyjnego i sterowników, zobacz resources.json

Dystrybucja Version Sterowniki kart interfejsu sieciowego InfiniBand
Ubuntu 18.04 LTS, 20.04 LTS, 22.04 LTS CX3-Pro, CX5, CX6
Red Hat Enterprise Linux 7.4, 7.5, 7.6, 7.7, 7.8, 7.9, 8.1, 8,2 CX3-Pro, CX5, CX6

Ważne

Ten dokument odnosi się do wersji systemu Linux, która zbliża się lub znajduje się w fazie końca wsparcia (EOL). Rozważ aktualizację do nowszej wersji.

Łączność z Internetem

Rozszerzenie platformy Microsoft Azure dla sterowników InfiniBand wymaga, aby docelowa maszyna wirtualna została połączona i ma dostęp do Internetu.

Schemat rozszerzenia

Poniższy kod JSON przedstawia schemat rozszerzenia.

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Właściwości

Nazwa Wartość / przykład Typ danych
apiVersion 2015-06-15 date
wydawca Microsoft.HpcCompute ciąg
typ InfiniBandDriverLinux ciąg
typeHandlerVersion 1.2 int

Wdrożenie

Szablon usługi Azure Resource Manager

Rozszerzenia maszyn wirtualnych platformy Azure można wdrażać za pomocą szablonów usługi Azure Resource Manager. Szablony są idealne podczas wdrażania co najmniej jednej maszyny wirtualnej wymagającej konfiguracji po wdrożeniu.

Konfiguracja JSON rozszerzenia maszyny wirtualnej może być zagnieżdżona wewnątrz zasobu maszyny wirtualnej lub umieszczona na poziomie głównym lub najwyższym szablonu JSON usługi Resource Manager. Umieszczanie konfiguracji JSON wpływa na wartość nazwy i typu zasobu. Aby uzyskać więcej informacji, zobacz Ustaw nazwę i typ dla zasobów podrzędnych.

W poniższym przykładzie założono, że rozszerzenie jest zagnieżdżone wewnątrz zasobu maszyny wirtualnej. Podczas zagnieżdżania zasobu rozszerzenia kod JSON jest umieszczany w "resources": [] obiekcie maszyny wirtualnej.

{
  "name": "myExtensionName",
  "type": "extensions",
  "location": "[resourceGroup().location]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', myVM)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "InfiniBandDriverLinux",
    "typeHandlerVersion": "1.2",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Set-AzVMExtension
    -ResourceGroupName "myResourceGroup" `
    -VMName "myVM" `
    -Location "southcentralus" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "InfiniBandDriverLinux" `
    -ExtensionType "InfiniBandDriverLinux" `
    -TypeHandlerVersion 1.2 `
    -SettingString '{ `
	}'

Azure CLI

az vm extension set \
  --resource-group myResourceGroup \
  --vm-name myVM \
  --name InfiniBandDriverLinux \
  --publisher Microsoft.HpcCompute \
  --version 1.2

Dodawanie rozszerzenia do zestawu skalowania maszyn wirtualnych

W poniższym przykładzie zainstalowano najnowsze rozszerzenie InfiniBandDriverLinux w najnowszej wersji 1.2 na wszystkich maszynach wirtualnych obsługujących funkcję RDMA w istniejącym zestawie skalowania maszyn wirtualnych o nazwie myVMSS wdrożonym w grupie zasobów o nazwie myResourceGroup:

$VMSS = Get-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS"
Add-AzVmssExtension -VirtualMachineScaleSet $VMSS -Name "InfiniBandDriverLinux" -Publisher "Microsoft.HpcCompute" -Type "InfiniBandDriverLinux" -TypeHandlerVersion "1.2"
Update-AzVmss -ResourceGroupName "myResourceGroup" -VMScaleSetName "MyVMSS" -VirtualMachineScaleSet $VMSS
Update-AzVmssInstance -ResourceGroupName "myResourceGroup" -VMScaleSetName "myVMSS" -InstanceId "*"

Rozwiązywanie problemów i pomoc techniczna

Rozwiązywanie problemów

Dane dotyczące stanu wdrożeń rozszerzeń można pobrać z witryny Azure Portal i przy użyciu programu Azure PowerShell i interfejsu wiersza polecenia platformy Azure. Aby wyświetlić stan wdrożenia rozszerzeń dla danej maszyny wirtualnej, uruchom następujące polecenie.

Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table

Dane wyjściowe wykonywania rozszerzenia są rejestrowane w następującym pliku. Zapoznaj się z tym plikiem, aby śledzić stan instalacji oraz rozwiązywać ewentualne usterki.

/var/log/azure/ib-vmext-status

Kody zakończenia

W poniższej tabeli opisano znaczenie i zalecaną akcję na podstawie kodów zakończenia procesu instalacji rozszerzenia.

Kod zakończenia Znaczenie Możliwe działanie
0 Operacja powiodła się
1 Nieprawidłowe użycie rozszerzenia Sprawdź log wykonania
10 Usługi integracji z systemem Linux dla Hyper-V i Azure nie są dostępne ani zainstalowane Sprawdzanie danych wyjściowych biblioteki lspci
11 Nie można odnaleźć aplikacji Mellanox InfiniBand na tym rozmiarze maszyny wirtualnej Użyj obsługiwanego rozmiaru VM i systemu operacyjnego
12 Obsługa obrazu nie jest wspierana
13 Rozmiar maszyny wirtualnej nie jest obsługiwany Wdróż maszynę wirtualną serii H i N z obsługą InfiniBand (w rozmiarze "r")
14 Operacja nie powiodła się Sprawdź log wykonania

Wsparcie

Jeśli potrzebujesz więcej pomocy w dowolnym momencie tego artykułu, możesz skontaktować się z ekspertami platformy Azure na forach MSDN Azure i Stack Overflow. Alternatywnie możesz zgłosić zdarzenie pomocy technicznej za pośrednictwem witryny pomocy technicznej platformy Azure. Aby uzyskać informacje na temat korzystania z pomocy technicznej platformy Azure, zapoznaj się z często zadawanymi pytaniami dotyczącymi usługi Microsoft pomoc techniczna platformy Azure.

Następne kroki

Aby uzyskać więcej informacji na temat maszyn wirtualnych z obsługą technologii InfiniBand (rozmiary 'r'), zobacz maszyny wirtualne serii HB i serii N.