Udostępnij przez


Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Windows

Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Windows instaluje sterowniki procesora GPU NVIDIA na maszynach wirtualnych z serii N systemu Windows. W zależności od rodziny maszyn wirtualnych rozszerzenie instaluje sterowniki CUDA lub GRID. Podczas instalowania sterowników FIRMY NVIDIA przy użyciu tego rozszerzenia akceptujesz warunki umowy licencyjnej NVIDIA End-User i zgadzasz się na nie. Podczas procesu instalacji maszyna wirtualna może zostać ponownie uruchomiona, aby ukończyć konfigurację sterownika.

Instrukcje dotyczące ręcznej instalacji sterowników oraz lista bieżących obsługiwanych wersji jest dostępna do przejrzenia. Aby uzyskać więcej informacji, zobacz Instalowanie sterowników procesora GPU NVIDIA na maszynach wirtualnych serii N z systemem Windows.

Rozszerzenie sterownika procesora GPU firmy NVIDIA można również wdrożyć na maszynach wirtualnych serii N z systemem Linux. Aby uzyskać więcej informacji, zobacz Rozszerzenie sterownika procesora GPU firmy NVIDIA dla systemu Linux.

Note

W przypadku maszyn wirtualnych serii NVadsA10v5 to rozszerzenie będzie nadal używać wersji 17.x do momentu zakończenia wdrożenia wersji 18.x w suwerennych chmurach w styczniu 2026 r.

Note

Rozszerzenia sterowników procesora GPU nie aktualizują automatycznie sterownika po zainstalowaniu rozszerzenia. Jeśli musisz przejść do nowszej wersji sterownika, pobierz ręcznie i zainstaluj sterownik lub usuń i ponownie dodaj rozszerzenie.

Note

Wypróbuj pomoc maszyny wirtualnej, aby uzyskać szybszą diagnostykę. Zalecamy uruchomienie asysty maszyny wirtualnej dla systemu Windows lub asystenta maszyny wirtualnej dla systemu Linux. Te narzędzia diagnostyczne oparte na skryptach ułatwiają identyfikowanie typowych problemów, które mają wpływ na agenta gościa maszyny wirtualnej platformy Azure i ogólną kondycję maszyny wirtualnej.

Jeśli występują problemy z wydajnością maszyn wirtualnych, przed skontaktowaniem się z pomocą techniczną uruchom te narzędzia.

Prerequisites

Upewnij się, że maszyna wirtualna spełnia wymagania wstępne dotyczące korzystania z rozszerzenia sterownika procesora GPU firmy NVIDIA.

Obsługa systemu operacyjnego

Rozszerzenie sterownika procesora GPU firmy NVIDIA obsługuje następujące wersje systemu Windows:

Distribution Version
Windows 11 Core
Windows 10 Core
Windows Server 2022 Core
Windows Server 2019 Core
Windows Server 2016 Core
Windows Server 2012 R2 Core

Wymagane jest połączenie internetowe

Rozszerzenie sterownika procesora GPU firmy NVIDIA wymaga, aby docelowa maszyna wirtualna została połączona z Internetem i ma dostęp.

Przeglądanie schematu rozszerzenia

Poniższy fragment kodu JSON przedstawia schemat rozszerzenia:

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.10",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

Properties

Schemat JSON zawiera wartości dla następujących parametrów.

Name Value/Example Typ danych
apiVersion 2015-06-15 date
publisher Microsoft.HpcCompute ciąg
type NvidiaGpuDriverWindows ciąg
typeHandlerVersion 1.10 int

Wdrażanie rozszerzenia

Rozszerzenia maszyn wirtualnych platformy Azure można zarządzać przy użyciu interfejsu wiersza polecenia platformy Azure, programu PowerShell, szablonów usługi Azure Resource Manager (ARM) i witryny Azure Portal.

Note

Niektóre z poniższych przykładów używają <placeholder> wartości parametrów w poleceniach. Przed uruchomieniem każdego polecenia pamiętaj, aby zastąpić wszystkie wartości symboli zastępczych określonymi wartościami konfiguracji.

Azure Portal

Aby zainstalować rozszerzenie sterownika procesora GPU firmy NVIDIA w witrynie Azure Portal, wykonaj następujące kroki:

  1. W witrynie Azure Portal przejdź do maszyny wirtualnej, na której chcesz zainstalować rozszerzenie.

  2. W obszarze Ustawienia wybierz pozycję Rozszerzenia i aplikacje.

    Zrzut ekranu przedstawiający sposób wybierania pozycji Rozszerzenia i aplikacje dla maszyny wirtualnej w witrynie Azure Portal.

  3. W obszarze Rozszerzenia wybierz pozycję + Dodaj.

    Zrzut ekranu przedstawiający sposób dodawania rozszerzenia dla maszyny wirtualnej w witrynie Azure Portal.

  4. Znajdź i wybierz pozycję Rozszerzenie sterownika procesora GPU firmy NVIDIA, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający sposób lokalizowania i wybierania rozszerzenia sterownika procesora GPU FIRMY NVIDIA dla maszyny wirtualnej w witrynie Azure Portal.

  5. Wybierz opcję Recenzja i utwórz. Potwierdź akcję wdrożenia i wybierz pozycję Utwórz.

    Poczekaj kilka minut na wdrożenie rozszerzenia.

    Zrzut ekranu przedstawiający sposób tworzenia rozszerzenia sterownika procesora GPU FIRMY NVIDIA na wybranej maszynie wirtualnej w witrynie Azure Portal.

  6. Upewnij się, że rozszerzenie jest wyświetlane jako zainstalowane rozszerzenie dla maszyny wirtualnej.

    Zrzut ekranu przedstawiający rozszerzenie sterownika procesora GPU firmy NVIDIA na liście rozszerzeń maszyny wirtualnej w witrynie Azure Portal.

szablon usługi ARM

Szablony usługi ARM są idealne podczas wdrażania co najmniej jednej maszyny wirtualnej wymagającej konfiguracji po wdrożeniu.

Konfiguracja JSON rozszerzenia maszyny wirtualnej może być zagnieżdżona wewnątrz zasobu maszyny wirtualnej lub umieszczona na poziomie głównym szablonu JSON ARM. Umieszczanie konfiguracji JSON wpływa na wartość zasobu name i type. Aby uzyskać więcej informacji, przejdź do Ustaw nazwę i typ zasobów podrzędnych.

W poniższym przykładzie założono, że rozszerzenie jest zagnieżdżone wewnątrz zasobu maszyny wirtualnej. Gdy zasób rozszerzenia jest zagnieżdżony, kod JSON umieszczany jest w obiekcie "resources": [] maszyny wirtualnej.

{
  "name": "<myExtensionName>",
  "type": "extensions",
  "location": "[<resourceGroup().location>]",
  "apiVersion": "2015-06-15",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.10",
    "autoUpgradeMinorVersion": true,
    "settings": {
    }
  }
}

PowerShell

Użyj następującego polecenia programu PowerShell, aby wdrożyć rozszerzenie sterownika procesora GPU FIRMY NVIDIA na maszynie wirtualnej.

Set-AzVMExtension
    -ResourceGroupName "<myResourceGroup>" `
    -VMName "<myVM>" `
    -Location "<location>" `
    -Publisher "Microsoft.HpcCompute" `
    -ExtensionName "NvidiaGpuDriverWindows" `
    -ExtensionType "NvidiaGpuDriverWindows" `
    -TypeHandlerVersion 1.10 `
    -SettingString '{ `
	}'

Azure CLI

Uruchom następujące polecenie w interfejsie wiersza polecenia platformy Azure, aby wdrożyć rozszerzenie sterownika procesora GPU firmy NVIDIA na maszynie wirtualnej.

az vm extension set \
  --resource-group <myResourceGroup> \
  --vm-name <myVM> \
  --name NvidiaGpuDriverWindows \
  --publisher Microsoft.HpcCompute \
  --version 1.10 \
  --settings '{ \
  }'

Rozwiązywanie problemów

Poniżej przedstawiono kilka sugestii dotyczących rozwiązywania problemów z wdrażaniem.

Sprawdzanie stanu rozszerzenia

Sprawdź stan wdrożenia rozszerzenia w witrynie Azure Portal lub przy użyciu programu PowerShell lub interfejsu wiersza polecenia platformy Azure.

Aby wyświetlić stan wdrożenia rozszerzeń dla danej maszyny wirtualnej, uruchom następujące polecenia:

Get-AzVMExtension -ResourceGroupName <myResourceGroup> -VMName <myVM> -Name <myExtensionName>
az vm extension list --resource-group <myResourceGroup> --vm-name <myVM> -o table

Przeglądanie dzienników wyjściowych

Wyświetl dzienniki wyjściowe wdrożenia rozszerzenia sterownika procesora GPU firmy NVIDIA w obszarze C:\WindowsAzure\Logs\Plugins\Microsoft.HpcCompute.NvidiaGpuDriverWindows\.

Odpowiadanie na kody błędów

Poniższa tabela zawiera listę typowych kodów błędów dotyczących wdrażania i potencjalnych działań następczych.

Error Description Action
0 Operacja powiodła się. Brak wymaganej akcji.
1 Operacja powiodła się. Reboot.
100 Operacja nie jest obsługiwana lub jej nie można ukończyć. Sprawdź pliki dziennika, aby określić przyczynę błędu, na przykład:
— Wersja programu PowerShell nie jest obsługiwana.
Rozmiar maszyny wirtualnej nie należy do serii N.
— Błąd podczas pobierania danych.
240, 840 Limit czasu operacji. Ponów próbę wykonania operacji.
-1 Wystąpił wyjątek. Sprawdź pliki dziennika, aby określić przyczynę wyjątku.
-5x Operacja została przerwana z powodu oczekującego ponownego uruchomienia. Zrestartuj maszynę wirtualną. Instalacja jest kontynuowana po ponownym uruchomieniu.
Odinstalowanie powinno być wywoływane ręcznie.

Znane problemy

Wersja 17.x sterownika GRID jest niezgodna w systemie NVv3 (NVIDIA Tesla M60). Obsługiwane są sterowniki GRID do wersji 16.5 . NvidiaGpuDriverWindows instaluje najnowsze sterowniki, które są niezgodne z wersją NVv3 SKU. Zamiast tego użyj następujących ustawień środowiska uruchomieniowego, aby wymusić zainstalowanie starszej wersji sterownika. Aby uzyskać więcej informacji na temat wersji sterowników, zobacz Zasoby procesora GPU firmy NVIDIA.

az vm extension set  --resource-group <rg-name> --vm-name <vm-name>  --name NvidiaGpuDriverWindows --publisher Microsoft.HpcCompute --settings "{'driverVersion':'538.46'}"
{
  "name": "NvidiaGpuDriverWindows",
  "type": "extensions",
  "apiVersion": "2015-06-15",
  "location": "<location>",
  "dependsOn": [
    "[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
  ],
  "properties": {
    "publisher": "Microsoft.HpcCompute",
    "type": "NvidiaGpuDriverWindows",
    "typeHandlerVersion": "1.10",
    "autoUpgradeMinorVersion": true,
    "settings": {
         "driverVersion": "538.46"
    }
  }
}

Uzyskiwanie pomocy technicznej

Poniżej przedstawiono kilka innych opcji, które ułatwiają rozwiązywanie problemów z wdrażaniem:

Dalsze kroki