Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Met deze extensie worden NVIDIA GPU-stuurprogramma's geïnstalleerd op virtuele Linux-machines uit de N-serie (VM's). Afhankelijk van de VM-familie installeert de extensie CUDA- of GRID-stuurprogramma's. Wanneer u NVIDIA-stuurprogramma's installeert met behulp van deze extensie, gaat u akkoord met de voorwaarden van de licentieovereenkomst voor NVIDIA-eindgebruikers. Tijdens het installatieproces kan de virtuele machine opnieuw worden opgestart om de installatie van het stuurprogramma te voltooien.
Instructies voor handmatige installatie van de stuurprogramma's en de huidige ondersteunde versies zijn beschikbaar. Er is ook een extensie beschikbaar voor het installeren van NVIDIA GPU-stuurprogramma's op vm's uit de Windows N-serie.
Notitie
Voor VM's uit de NVadsA10v5-serie blijft deze extensie v17.x gebruiken totdat de v18.x-implementatie in onafhankelijke clouds in januari 2026 is voltooid.
Notitie
Als Beveiligd opstarten is ingeschakeld, moeten alle opstartonderdelen van het besturingssysteem (opstartlaadprogramma, kernel, kernelstuurprogramma's) worden ondertekend door vertrouwde uitgevers (sleutel die wordt vertrouwd door het systeem). Beveiligd opstarten wordt niet ondersteund met Windows- of Linux-extensies. Zie voor meer informatie over het handmatig installeren van GPU-stuurprogramma's waarvoor Beveiligd opstarten is ingeschakeld, de installatie van GPU-stuurprogramma's uit de Azure N-serie voor Linux.
Notitie
De EXTENSIES van het GPU-stuurprogramma werken het stuurprogramma niet automatisch bij nadat de extensie is geïnstalleerd. Als u naar een nieuwere stuurprogrammaversie wilt gaan, downloadt en installeert u het stuurprogramma handmatig of verwijdert u de extensie en voegt u de extensie opnieuw toe.
Notitie
Probeer VM-hulp voor snellere diagnostische gegevens. U wordt aangeraden VM-hulp uit te voeren voor Windows of VM-hulp voor Linux. Met deze diagnostische hulpprogramma's op basis van scripts kunt u veelvoorkomende problemen identificeren die van invloed zijn op de Azure VM-gastagent en de algehele VM-status.
Als u prestatieproblemen ondervindt met virtuele machines, voert u deze hulpprogramma's uit voordat u contact op neemt met de ondersteuning.
Vereiste voorwaarden
Besturingssysteem
Deze extensie ondersteunt de volgende distributies van het besturingssysteem, afhankelijk van stuurprogrammaondersteuning voor de specifieke versie van het besturingssysteem:
| Bestuurder | Linux: Ubuntu | Linux: Red Hat Enterprise Linux |
|---|---|---|
| CUDA | 20.04 LTS | 7.9 |
| NETWERK | 22.04 LTS 24.04 LTS |
8.2 |
Notitie
De meest recente ondersteunde CUDA-stuurprogramma's voor VM's uit de NC-serie zijn momenteel 470.82.01. Latere stuurprogrammaversies worden niet ondersteund op de K80-kaarten in NC. Terwijl de extensie wordt bijgewerkt met dit einde van ondersteuning voor NC, installeert u CUDA-stuurprogramma's handmatig voor K80-kaarten in de NC-serie.
Belangrijk
Dit document verwijst naar een releaseversie van Linux die bijna of aan het einde van de levensduur (EOL) nadert. Overweeg om bij te werken naar een recentere versie.
Verbinding met internet
De Microsoft Azure-extensie voor NVIDIA GPU-stuurprogramma's vereist dat de doel-VM is verbonden met internet en toegang heeft.
Extensieschema
In de volgende JSON ziet u het schema voor de extensie:
{
"name": "<myExtensionName>",
"type": "extensions",
"apiVersion": "2015-06-15",
"location": "<location>",
"dependsOn": [
"[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
],
"properties": {
"publisher": "Microsoft.HpcCompute",
"type": "NvidiaGpuDriverLinux",
"typeHandlerVersion": "1.6",
"autoUpgradeMinorVersion": true,
"settings": {
}
}
}
Eigenschappen
| Naam | Waarde/voorbeeld | Gegevenstype |
|---|---|---|
| apiVersion | 2015-06-15 | datum |
| uitgever | Microsoft.HpcCompute | touw |
| soort | NvidiaGpuDriverLinux | touw |
| typehandler-versie | 1.6 | int (integer) |
Instellingen
Alle instellingen zijn optioneel. Het standaardgedrag is om de kernel niet bij te werken als dit niet vereist is voor de installatie van stuurprogramma's en het installeren van het meest recente ondersteunde stuurprogramma en de CUDA-toolkit (indien van toepassing).
| Naam | Omschrijving | Standaardwaarde | Geldige waarden | Gegevenstype |
|---|---|---|---|---|
| OS bijwerken | Werk de kernel bij, zelfs als dit niet vereist is voor de installatie van stuurprogramma's. | onwaar | waar, onwaar | booleaan |
| stuurprogrammaVersie | NV: GRID-stuurprogrammaversie. NC/ND: CUDA Toolkit-versie. De meest recente stuurprogramma's voor de gekozen CUDA worden automatisch geïnstalleerd. |
nieuwste | Lijst met ondersteunde stuurprogrammaversies | touw |
| installCUDA | Installeer de CUDA-toolkit. Alleen relevant voor NC/ND-serie virtuele machines. | waar | waar, onwaar | booleaan |
Implementatie
Azure Portal
U kunt Azure NVIDIA VM-extensies implementeren in Azure Portal.
Ga in een browser naar de Azure Portal.
Ga naar de virtuele machine waarop u het stuurprogramma wilt installeren.
Selecteer Extensies in het linkermenu.
Selecteer Toevoegen.
Scroll om NVIDIA GPU Driver Extension te zoeken en selecteren, en selecteer vervolgens Volgende.
Selecteer Beoordelen en maken en selecteer Maken. Wacht enkele minuten totdat het stuurprogramma is geïmplementeerd.
Controleer of de extensie is toegevoegd aan de lijst met geïnstalleerde extensies.
Azure Resource Manager-sjabloon
U kunt Azure Resource Manager-sjablonen gebruiken om Azure VM-extensies te implementeren. Sjablonen zijn ideaal wanneer u een of meer virtuele machines implementeert waarvoor configuratie na de implementatie is vereist.
De JSON-configuratie voor een virtuele machine-extensie kan worden genest in de virtuele machineresource of op het hoogste niveau van een Resource Manager JSON-sjabloon worden geplaatst. De plaatsing van de JSON-configuratie is van invloed op de waarde van de resourcenaam en het type. Voor meer informatie, zie Set name and type for child resources.
In het volgende voorbeeld wordt ervan uitgegaan dat de extensie is genest binnen de resource van de virtuele machine. Wanneer de extensiebron genest is, wordt de JSON in het "resources": [] object van de virtuele machine geplaatst.
{
"name": "myExtensionName",
"type": "extensions",
"location": "[resourceGroup().location]",
"apiVersion": "2015-06-15",
"dependsOn": [
"[concat('Microsoft.Compute/virtualMachines/', myVM)]"
],
"properties": {
"publisher": "Microsoft.HpcCompute",
"type": "NvidiaGpuDriverLinux",
"typeHandlerVersion": "1.6",
"autoUpgradeMinorVersion": true,
"settings": {
}
}
}
PowerShell
Set-AzVMExtension
-ResourceGroupName "myResourceGroup" `
-VMName "myVM" `
-Location "southcentralus" `
-Publisher "Microsoft.HpcCompute" `
-ExtensionName "NvidiaGpuDriverLinux" `
-ExtensionType "NvidiaGpuDriverLinux" `
-TypeHandlerVersion 1.6 `
-SettingString '{ `
}'
Azure-opdrachtregelinterface (CLI)
Het volgende voorbeeld weerspiegelt de eerder genoemde voorbeelden van Resource Manager en PowerShell.
az vm extension set \
--resource-group myResourceGroup \
--vm-name myVM \
--name NvidiaGpuDriverLinux \
--publisher Microsoft.HpcCompute \
--version 1.6
In het volgende voorbeeld worden ook twee optionele aangepaste instellingen toegevoegd als voorbeeld voor installatie van niet-standaardstuurprogramma's. In het bijzonder wordt de besturingssysteemkernel bijgewerkt naar de nieuwste versie en wordt een specifiek stuurprogramma voor de CUDA-toolkit-versie geïnstalleerd. Let nogmaals op: de --settings opties zijn optioneel en standaard. Het bijwerken van de kernel kan de installatietijden van de extensie verhogen. Het kiezen van een specifieke (oudere) CUDA Toolkit-versie is mogelijk niet altijd compatibel met nieuwere kernels.
az vm extension set \
--resource-group myResourceGroup \
--vm-name myVM \
--name NvidiaGpuDriverLinux \
--publisher Microsoft.HpcCompute \
--version 1.6 \
--settings '{ \
"updateOS": true, \
"driverVersion": "10.0.130" \
}'
Ondersteuning en probleemoplossing
Problemen oplossen
U kunt gegevens ophalen over de status van extensie-implementaties vanuit Azure Portal en met behulp van Azure PowerShell en de Azure CLI. Voer de volgende opdracht uit om de implementatiestatus van extensies voor een bepaalde VIRTUELE machine te zien:
Get-AzVMExtension -ResourceGroupName myResourceGroup -VMName myVM -Name myExtensionName
az vm extension list --resource-group myResourceGroup --vm-name myVM -o table
Uitvoering van de extensie wordt vastgelegd in het volgende bestand. Raadpleeg dit bestand om de status van een langlopende installatie bij te houden en om eventuele fouten op te lossen.
/var/log/azure/nvidia-vmext-status
Afsluitcodes
| Afsluitcode | Betekenis | Mogelijke actie |
|---|---|---|
| 0 | De bewerking is voltooid | |
| 1 | Onjuist gebruik van extensie | Controleer het uitvoerlogboek van de uitvoering. |
| 10 | Linux Integration Services voor Hyper-V en Azure is niet beschikbaar of geïnstalleerd | Controleer de uitvoer van lspci. |
| 11 | NVIDIA GPU is niet gevonden op deze VM-grootte | Gebruik een ondersteunde VM-grootte en een ondersteund besturingssysteem. |
| 12 | Afbeeldingsaanbieding wordt niet ondersteund | |
| 13 | VM-grootte wordt niet ondersteund | Gebruik een VM uit de N-serie om te implementeren. |
| 14 | Bewerking mislukt | Controleer het uitvoerlogboek van de uitvoering. |
Bekende problemen
- GRID-stuurprogramma 16.x en 17.x ondervinden installatieproblemen op Azure-kernel 6.11. Nvidia werkt aan het oplossen van dit probleem, ondertussen, downgrade de Azure-kernel naar 6.8 door deze stappen te volgen. Probeer de stuurprogramma's handmatig opnieuw te installeren of gebruik een extensie na het downgraden van de kernel naar 6.8.
// Get the installed kernel. If kernel 6.11 is installed, downgrade it to 6.8.
uname -a
// Install kernel 6.8. Note that kernel 6.11 is not supported.
$ sudo apt install linux-image-6.8.0-1015-azure
// Get the list of installed kernels.
dpkg --list | egrep -i --color 'linux-image|linux-headers|linux-modules' | awk '{ print $2 }'
// Uninstall any 6.11 kernels.
sudo apt purge linux-headers-6.11.0-1013-azure linux-image-6.11.0-1013-azure linux-modules-6.11.0-1013-azure
// Run the following command to ensure only 6.8 images, headers, and modules are installed and no other versions are present.
dpkg --list | egrep -i --color 'linux-image|linux-headers|linux-modules' | awk '{ print $2 }'
// Results from the previous command:
linux-headers-6.8.0-1015-azure
linux-image-6.8.0-1015-azure
linux-modules-6.8.0-1015-azure
// Open the grub settings and modify the GRUB_DEFAULT="0" to GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.8.0-1015-azure".
$ sudo vim /etc/default/grub
// The grub file will look like the following:
GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.8.0-1015-azure"
GRUB_TIMEOUT_STYLE=hidden
GRUB_TIMEOUT=0
GRUB_DISTRIBUTOR=`lsb_release -i -s 2> /dev/null || echo Debian`
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX=""
///////////////////
// Update GRUB and reboot.
$ sudo update-grub && sudo update-grub2
$ sudo reboot
// Reinstall the driver after reboot.
-
NvidiaGpuDriverLinuxinstalleert momenteel de nieuwste17.5GRID-stuurprogramma's, die problemen ondervinden met CUDA op A10-serie. NVIDIA werkt aan het oplossen van dit probleem. Gebruik ondertussen grid-stuurprogramma16.5door een runtime-instelling door te geven aan de extensie.
az vm extension set --resource-group <rg-name> --vm-name <vm-name> --name NvidiaGpuDriverLinux --publisher Microsoft.HpcCompute --settings "{'driverVersion':'535.161'}"
{
"name": "NvidiaGpuDriverLinux",
"type": "extensions",
"apiVersion": "2015-06-15",
"location": "<location>",
"dependsOn": [
"[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
],
"properties": {
"publisher": "Microsoft.HpcCompute",
"type": "NvidiaGpuDriverLinux",
"typeHandlerVersion": "1.11",
"autoUpgradeMinorVersion": true,
"settings": {
"driverVersion": "535.161"
}
}
}
- GRID Driver versie
17.xis onverenigbaar met NVv3 (NVIDIA Tesla M60). GRID-stuurprogramma's tot versie16.5worden ondersteund.NvidiaGpuDriverLinuxinstalleert de meest recente stuurprogramma's die niet compatibel zijn op NVv3 SKU. Gebruik in plaats daarvan de volgende runtime-instellingen om af te dwingen dat de extensie een oudere versie van het stuurprogramma installeert. Zie NVIDIA GPU-resources voor meer informatie over stuurprogrammaversies.
az vm extension set --resource-group <rg-name> --vm-name <vm-name> --name NvidiaGpuDriverLinux --publisher Microsoft.HpcCompute --settings "{'driverVersion':'535.161'}"
{
"name": "NvidiaGpuDriverLinux",
"type": "extensions",
"apiVersion": "2015-06-15",
"location": "<location>",
"dependsOn": [
"[concat('Microsoft.Compute/virtualMachines/', <myVM>)]"
],
"properties": {
"publisher": "Microsoft.HpcCompute",
"type": "NvidiaGpuDriverLinux",
"typeHandlerVersion": "1.11",
"autoUpgradeMinorVersion": true,
"settings": {
"driverVersion": "535.161"
}
}
}
- Grid 17.5 Linux-stuurprogramma heeft een bug waarbij dit van invloed is op CUDA-gerelateerde werkbelasting. Fouthandtekening omvat doorgaans CUDA-apparaten die niet beschikbaar zijn. Hoewel Azure dit probleem probeert op te lossen, gebruikt u GRID-stuurprogramma 16.5 om door te gaan met het uitvoeren van uw workload.
Ondersteuning
Als u op enig moment in dit artikel meer hulp nodig hebt, neemt u contact op met de Azure-experts op de MSDN Azure- en Stack Overflow-forums. U kunt ook een Azure-ondersteuningsincident indienen. Ga naar ondersteuning voor Azure en selecteer Ondersteuning krijgen. Lees de veelgestelde vragen over ondersteuning voor Azure voor meer informatie over het gebruik ervan.
Volgende stappen
- Zie extensies en functies voor virtuele machines voor Linux voor meer informatie over extensies.
- Voor meer informatie over VM's uit de N-serie, zie GPU-geoptimaliseerde groottes van virtuele machines.