Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Belangrijk
- Foundry Local is beschikbaar in preview. Openbare preview-versies bieden vroege toegang tot functies die actief zijn geïmplementeerd.
- Functies, benaderingen en processen kunnen worden gewijzigd of beperkte mogelijkheden hebben, voordat algemene beschikbaarheid (GA) wordt uitgevoerd.
Dit artikel bevat een uitgebreide naslaginformatie over de opdrachtregelinterface (CLI) van Foundry. De CLI organiseert opdrachten in logische categorieën om u te helpen bij het beheren van modellen, het beheren van de service en het onderhouden van uw lokale cache.
Vereiste voorwaarden
- Installeer Foundry Local. Zie Aan de slag met Foundry Local voor installatiestappen.
- Gebruik een lokale terminal waar de
foundryCLI beschikbaar is. - Zorg ervoor dat u internettoegang hebt voor downloads die voor het eerst worden gedownload (uitvoeringsproviders en -modellen).
- Azure RBAC: Niet van toepassing (lokaal uitgevoerd).
- Als u een Intel NPU in Windows hebt, installeert u het Intel NPU-stuurprogramma voor optimale NPU-versnelling.
Snelle verificatie
Voer deze opdrachten uit om te bevestigen dat de CLI is geïnstalleerd en de service bereikbaar is.
CLI-help bekijken:
foundry --helpMet deze opdracht worden gebruiksgegevens en de lijst met beschikbare opdrachtgroepen afgedrukt.
Naslaginformatie: Overzicht
Controleer de servicestatus:
foundry service statusMet deze opdracht wordt weergegeven of de Foundry Local-service actief is en omvat daarbij het lokale eindpunt.
Naslaginformatie: Serviceopdrachten
Overzicht
Gebruik de ingebouwde Help om opdrachten en opties te verkennen.
De CLI organiseert opdrachten in drie hoofdcategorieën:
- Model: Opdrachten voor het beheren en uitvoeren van AI-modellen
- Service: Opdrachten voor het beheren van de lokale foundry-service
- Cache: Opdrachten voor het beheren van uw lokale modelopslag
Modelopdrachten
De volgende tabel bevat een overzicht van de opdrachten met betrekking tot het beheren en uitvoeren van modellen:
Opmerking
U kunt het argument opgeven op basis van de modelalias of model-id. Een alias gebruiken:
- Hiermee selecteert u automatisch het beste model voor uw beschikbare hardware. Als u bijvoorbeeld een Nvidia GPU hebt, selecteert Foundry Local het beste GPU-model. Als er een ondersteunde NPU beschikbaar is, selecteert Foundry Local het NPU-model.
- Hiermee kunt u een kortere naam gebruiken zonder dat u de model-id hoeft te onthouden.
Als u een specifiek model wilt uitvoeren, gebruikt u de model-id. Als u bijvoorbeeld de qwen2.5-0.5b CPU wilt uitvoeren, ongeacht uw beschikbare hardware, gebruikt u: foundry model run qwen2.5-0.5b-instruct-generic-cpu.
| Opdracht | Beschrijving |
|---|---|
foundry model --help |
Geeft alle beschikbare modelgerelateerde opdrachten en het bijbehorende gebruik weer. |
foundry model run <model> |
Voert een opgegeven model uit, downloadt het als het niet in de cache is opgeslagen en start een interactie. |
foundry model list |
Geeft een lijst weer van alle beschikbare modellen voor lokaal gebruik. Bij de eerste uitvoering worden uitvoeringsproviders (EPs) voor uw hardware gedownload. |
foundry model list --filter <key>=<value> |
Bevat modellen die zijn gefilterd op de opgegeven criteria (apparaat, taak, alias, provider). |
foundry model info <model> |
Geeft gedetailleerde informatie weer over een specifiek model. |
foundry model info <model> --license |
Geeft de licentiegegevens voor een specifiek model weer. |
foundry model download <model> |
Hiermee downloadt u een model naar de lokale cache zonder het uit te voeren. |
foundry model load <model> |
Laadt een model in de service. |
foundry model unload <model> |
Hiermee wordt een model uit de service verwijderd. |
Volgorde van modellijst
Wanneer er meerdere model-id-varianten beschikbaar zijn voor een alias, worden in de lijst met modellen de modellen in prioriteitsvolgorde weergegeven. Het eerste model in de lijst is het model dat wordt uitgevoerd wanneer u het model opgeeft door alias.
Filteren van modellijst
De foundry model list opdracht ondersteunt het filteren van modellen met behulp van de --filter optie. U kunt modellen filteren op basis van één kenmerk met behulp van sleutel-waardeparen.
foundry model list --filter <key>=<value>
Met deze opdracht worden modellen afgedrukt die overeenkomen met de filtersleutel en waarde.
Referentie: Modellijsten filteren
Opmerking
Wanneer u voor het eerst na de installatie uitvoert foundry model list , downloadt Foundry Local automatisch de relevante uitvoeringsproviders (EPs) voor de hardwareconfiguratie van uw computer. U ziet een voortgangsbalk die aangeeft dat de download is voltooid voordat de modellijst wordt weergegeven.
Ondersteunde filtersleutels:
apparaat - Hardwareapparaattype
Filtert modellen op het hardwareapparaat waarop ze worden uitgevoerd.
Mogelijke waarden:
-
CPU- Modellen voor centrale verwerkingseenheden -
GPU- Grafische verwerkingseenheidmodellen -
NPU- Modellen voor neurale verwerkingseenheden
provider - Uitvoeringsprovider
Filtert modellen op basis van hun uitvoeringsprovider of runtime.
Mogelijke waarden:
-
CPUExecutionProvider- Uitvoering op basis van CPU -
CUDAExecutionProvider- UITVOERING VAN NVIDIA CUDA GPU -
WebGpuExecutionProvider- WebGPU-uitvoering -
QNNExecutionProvider- Qualcomm Neural Network verwerking (NPU) -
OpenVINOExecutionProvider- Intel OpenVINO-uitvoering -
NvTensorRTRTXExecutionProvider- NVIDIA TensorRT-uitvoering -
VitisAIExecutionProvider- AMD Vitis AI-uitvoering
taak - Taaktype model
Filtert modellen op basis van hun beoogde use-case of taak.
Algemene waarden:
-
chat-completion: Ai-modellen voor gesprekken -
text-generation: Modellen voor het genereren van tekst
alias - Modelalias
Filtert modellen op basis van hun alias-id. Ondersteunt jokertekens die overeenkomen met * achtervoegsel.
Voorbeeldwaarden:
phi4-cpuqwen2.5-coder-0.5b-instruct-generic-cpudeepseek-r1-distill-qwen-1.5b-generic-cpuphi-4-mini-instruct-generic-cpu
Speciale filterfuncties
Ondersteuning voor negatie: Voorvoegsel van een waarde waarmee ! overeenkomende modellen worden uitgesloten.
foundry model list --filter device=!GPU
Met deze opdracht worden GPU-modellen uitgesloten van de resultaten.
Naslaginformatie: Speciale filterfuncties
Overeenkomende jokertekens (alleen alias): Toevoegen * aan overeenkomende voorvoegsels bij het filteren op alias.
foundry model list --filter alias=qwen*
Met deze opdracht worden modellen geretourneerd waarvan de alias begint met qwen.
Referentie: Speciale filterfuncties
Voorbeelden
foundry model list --filter device=GPU
foundry model list --filter task=chat-completion
foundry model list --filter provider=CUDAExecutionProvider
Deze voorbeelden filteren de modellijst op apparaat, taak en uitvoeringsprovider.
Naslaginformatie: Filteren van modellijsten
Opmerking
- Alle vergelijkingen zijn hoofdletterongevoelig.
- Er kan slechts één filter per opdracht worden gebruikt.
- Niet-herkende filtersleutels resulteren in een fout.
Serviceopdrachten
De volgende tabel bevat een overzicht van de opdrachten die betrekking hebben op het beheren en uitvoeren van de Foundry Local-service:
| Opdracht | Beschrijving |
|---|---|
foundry service --help |
Geeft alle beschikbare servicegerelateerde opdrachten en het bijbehorende gebruik weer. |
foundry service start |
Start de lokale service Foundry. |
foundry service stop |
Stopt de lokale service Foundry. |
foundry service restart |
Start de lokale service Foundry opnieuw op. |
foundry service status |
Hiermee wordt de huidige status van de lokale service Foundry weergegeven. |
foundry service ps |
Geeft een lijst weer van alle modellen die momenteel zijn geladen in de Foundry Local-service. |
foundry service diag |
Hiermee toont u de logboeken van de Foundry lokale service. |
foundry service set <options> |
Stelt de configuratie van de Foundry Local-service in. |
Cacheopdrachten
De volgende tabel bevat een overzicht van de opdrachten voor het beheren van de lokale cache waarin modellen worden opgeslagen:
| Opdracht | Beschrijving |
|---|---|
foundry cache --help |
Toont alle beschikbare opdrachten die betrekking hebben op de cache en het bijbehorende gebruik. |
foundry cache location |
Toont de huidige cachemap. |
foundry cache list |
Geeft een lijst weer van alle modellen die zijn opgeslagen in de lokale cache. |
foundry cache cd <path> |
Wijzigt de cachemap naar het opgegeven pad. |
foundry cache remove <model> |
Hiermee verwijdert u een model uit de lokale cache. |
Uitvoeringsproviders
Uitvoeringsproviders zijn hardwarespecifieke versnellingsbibliotheken die modellen zo efficiënt mogelijk op uw apparaat uitvoeren.
Ingebouwde uitvoeringsproviders
Foundry Local bevat de CPU-uitvoeringsprovider, de WebGPU-uitvoeringsprovider en de CUDA-uitvoeringsprovider.
De CPU-uitvoeringsprovider gebruikt Microsoft Linear Algebra Subroutines (MLAS) om op elke CPU te draaien en is de CPU-terugval voor Foundry Local.
De WebGPU-uitvoeringsprovider maakt gebruik van Dawn, de systeemeigen implementatie van de web-API, voor versnelling op elke GPU en is de GPU-terugval voor Foundry Local.
De CUDA-uitvoeringsprovider gebruikt NVIDIA CUDA voor versnelling op NVIDIA GPU's. Het vereist een NVIDIA GeForce RTX 30-serie en hoger met minimaal aanbevolen stuurprogrammaversie 32.0.15.5585 en CUDA versie 12.5. Het is onderhevig aan de volgende licentievoorwaarden: Licentieovereenkomst voor NVIDIA Software Development Kits- EULA.
Providers voor het uitvoeren van invoegtoepassingen
De uitvoeringsproviders die in de volgende tabel worden vermeld, zijn beschikbaar voor dynamische download en registratie in Windows, afhankelijk van de compatibiliteit van apparaten en stuurprogramma's. Ze zijn onderworpen aan de opgegeven licentievoorwaarden.
Foundry Local downloadt deze uitvoeringsproviders automatisch bij de eerste uitvoering. De uitvoeringsproviders van de plug-in worden automatisch bijgewerkt wanneer er nieuwe versies beschikbaar zijn.
| Naam (leverancier) | Requirements | Licentievoorwaarden |
|---|---|---|
NvTensorRTRTXExecutionProvider (NVIDIA) |
NVIDIA GeForce RTX 30XX en latere versies met minimaal aanbevolen stuurprogrammaversie 32.0.15.5585 en CUDA versie 12.5 | Gebruiksrechtovereenkomst voor NVIDIA Software Development Kits - GEBRUIKSRECHTOVEREENKOMST |
OpenVINOExecutionProvider (Intel) |
CPU: Intel TigerLake (11e generatie) en latere versies met minimaal aanbevolen stuurprogramma 32.0.100.9565 GPU: Intel AlderLake (12e generatie) en latere versies met minimaal aanbevolen stuurprogramma 32.0.101.1029 NPU: Intel ArrowLake (15e generatie) en latere versies met minimaal aanbevolen stuurprogramma 32.0.100.4239 |
Gebruiksrechtovereenkomst voor Intel OBL-distributie v2025.02.12 |
QNNExecutionProvider (Qualcomm) |
Snapdragon(R) X Elite - X1Exxxxx - Qualcomm(R) Hexagon(TM) NPU met minimale stuurprogrammaversie 30.0.140.0 of nieuwer Snapdragon(R) X Plus - X1Pxxxxx - Qualcomm(R) Hexagon(TM) NPU met minimale driver-versie 30.0.140.0 en latere versies |
Als u de QNN-licentie wilt bekijken, downloadt u de Qualcomm® Neural Processing SDK, pakt u het ZIP-bestand uit en opent u de LICENSE.pdf. |
VitisAIExecutionProvider (AMD) |
Min: Adrenalin Edition 25.6.3 met NPU-stuurprogramma 32.00.0203.280 Max: Adrenalin Edition 25.9.1 met NPU-stuurprogramma 32.00.0203.297 |
Er is geen extra licentie vereist |