Pobieranie i udostępnianie modeli na urządzeniu za pomocą interfejsów API wykazu modeli uczenia maszynowego systemu Windows

Interfejsy API wykazu modeli uczenia maszynowego systemu Windows umożliwiają aplikacji lub bibliotece dynamiczne pobieranie dużych plików modelu sztucznej inteligencji do udostępnionej lokalizacji na urządzeniu z własnych katalogów modeli online bez konieczności wysyłania tych dużych plików bezpośrednio do aplikacji lub biblioteki. Ponadto katalog modeli pomoże filtrować, które modele są zgodne z urządzeniem z systemem Windows, na którym działa, tak aby odpowiedni model został pobrany na urządzenie.

Jakie są interfejsy API katalogu modeli?

Interfejsy API wykazu modeli to zestaw interfejsów API, które można połączyć z jednym lub wieloma katalogami modeli w chmurze, aby ułatwić pobieranie i przechowywanie tych modeli lokalnie na urządzeniu, aby mogły być używane przez dowolne aplikacje systemu Windows na urządzeniu. Interfejsy API mają kilka podstawowych funkcji:

Dodawanie wykazów: dodawanie jednego lub wielu wykazów online
Odnajdywanie zgodnych modeli: automatyczne znajdowanie modeli, które współpracują ze sprzętem użytkownika i dostawcami wykonawczymi
Pobieranie modeli: pobieranie i przechowywanie modeli z różnych źródeł
Udostępnianie modeli w aplikacjach: jeśli wiele aplikacji żąda tego samego modelu (ten sam skrót SHA256), model zostanie udostępniony na dysku bez duplikowania plików do pobrania

Kluczowe funkcje

Automatyczne dopasowywanie zgodności

Katalog modeli automatycznie dopasuje modele do dostępnych dostawców wykonywania systemu (procesor CPU, procesor GPU, procesor NPU itp.). W przypadku żądania modelu wykaz zwraca tylko modele zgodne z bieżącą konfiguracją sprzętu.

Przechowywanie danych modelu

Pobrane modele są przechowywane w lokalizacji specyficznej dla użytkownika. Jeśli wiele aplikacji zażąda tego samego modelu (ten sam skrót SHA256), już pobrany model zostanie udostępniony tym aplikacjom.

Wiele źródeł katalogu

Aplikacja może skonfigurować wiele źródeł wykazu, co umożliwia:

Korzystanie z modeli od wielu dostawców lub repozytoriów
Priorytetyzacja niektórych źródeł nad innymi
Uwzględnij swoje prywatne katalogi modeli obok publicznych

Jak to działa

System wykazu modeli składa się z kilku składników:

Źródła wykazu: określ, gdzie można znaleźć modele (adresy URL do katalogu plików JSON)
Dopasowywanie modelu: Filtruje dostępne modele na podstawie zgodności z dostawcą wykonywania
Zarządzanie pobieraniem: obsługuje pobieranie i przechowywanie plików modelu
Zarządzanie wystąpieniami: zapewnia dostęp do pobranych modeli, gdy aplikacja jest uruchomiona

Identyfikacja modelu

Modele w katalogu mają dwa typy identyfikatorów:

Nazwa: nazwa pospolita, taka jak "gpt2" (wiele odmian modelu może mieć taką samą nazwę)
Identyfikator: unikatowy w katalogu identyfikator, który zwykle zawiera informacje o dostawcy usług wykonywania, takie jak "gpt2-cpu" lub "gpt2-npu"

Aplikacje zwykle używają FindModelAsync z użyciem nazwy dla uproszczenia, umożliwiając katalogowi wybranie najlepszego dostępnego wariantu modelu dla bieżącego systemu na podstawie zgodności dostawcy usług wykonawczych.

Obsługa wykonawcy wykonania

Katalog modeli obsługuje różnych dostawców realizacji. Aby uzyskać więcej informacji, zobacz obsługiwanych dostawców wykonywania w dokumentacji usługi Windows ML .

Schemat źródła wykazu

Źródła wykazu modeli używają standardowego schematu JSON, który definiuje:

Metadane modelu (nazwa, identyfikator, wersja, wydawca)
Obsługiwani dostawcy usług wykonywania
Pobieranie adresów URL i informacji o plikach
Informacje o licencji
Szczegóły rozmiaru modelu

Aby uzyskać szczegółowe informacje o schemacie, zobacz Źródło wykazu modeli.

Wprowadzenie

Aby rozpocząć korzystanie z katalogu modeli w aplikacji uczenia maszynowego systemu Windows:

Skonfiguruj źródła katalogu
Utwórz ModelCatalog wystąpienie
Wykonywanie zapytań i pobieranie modeli
Wnioskowanie modeli przy użyciu żądanego środowiska uruchomieniowego!

Aby zapoznać się z kompletnym przewodnikiem, zobacz Wprowadzenie do wykazu modeli.

Dalsze kroki

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-11-12