Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Interfejsy API wykazu modeli uczenia maszynowego systemu Windows umożliwiają aplikacji lub bibliotece dynamiczne pobieranie dużych plików modelu sztucznej inteligencji do udostępnionej lokalizacji na urządzeniu z własnych katalogów modeli online bez konieczności wysyłania tych dużych plików bezpośrednio do aplikacji lub biblioteki. Ponadto katalog modeli pomoże filtrować, które modele są zgodne z urządzeniem z systemem Windows, na którym działa, tak aby odpowiedni model został pobrany na urządzenie.
Jakie są interfejsy API katalogu modeli?
Interfejsy API wykazu modeli to zestaw interfejsów API, które można połączyć z jednym lub wieloma katalogami modeli w chmurze, aby ułatwić pobieranie i przechowywanie tych modeli lokalnie na urządzeniu, aby mogły być używane przez dowolne aplikacje systemu Windows na urządzeniu. Interfejsy API mają kilka podstawowych funkcji:
- Dodawanie wykazów: dodawanie jednego lub wielu wykazów online
- Odnajdywanie zgodnych modeli: automatyczne znajdowanie modeli, które współpracują ze sprzętem użytkownika i dostawcami wykonawczymi
- Pobieranie modeli: pobieranie i przechowywanie modeli z różnych źródeł
- Udostępnianie modeli w aplikacjach: jeśli wiele aplikacji żąda tego samego modelu (ten sam skrót SHA256), model zostanie udostępniony na dysku bez duplikowania plików do pobrania
Kluczowe funkcje
Automatyczne dopasowywanie zgodności
Katalog modeli automatycznie dopasuje modele do dostępnych dostawców wykonywania systemu (procesor CPU, procesor GPU, procesor NPU itp.). W przypadku żądania modelu wykaz zwraca tylko modele zgodne z bieżącą konfiguracją sprzętu.
Przechowywanie danych modelu
Pobrane modele są przechowywane w lokalizacji specyficznej dla użytkownika. Jeśli wiele aplikacji zażąda tego samego modelu (ten sam skrót SHA256), już pobrany model zostanie udostępniony tym aplikacjom.
Wiele źródeł katalogu
Aplikacja może skonfigurować wiele źródeł wykazu, co umożliwia:
- Korzystanie z modeli od wielu dostawców lub repozytoriów
- Priorytetyzacja niektórych źródeł nad innymi
- Uwzględnij swoje prywatne katalogi modeli obok publicznych
Jak to działa
System wykazu modeli składa się z kilku składników:
- Źródła wykazu: określ, gdzie można znaleźć modele (adresy URL do katalogu plików JSON)
- Dopasowywanie modelu: Filtruje dostępne modele na podstawie zgodności z dostawcą wykonywania
- Zarządzanie pobieraniem: obsługuje pobieranie i przechowywanie plików modelu
- Zarządzanie wystąpieniami: zapewnia dostęp do pobranych modeli, gdy aplikacja jest uruchomiona
Identyfikacja modelu
Modele w katalogu mają dwa typy identyfikatorów:
- Nazwa: nazwa pospolita, taka jak "gpt2" (wiele odmian modelu może mieć taką samą nazwę)
- Identyfikator: unikatowy w katalogu identyfikator, który zwykle zawiera informacje o dostawcy usług wykonywania, takie jak "gpt2-cpu" lub "gpt2-npu"
Aplikacje zwykle używają FindModelAsync z użyciem nazwy dla uproszczenia, umożliwiając katalogowi wybranie najlepszego dostępnego wariantu modelu dla bieżącego systemu na podstawie zgodności dostawcy usług wykonawczych.
Obsługa wykonawcy wykonania
Katalog modeli obsługuje różnych dostawców realizacji. Aby uzyskać więcej informacji, zobacz obsługiwanych dostawców wykonywania w dokumentacji usługi Windows ML .
Schemat źródła wykazu
Źródła wykazu modeli używają standardowego schematu JSON, który definiuje:
- Metadane modelu (nazwa, identyfikator, wersja, wydawca)
- Obsługiwani dostawcy usług wykonywania
- Pobieranie adresów URL i informacji o plikach
- Informacje o licencji
- Szczegóły rozmiaru modelu
Aby uzyskać szczegółowe informacje o schemacie, zobacz Źródło wykazu modeli.
Wprowadzenie
Aby rozpocząć korzystanie z katalogu modeli w aplikacji uczenia maszynowego systemu Windows:
- Skonfiguruj źródła katalogu
- Utwórz
ModelCatalogwystąpienie - Wykonywanie zapytań i pobieranie modeli
- Wnioskowanie modeli przy użyciu żądanego środowiska uruchomieniowego!
Aby zapoznać się z kompletnym przewodnikiem, zobacz Wprowadzenie do wykazu modeli.