Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
As APIs do Catálogo de Modelos do Windows ML permitem que seu aplicativo ou biblioteca baixe dinamicamente arquivos de modelo de IA grandes para um local compartilhado no dispositivo de seus próprios catálogos de modelos online sem enviar esses arquivos grandes diretamente com seu aplicativo ou biblioteca. Além disso, o catálogo de modelos ajudará a filtrar quais modelos são compatíveis com o dispositivo Windows em que está sendo executado, de modo que o modelo correto seja baixado para o dispositivo.
O que são as APIs do Catálogo de Modelos?
As APIs do Catálogo de Modelos são um conjunto de APIs que podem ser conectadas a um ou muitos catálogos de modelos de nuvem para facilitar o download e o armazenamento desses modelos localmente no dispositivo para que possam ser usados por qualquer aplicativo do Windows no dispositivo. As APIs têm alguns recursos principais:
- Adicionar catálogos: adicionar um ou muitos catálogos online
- Descobrir modelos compatíveis: localize automaticamente modelos que funcionam com os provedores de hardware e execução do usuário
- Baixar modelos: baixar e armazenar modelos de várias fontes
- Compartilhar modelos entre aplicativos: se vários aplicativos estiverem solicitando o mesmo modelo (mesmo hash SHA256), o modelo será compartilhado em disco sem duplicar downloads
Características principais
Correspondência automática de compatibilidade
O Catálogo de Modelos associa automaticamente os modelos aos provedores de execução disponíveis no sistema (CPU, GPU, NPU etc.). Quando você solicita um modelo, o catálogo retorna apenas modelos compatíveis com a configuração de hardware atual.
Armazenamento de modelos
Os modelos baixados são armazenados em um local específico do usuário. Se vários aplicativos solicitarem o mesmo modelo (mesmo hash SHA256), o modelo já baixado será compartilhado entre esses aplicativos.
Várias fontes de catálogo
Seu aplicativo pode configurar várias fontes de catálogo, permitindo que você:
- Usar modelos de vários fornecedores ou repositórios
- Priorizar determinadas fontes em vez de outras
- Inclua seus próprios catálogos de modelos privados junto aos públicos
Como funciona
O sistema de Catálogo de Modelos consiste em vários componentes:
- Fontes de catálogo: definir onde os modelos podem ser encontrados (URLs para catalogar arquivos JSON)
- Correspondência de modelos: filtra modelos disponíveis com base na compatibilidade do provedor de execução
- Gerenciamento de download: manipula o download e o armazenamento de arquivos de modelo
- Gerenciamento de instância: fornece acesso aos modelos baixados enquanto seu aplicativo está em execução
Identificação do modelo
Os modelos no catálogo têm dois tipos de identificadores:
- Nome: um nome comum como "gpt2" (várias variações de modelo podem compartilhar o mesmo nome)
- Id: um identificador exclusivo no catálogo que normalmente inclui informações do provedor de execução, como "gpt2-cpu" ou "gpt2-npu"
Os aplicativos normalmente usam FindModelAsync com o Nome para simplificar, permitindo que o catálogo selecione a melhor variante de modelo disponível para o sistema atual com base na compatibilidade do provedor de execução.
Suporte ao provedor de execução
O Catálogo de Modelos dá suporte a uma variedade de provedores de execução. Consulte os provedores de execução com suporte nos documentos do Windows ML para obter mais informações.
Esquema de origem do catálogo
As fontes do catálogo de modelos usam um esquema JSON padronizado que define:
- Metadados de modelo (nome, id, versão, editor)
- Provedores de execução com suporte
- Baixar URLs e informações de arquivo
- Informações de licença
- Detalhes das dimensões do modelo
Para obter informações detalhadas sobre o esquema, consulte a origem do catálogo de modelos.
Como começar
Para começar a usar o Catálogo de Modelos em seu aplicativo Windows ML:
- Configurar suas fontes de catálogo
- Criar uma
ModelCataloginstância - Consultar e baixar modelos
- Realize a inferência dos seus modelos com o tempo de execução desejado!
Para obter um passo a passo completo, consulte Introdução ao Catálogo de Modelos.