Partilhar via


Classificação de imagens com Visão Personalizada e Windows Machine Learning

Fluxo de classificação de imagens

Este guia mostra como: treinar um modelo de rede neural para classificar imagens de alimentos usando o serviço Visão Personalizada do Azure; exportar o modelo para o formato ONNX; e implante o modelo em um aplicativo de Aprendizado de Máquina do Windows (Windows ML) executado localmente em um dispositivo Windows. Você não precisa de nenhum conhecimento prévio em aprendizado de máquina! Vamos guiá-lo passo a passo ao longo do processo.

Se você gostaria de aprender como construir e treinar um modelo com Visão Personalizada, então você pode prosseguir para Treinar um modelo.

Se você tiver um modelo e quiser aprender a criar um aplicativo de ML do Windows do zero, consulte o tutorial completo do aplicativo de ML do Windows.

Se quiser começar com um projeto Visual Studio já existente para uma aplicação Windows ML, poderá clonar a aplicação de exemplo do tutorial Custom Vision and Windows ML e usá-la como ponto de partida.

Cenário

Neste tutorial, criaremos um aplicativo de classificação de alimentos de aprendizado de máquina que é executado em dispositivos Windows. O modelo será treinado para reconhecer certos tipos de padrões para classificar uma imagem de alimento e, quando receber uma imagem, retornará uma tag de classificação e o valor de confiança percentual associado dessa classificação.

Pré-requisitos para treinamento modelo

Para criar e treinar um modelo, você precisará de uma assinatura dos serviços da Visão Personalizada do Azure.

Se você é novo no Azure, então você pode se inscrever para uma conta gratuita do Azure. Isso lhe dará a oportunidade de criar, treinar e implantar modelos de aprendizado de máquina com a IA do Azure.

Sugestão

Está interessado em saber mais sobre as opções de inscrição do Azure e as contas gratuitas do Azure? Em seguida, confira Criar uma conta do Azure.

Pré-requisitos para a implantação do aplicativo Windows ML

Para criar e implantar um aplicativo de ML do Windows, você precisará do seguinte:

  • Windows 10, versão 1809 (compilação 17763) ou posterior. Você pode verificar o número da versão da compilação executando winver através do comando Executar (tecla do logotipo do Windows + R).
  • SDK do Windows para compilação 17763 ou posterior. Para fazer o download, consulte SDK do Windows.
  • Visual Studio 2017 versão 15.7 ou posterior; mas recomendamos que você use o Visual Studio 2022 ou posterior. Algumas capturas de tela neste tutorial podem ser diferentes da interface do usuário que você verá. Para baixar o Visual Studio, consulte Downloads e ferramentas para desenvolvimento do Windows.
  • Extensão do Visual Studio Windows ML Code Generator (mlgen). Baixe-o para o Visual Studio 2019 ou posterior ou para o Visual Studio 2017.
  • Se você decidir criar um aplicativo da Plataforma Universal do Windows (UWP), precisará habilitar a carga de trabalho de desenvolvimento da Plataforma Universal do Windows no Visual Studio.
  • Ativar o modo de programador no seu PC — consulte Ativar o dispositivo para desenvolvimento.

Observação

As APIs de ML do Windows são incorporadas às versões mais recentes do Windows 10 (1809 ou superior) e do Windows Server 2019. Se sua plataforma de destino for uma versão mais antiga do Windows, você poderá portar seu aplicativo Windows ML para o pacote NuGet redistribuível (Windows 8.1 ou superior).

Preparar os dados

Os modelos de aprendizado de máquina devem ser treinados com dados existentes. Neste guia, você usará um conjunto de dados de imagens de alimentos do Kaggle Open Datasets. Esse conjunto de dados é distribuído sob a licença de domínio público.

Importante

Para usar esse conjunto de dados, você precisa aderir ao termo de uso do site do Kaggle e aos termos de licença que acompanham o Food-11 próprio conjunto de dados. A Microsoft não oferece nenhuma garantia ou representação em relação ao site ou a este conjunto de dados.

O conjunto de dados tem três divisões – avaliação, treinamento e validação – e contém 16.643 imagens de alimentos agrupadas em 11 categorias principais de alimentos. As imagens no conjunto de dados de cada categoria de alimentos são colocadas em uma pasta separada, o que torna o processo de treinamento do modelo mais conveniente.

Faça o download do conjunto de dados de imagem Food-11. O conjunto de dados tem cerca de 1 GB de tamanho, e você pode ser solicitado a criar uma conta no site do Kaggle para baixar os dados.

Conjunto de dados de imagens alimentares

Se preferir, você pode usar qualquer outro conjunto de dados de imagens relevantes. No mínimo, recomendamos que você use pelo menos 30 imagens por tag no conjunto de treinamento inicial. Você também vai querer coletar algumas imagens extras para testar seu modelo depois que ele for treinado.

Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:

  • .jpg, .png, .bmp, ou .gif formato.
  • Não superior a 6MB de tamanho (4MB para imagens de previsão).
  • Nada menos que 256 pixels na borda mais curta; quaisquer imagens mais curtas do que isso serão automaticamente ampliadas pelo Serviço de Visão Personalizada.

Próximos passos

Agora que você conseguiu resolver seus pré-requisitos e preparou seu conjunto de dados, você pode prosseguir para a criação do seu modelo de ML do Windows. Na próxima parte (Treinar seu modelo com Visão Personalizada), você usará a interface Visão Personalizada baseada na Web para criar e treinar seu modelo de classificação.