Compartilhar via


Guia de Início Rápido: Criar um modelo de classificação de imagens com o portal de Visão Personalizada

Importante

A Microsoft está anunciando a desativação planejada do serviço de Visão Personalizada do Azure. A Microsoft fornecerá suporte total para todos os clientes existentes da Visão Personalizada do Azure até 25/09/2028. Durante essa janela de suporte, os clientes são incentivados a começar a planejar e executar sua transição para soluções alternativas. Dependendo do caso de uso, recomendamos os seguintes caminhos para a transição:

  • Para criar modelos personalizados para classificação de imagens e detecção de objetos, o AutoML do Azure Machine Learning oferece a capacidade de treinar ambos os tipos de modelo personalizados usando técnicas clássicas de machine learning
  • Saiba mais sobre o AutoML do Azure Machine Learning e explore como ele pode oferecer suporte para treinamento de modelo personalizado.

A Microsoft também está investindo em soluções baseadas em IA generativas que aumentam a precisão em cenários personalizados usando engenharia de prompt e outras técnicas.

  • Para usar modelos generativos, você pode usar um dos modelos disponíveis no catálogo de modelos do Foundry e criar sua própria solução para visão personalizada.
  • Para uma solução de geração gerenciada para classificação de imagens, o Azure Content Understanding in Foundry Tools (atualmente em versão prévia pública) oferece a capacidade de criar fluxos de trabalho de classificação personalizados. Ele também dá suporte ao processamento de dados não estruturados de qualquer tipo (imagem, documentos, áudio, vídeo) e extrai insights estruturados com base em formatos predefinidos ou definidos pelo usuário.
  • Saiba mais sobre os Modelos do Microsoft Foundry e o Azure Content Understanding (versão prévia pública) e explore como eles podem oferecer caminhos alternativos para suas necessidades personalizadas.

Para obter diretrizes mais detalhadas sobre migração, consulte o Guia de Migração da Visão Personalizada do Azure.

Este guia de início rápido explica como usar o portal da Web da Visão Personalizada para criar um modelo de classificação de imagem. Depois de criar um modelo, você poderá testá-lo com novas imagens e, em algum momento, integrá-lo ao próprio aplicativo de reconhecimento de imagem.

Pré-requisitos

Criar recursos de Visão Personalizada

Para usar o serviço de Visão Personalizada, você precisa criar os recursos de treinamento e previsão da Visão Personalizada no Azure. No portal do Azure, use a página Criar Visão Personalizada para criar um recurso de treinamento e um recurso de previsão.

Criar um novo projeto

Navegue até a página da Web da Visão Personalizada e entre com a mesma conta que você usou para entrar no portal do Azure.

Captura de tela mostrando a página de entrada da Visão Personalizada.

  1. Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.

    Captura de tela da nova caixa de diálogo do projeto com campos para nome, descrição e domínios.

  2. Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.

    Observação

    Se nenhum recurso estiver disponível, confirme se você entrou no customvision.ai com a mesma conta usada para entrar no portal do Azure. Confirme também que você selecionou o mesmo Diretório no site da Visão Personalizada que o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, você pode selecionar seu diretório no menu da conta suspensa no canto superior direito da tela.

  3. Selecione Classificação em Tipos de Projeto. Em Tipos de Classificação, escolha Multirótulo ou Multiclasse, dependendo do seu caso de uso. A classificação multirrótulo aplica qualquer número de suas marcas a uma imagem (zero ou mais), enquanto a classificação multiclasse classifica imagens em categorias simples (cada imagem enviada é classificada na marca mais provável). Você pode alterar o tipo de classificação mais tarde, se desejar.

  4. Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.

    Domínio Finalidade
    Genérico Otimizado para uma ampla gama de tarefas de classificação de imagens. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Genérico.
    Alimentos Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Caso queira classificar fotografias de frutas ou legumes individuais, use o domínio Alimentos.
    Pontos de referência Otimizado para pontos de referência reconhecidos, tanto naturais quanto artificiais. Este domínio funciona melhor quando o ponto de referência está claramente visível na fotografia. Este domínio funciona mesmo quando o ponto de referência está um pouco obstruído devido a pessoas na frente dele.
    Varejo Otimizado para imagens encontradas em um catálogo ou site de compras. Caso deseje uma classificação de alta precisão entre vestidos, calças e camisas, use esse domínio.
    Domínios compactos Otimizados para as restrições de classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente.
  5. Por fim, selecione Criar projeto.

Escolher imagens de treinamento

Você deve usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Você também deve coletar algumas imagens extras para testar seu modelo depois que ele for treinado.

Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:

  • ângulo da câmera
  • iluminação
  • em segundo plano
  • estilo do visual
  • assuntos individuais/agrupados
  • tamanho
  • tipo

Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:

  • deve ser no formato .jpg, .png, .bmp ou .gif
  • não maior que 6 MB de tamanho (4 MB para imagens de previsão)
  • não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será redimensionada automaticamente pelo serviço de Visão Personalizada

Carregar e marcar imagens

Você pode carregar e marcar manualmente imagens para ajudar a treinar o classificador.

  1. Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para mover para a marcação. Sua seleção de marca é aplicada a todo o grupo de imagens que você carrega, portanto, é mais fácil carregar imagens em grupos separados de acordo com suas marcas aplicadas. Você também poderá alterar as marcas das imagens individuais depois que elas forem carregadas.

    Captura de tela do controle Adicionar Imagens é mostrada no canto superior esquerdo e como um botão no centro inferior.

  2. Para criar uma marca, digite o texto no campo Minhas Marcas e pressione Enter. Se a marca já existir, ela aparecerá em um menu suspenso. Em um projeto multirótulo, é possível adicionar mais de uma marca às suas imagens, mas em um projeto multiclasse, só é possível adicionar uma. Para finalizar o carregamento das imagens, use o botão Carregar [número] arquivos.

    Captura de tela da página de upload de imagem com um campo para adicionar marcas.

  3. Selecione Concluído depois que as imagens forem carregadas.

    Captura de tela da barra de progresso mostrando todas as tarefas concluídas.

Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.

Treinar o classificador

Para treinar o classificador, selecione o botão Treinar. O classificador usa todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada marca. Esse processo pode levar vários minutos.

Captura de tela do botão treinar no canto superior direito da barra de ferramentas de cabeçalho da página da Web.

O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.

Captura de tela da janela do navegador com detalhes de treinamento na seção principal.

Avaliar o classificador

Após a conclusão do treinamento, o desempenho do modelo é estimado e exibido. O Serviço de Visão Personalizada usa as imagens que você enviou para treinamento para calcular a precisão e a recuperação. A precisão e a recuperação são duas medidas diferentes da eficácia de um classificador:

  • A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
  • A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.

Captura de tela dos resultados do treinamento mostrando a precisão geral e o recall e a precisão e o recall de cada marca no classificador.

Limite de probabilidade

Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correta (para fins de cálculo de precisão e recall).

Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.

Gerenciar iterações de treinamento

Toda vez que você treina o classificador, cria uma iteração com métricas de desempenho atualizadas. Você pode exibir todas as iterações no painel à esquerdo da guia Desempenho. Você também encontrará o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.

Para saber como acessar seus modelos treinados programaticamente, consulte Chamar a API de previsão.

Próxima etapa

Neste guia de início rápido, você aprendeu a criar e treinar um modelo de classificação de imagem usando o portal da Web de Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.