Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Importante
A Microsoft está anunciando a desativação planejada do serviço de Visão Personalizada do Azure. A Microsoft fornecerá suporte total para todos os clientes existentes da Visão Personalizada do Azure até 25/09/2028. Durante essa janela de suporte, os clientes são incentivados a começar a planejar e executar sua transição para soluções alternativas. Dependendo do caso de uso, recomendamos os seguintes caminhos para a transição:
- Para criar modelos personalizados para classificação de imagens e detecção de objetos, o AutoML do Azure Machine Learning oferece a capacidade de treinar ambos os tipos de modelo personalizados usando técnicas clássicas de machine learning
- Saiba mais sobre o AutoML do Azure Machine Learning e explore como ele pode oferecer suporte para treinamento de modelo personalizado.
A Microsoft também está investindo em soluções baseadas em IA generativas que aumentam a precisão em cenários personalizados usando engenharia de prompt e outras técnicas.
- Para usar modelos generativos, você pode usar um dos modelos disponíveis no catálogo de modelos do Foundry e criar sua própria solução para visão personalizada.
- Para uma solução de geração gerenciada para classificação de imagens, o Azure Content Understanding in Foundry Tools (atualmente em versão prévia pública) oferece a capacidade de criar fluxos de trabalho de classificação personalizados. Ele também dá suporte ao processamento de dados não estruturados de qualquer tipo (imagem, documentos, áudio, vídeo) e extrai insights estruturados com base em formatos predefinidos ou definidos pelo usuário.
- Saiba mais sobre os Modelos do Microsoft Foundry e o Azure Content Understanding (versão prévia pública) e explore como eles podem oferecer caminhos alternativos para suas necessidades personalizadas.
Para obter diretrizes mais detalhadas sobre migração, consulte o Guia de Migração da Visão Personalizada do Azure.
Este guia de início rápido explica como usar o portal da Web da Visão Personalizada para criar um modelo de classificação de imagem. Depois de criar um modelo, você poderá testá-lo com novas imagens e, em algum momento, integrá-lo ao próprio aplicativo de reconhecimento de imagem.
Pré-requisitos
- Uma assinatura do Azure. Você pode criar uma conta gratuita.
- Um conjunto de imagens para treinar seu modelo de classificação. Você pode usar o conjunto de imagens de exemplo no GitHub. Ou você pode escolher suas próprias imagens usando as dicas a seguir.
- Um navegador da Web com suporte.
Criar recursos de Visão Personalizada
Para usar o serviço de Visão Personalizada, você precisa criar os recursos de treinamento e previsão da Visão Personalizada no Azure. No portal do Azure, use a página Criar Visão Personalizada para criar um recurso de treinamento e um recurso de previsão.
Criar um novo projeto
Navegue até a página da Web da Visão Personalizada e entre com a mesma conta que você usou para entrar no portal do Azure.
Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.
Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.
Observação
Se nenhum recurso estiver disponível, confirme se você entrou no customvision.ai com a mesma conta usada para entrar no portal do Azure. Confirme também que você selecionou o mesmo Diretório no site da Visão Personalizada que o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, você pode selecionar seu diretório no menu da conta suspensa no canto superior direito da tela.
Selecione Classificação em Tipos de Projeto. Em Tipos de Classificação, escolha Multirótulo ou Multiclasse, dependendo do seu caso de uso. A classificação multirrótulo aplica qualquer número de suas marcas a uma imagem (zero ou mais), enquanto a classificação multiclasse classifica imagens em categorias simples (cada imagem enviada é classificada na marca mais provável). Você pode alterar o tipo de classificação mais tarde, se desejar.
Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.
Domínio Finalidade Genérico Otimizado para uma ampla gama de tarefas de classificação de imagens. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Genérico. Alimentos Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Caso queira classificar fotografias de frutas ou legumes individuais, use o domínio Alimentos. Pontos de referência Otimizado para pontos de referência reconhecidos, tanto naturais quanto artificiais. Este domínio funciona melhor quando o ponto de referência está claramente visível na fotografia. Este domínio funciona mesmo quando o ponto de referência está um pouco obstruído devido a pessoas na frente dele. Varejo Otimizado para imagens encontradas em um catálogo ou site de compras. Caso deseje uma classificação de alta precisão entre vestidos, calças e camisas, use esse domínio. Domínios compactos Otimizados para as restrições de classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente. Por fim, selecione Criar projeto.
Escolher imagens de treinamento
Você deve usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Você também deve coletar algumas imagens extras para testar seu modelo depois que ele for treinado.
Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:
- ângulo da câmera
- iluminação
- em segundo plano
- estilo do visual
- assuntos individuais/agrupados
- tamanho
- tipo
Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:
- deve ser no formato .jpg, .png, .bmp ou .gif
- não maior que 6 MB de tamanho (4 MB para imagens de previsão)
- não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será redimensionada automaticamente pelo serviço de Visão Personalizada
Carregar e marcar imagens
Você pode carregar e marcar manualmente imagens para ajudar a treinar o classificador.
Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para mover para a marcação. Sua seleção de marca é aplicada a todo o grupo de imagens que você carrega, portanto, é mais fácil carregar imagens em grupos separados de acordo com suas marcas aplicadas. Você também poderá alterar as marcas das imagens individuais depois que elas forem carregadas.
Para criar uma marca, digite o texto no campo Minhas Marcas e pressione Enter. Se a marca já existir, ela aparecerá em um menu suspenso. Em um projeto multirótulo, é possível adicionar mais de uma marca às suas imagens, mas em um projeto multiclasse, só é possível adicionar uma. Para finalizar o carregamento das imagens, use o botão Carregar [número] arquivos.
Selecione Concluído depois que as imagens forem carregadas.
Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.
Treinar o classificador
Para treinar o classificador, selecione o botão Treinar. O classificador usa todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada marca. Esse processo pode levar vários minutos.
O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.
Avaliar o classificador
Após a conclusão do treinamento, o desempenho do modelo é estimado e exibido. O Serviço de Visão Personalizada usa as imagens que você enviou para treinamento para calcular a precisão e a recuperação. A precisão e a recuperação são duas medidas diferentes da eficácia de um classificador:
- A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
- A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.
Limite de probabilidade
Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correta (para fins de cálculo de precisão e recall).
Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.
Gerenciar iterações de treinamento
Toda vez que você treina o classificador, cria uma iteração com métricas de desempenho atualizadas. Você pode exibir todas as iterações no painel à esquerdo da guia Desempenho. Você também encontrará o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.
Para saber como acessar seus modelos treinados programaticamente, consulte Chamar a API de previsão.
Próxima etapa
Neste guia de início rápido, você aprendeu a criar e treinar um modelo de classificação de imagem usando o portal da Web de Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.