Resumo
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
A visão computacional baseia-se na análise e manipulação de valores numéricos de pixels em imagens. Os modelos de machine learning são treinados usando um grande volume de imagens para habilitar cenários comuns de visão computacional, como classificação de imagem, detecção de objetos, segmentação semântica, geração de legendas e outros.
Os modelos usados para tarefas de visão computacional evoluíram de classificadores de imagem baseados em estatísticas por meio de redes neurais convolucionais para os modelos multimodal baseados em transformador de hoje. Modelos de ponta podem não apenas interpretar a entrada visual, mas também gerar saída visual.
Dica
Para obter mais informações, consulte o que é a Visão do Azure?.