Resumo

1 minuto

Neste módulo, você aprendeu sobre modelos de IA generativa habilitados para visão e como implementar soluções de bate-papo que incluem entrada baseada em imagem.

Os modelos habilitados para visão permitem criar soluções de IA que podem entender imagens e responder a perguntas ou instruções relacionadas. Além de apenas identificar objetos em imagens, alguns modelos também podem usar o raciocínio com base no que veem. Por exemplo, eles podem interpretar um gráfico ou avaliar se um objeto está danificado.

Sugestão

Para mais informações sobre como trabalhar com modelos multimodais no Microsoft Foundry, veja Como usar imagem e áudio em conclusãos de chat com inferência de modelos de IA Azure e Quickstart: Use imagens nas suas conversas de IA.

Feedback

Esta página foi útil?