Resumo
Neste módulo, você aprendeu sobre modelos de IA generativa habilitados para áudio e como implementar soluções de bate-papo que incluem entrada baseada em áudio.
Os modelos habilitados para áudio permitem criar soluções de IA que podem entender o áudio e responder a perguntas ou instruções relacionadas. Além de apenas identificar palavras faladas, alguns modelos também podem usar o raciocínio com base no que ouvem. Por exemplo, podem resumir uma mensagem ou avaliar o sentimento do orador.
Sugestão
Para mais informações sobre como trabalhar com modelos multimodais no Microsoft Foundry, veja Como usar imagem e áudio em conversas completas com inferência de modelos de IA Azure e Quickstart: Use fala e áudio nas suas conversas de IA.