Introducción
Los modelos de INTELIGENCIA artificial generativa permiten crear aplicaciones inteligentes basadas en chat que puedan comprender y razonar sobre la entrada. Tradicionalmente, la entrada de texto es el modo principal de interacción con los modelos de IA, pero los modelos multimodales están cada vez más disponibles. Estos modelos permiten que las aplicaciones de chat respondan a la entrada de audio, así como al texto.
En este módulo, analizaremos la inteligencia artificial generativa habilitada para audio y exploraremos cómo puede usar Microsoft Foundry para crear soluciones de inteligencia artificial generativas que respondan a mensajes que incluyan una combinación de datos de texto y audio.