Resumen
En este módulo, ha obtenido información sobre los modelos de IA generativos habilitados para audio y cómo implementar soluciones de chat que incluyen entrada basada en audio.
Los modelos habilitados para audio permiten crear soluciones de inteligencia artificial que puedan comprender el audio y responder a preguntas o instrucciones relacionadas. Además de identificar las palabras habladas, algunos modelos también pueden usar el razonamiento en función de lo que escuchan. Por ejemplo, pueden resumir un mensaje o evaluar la opinión del hablante.
Sugerencia
Para obtener más información sobre cómo trabajar con modelos multimodales en Microsoft Foundry, consulte Uso de la imagen y el audio en las finalizaciones de chat con la inferencia del modelo de Azure AI e Inicio rápido: Uso de voz y audio en los chats de IA.