Résumé
Dans ce module, vous avez découvert les modèles d’IA générative compatibles audio et comment implémenter des solutions de conversation qui incluent des entrées audio.
Les modèles compatibles audio vous permettent de créer des solutions IA capables de comprendre l’audio et de répondre à des questions ou instructions connexes. Au-delà de l’identification des mots parlés, certains modèles peuvent également utiliser le raisonnement en fonction de ce qu’ils entendent. Par exemple, ils peuvent résumer un message ou évaluer le sentiment de l’orateur.
Conseil / Astuce
Pour plus d’informations sur l’utilisation de modèles multimodaux dans Microsoft Foundry, consultez Comment utiliser l’image et l’audio dans les complétions de chat avec l’inférence de modèles d'IA avec Azure et Démarrage rapide : Utiliser la voix et l’audio dans vos conversations avec l’IA.