Déployer un modèle multimodal
Pour gérer les invites qui incluent l’audio, vous devez déployer un modèle IA génératif modal , en d’autres termes, un modèle qui prend en charge non seulement l’entrée textuelle, mais également l’entrée audio. Les modèles modals disponibles dans Microsoft Foundry incluent (entre autres) :
- Microsoft Phi-4-modal-instruct
- OpenAI gpt-4o
- OpenAI gpt-4o-mini
Conseil / Astuce
Pour en savoir plus sur les modèles disponibles dans Microsoft Foundry, consultez l’article du catalogue de modèles et des collections dans le portail Microsoft Foundry de la documentation Microsoft Foundry.
Test de modèles multimodaux avec des invitations sonores
Après avoir déployé un modèle modal, vous pouvez le tester dans le terrain de jeu de conversation dans le portail Microsoft Foundry. Certains modèles vous permettent d’inclure des pièces jointes audio dans le terrain de jeu, soit en chargeant un fichier ou en enregistrant un message.
Dans l'espace de discussion, vous pouvez charger un fichier audio local et ajouter du texte au message pour susciter une réponse d'un modèle multimodal.