Déployer un modèle multimodal

3 minutes

Pour gérer les invites qui incluent l’audio, vous devez déployer un modèle IA génératif modal , en d’autres termes, un modèle qui prend en charge non seulement l’entrée textuelle, mais également l’entrée audio. Les modèles modals disponibles dans Microsoft Foundry incluent (entre autres) :

Microsoft Phi-4-modal-instruct
OpenAI gpt-4o
OpenAI gpt-4o-mini

Conseil / Astuce

Pour en savoir plus sur les modèles disponibles dans Microsoft Foundry, consultez l’article du catalogue de modèles et des collections dans le portail Microsoft Foundry de la documentation Microsoft Foundry.

Test de modèles multimodaux avec des invitations sonores

Après avoir déployé un modèle modal, vous pouvez le tester dans le terrain de jeu de conversation dans le portail Microsoft Foundry. Certains modèles vous permettent d’inclure des pièces jointes audio dans le terrain de jeu, soit en chargeant un fichier ou en enregistrant un message.

Capture d’écran du terrain de jeu de conversation avec une invite audio.

Dans l'espace de discussion, vous pouvez charger un fichier audio local et ajouter du texte au message pour susciter une réponse d'un modèle multimodal.

Commentaires

Cette page a-t-elle été utile ?