Partager via


Modifier la version et les paramètres du modèle

Cet article explique comment modifier la version et les paramètres du modèle dans le générateur d’invites. La version et les paramètres du modèle peuvent affecter les performances et le comportement du modèle IA générative.

Sélection du modèle

Vous pouvez changer le modèle en sélectionnant Modèle en haut du générateur d’invites. Le menu déroulant vous permet de choisir parmi les modèles d’IA générative qui génèrent des réponses à votre invite personnalisée.

Important

En novembre 2025, nous avons migré le modèle o3 vers le modèle de raisonnement GPT-5. Les invites exécutées sur le modèle o3 ont été automatiquement transférées vers le modèle de raisonnement GPT-5 sans action requise de votre part. Il est possible de revenir temporairement au modèle o3 en le demandant par le biais d'une demande de support sur les invites. Cette exception dure jusqu’au 17 décembre 2025, après quoi le modèle o3 sera définitivement mis hors service.

L’utilisation d’invites dans Power Apps ou Power Automate consomme des crédits de générateur d’invites, tandis que l’utilisation d’invites dans Microsoft Copilot Studio consomme des crédits Copilot. Apprenez-en davantage sur les crédits de création de licences et d´invite.

Aperçu

Le tableau suivant décrit les différents modèles disponibles.

Modèle GPT Gestion des licences Fonctionnalités Catégorie
GPT-4.1 mini
(Modèle par défaut)
Taux de base Entraîné sur les données jusqu’en juin 2024. Saisir jusqu’à 128K jetons. MinI
GPT-4.1 Taux standard Entraîné sur les données jusqu’en juin 2024. Le contexte autorisait jusqu’à 128 000 jetons. Généralités
Conversation GPT-5 Taux standard Entraîné sur les données jusqu’en septembre 2024. Le contexte autorisait jusqu’à 128 000 jetons. Généralités
Raisonnement GPT-5 Taux premium Entraîné sur les données jusqu’en septembre 2024. Le contexte autorisait jusqu’à 400 000 jetons. Profond
Chat GPT-5.2 (Expérimental) Taux standard Le contexte autorisait jusqu’à 128 000 jetons. Généralités
Raisonnement GPT-5.2 (Expérimental) Taux premium Formé sur les données jusqu’en octobre 2024. Le contexte autorisait jusqu’à 400 000 jetons. Profond
Claude Sonnet 4.5 (Expérimental) Taux standard Modèle externe à partir d’Anthropic. Le contexte autorisait jusqu’à 200 000 jetons. Généralités
Claude Opus 4.1 (Expérimental) Taux premium Modèle externe à partir d’Anthropic. Le contexte autorisait jusqu’à 200 000 jetons. Profond

GPT-4o mini et GPT-4o continuent d’être utilisés dans les régions gouvernementales des États-Unis. Ces modèles suivent les règles de licence et offrent des fonctionnalités comparables à GPT-4.1 mini et GPT-4.1, respectivement.

La disponibilité des modèles varie selon la région. En savoir plus sur la disponibilité des modèles dans la disponibilité des modèles par région.

Les modèles anthropiques sont hébergés en dehors de Microsoft et sont soumis à la gestion des termes et des données anthropiques. En savoir plus sur les modèles Anthropic externes dans Choisir un modèle externe comme modèle IA principal.

Gestion des licences

Dans les assistants, les flux ou les applications, les modèles utilisés par les invites consomment des crédits Copilot, quelle que soit leur phase de mise en production. En savoir plus sur la gestion des crédits Copilot.

Si vous avez des crédits AI Builder, ils sont consommés en priorité lorsque les invites sont utilisées dans Power Apps et Power Automate. Ils ne sont pas consommés lorsque les prompts sont utilisés dans Copilot Studio. En savoir plus sur AI Builder : vue d’ensemble des licences.

Étapes de sortie

Les modèles ont différentes étapes de mise en production. Vous pouvez essayer de nouveaux modèles expérimentaux et en version préliminaire à la pointe de la technologie, ou choisir un modèle fiable et largement éprouvé en disponibilité générale.

Balise Description
Version expérimentale Utilisé pour l’expérimentation et non recommandé pour une utilisation en production. Sous réserve des conditions de version préliminaire, et pouvant présenter des limitations en matière de disponibilité et de qualité.
Version préliminaire À terme, devient un modèle généralement disponible, mais n’est actuellement pas recommandé pour une utilisation en production. Sous réserve des conditions de version préliminaire, et pouvant présenter des limitations en matière de disponibilité et de qualité.
Aucune balise Généralement disponible. Vous pouvez utiliser ce modèle pour une utilisation mise à l’échelle et en production. Dans la plupart des cas, les modèles en disponibilité générale n’ont aucune limitation en matière de disponibilité et de qualité, mais certains peuvent encore avoir certaines limitations, comme la disponibilité régionale.

Important : les modèles Anthropic Claude sont encore au stade expérimental, même s’ils n’affichent pas de balise.
Valeur par défaut Modèle par défaut pour tous les assistants, et généralement le modèle le plus performant en disponibilité générale. Le modèle par défaut est mis à niveau périodiquement à mesure que de nouveaux modèles plus performants deviennent disponibles en disponibilité générale. Les assistants utilisent également le modèle par défaut comme secours si un modèle sélectionné est désactivé ou indisponible.

Les modèles expérimentaux et en version préliminaire peuvent présenter une variabilité des performances, de la qualité de la réponse, de la latence ou de la consommation de messages, et peuvent expirer ou être indisponibles. Ils sont soumis à des conditions de version préliminaire.

Regroupement en catégories

Le tableau suivant décrit les différentes catégories de modèle.

MinI Généralités Profond
Niveau de performance Convient pour la plupart des tâches Supérieur pour les tâches complexes Formé pour les tâches de raisonnement
Vitesse Traitement plus rapide Peut être plus lent en raison de la complexité Plus lent car il raisonne avant de répondre
Cas d’utilisation Résumé, tâches d’information, traitement d’images et de documents Traitement des images et des documents, tâches de création de contenu avancées Analyse des données et tâches de raisonnement, traitement des images et des documents

Lorsque vous avez besoin d’une solution rentable pour des tâches modérément complexes, que vous disposez de ressources de calcul limitées ou que vous avez besoin d’un traitement plus rapide, optez pour les modèles Mini. Il est idéal pour les projets avec des contraintes budgétaires et les applications telles que le support client ou l’analyse efficace du code.

Lorsque vous avez affaire à des tâches multimodales très complexes qui nécessitent des performances supérieures et une analyse détaillée, choisissez des modèles Généraux. C’est le meilleur choix pour les projets à grande échelle où la précision et les capacités avancées sont cruciales. Un autre scénario où il s’agit d’un meilleur choix est lorsque vous disposez du budget et des ressources informatiques nécessaires pour le prendre en charge. Les modèles généraux sont également préférables pour les projets à long terme qui pourraient gagner en complexité au fil du temps.

Pour les projets nécessitant des capacités de raisonnement avancées, les modèles Deep excellent. Il convient aux scénarios qui exigent une résolution de problèmes sophistiquée et une pensée critique. Les modèles Deep excellent dans les environnements où un raisonnement nuancé, une prise de décision complexe et une analyse détaillée sont importants.

Choisissez parmi les modèles en fonction de la disponibilité régionale, des fonctionnalités, des cas d’usage et des coûts. En savoir plus sur la disponibilité des modèles par région et le tableau comparatif des prix.

Disponibilité des modèles par région

Les sections suivantes décrivent la disponibilité des modèles par région par le public et le gouvernement américain.

Disponibilité du public

Dans le tableau suivant, (GA), (Aperçu) ou (Expérimental) signifie que la fonctionnalité est disponible mais utilise un service Azure OpenAI dans une autre région. En savoir plus sur l’activation du déplacement des données entre les régions.

Caractéristique Asie Australie Canada Europe France Allemagne Inde Japon Norvège Singapour Afrique du Sud Amérique du Sud Corée Suède Suisse Émirats arabes unis Royaume-Uni États-Unis
GPT-4.1 mini GA GA (GA) (GA) (GA) (GA) GA (GA) (GA) GA (GA) (GA) (GA) (GA) (GA) (GA) GA GA
GPT-4.1 GA GA (GA) (GA) (GA) (GA) GA (GA) (GA) GA (GA) (GA) (GA) (GA) (GA) (GA) GA GA
o3 (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) GA
Conversation GPT-5 (GA) (GA) (GA) GA (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) GA
Raisonnement GPT-5 (GA) (GA) (GA) GA (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) (GA) GA
Chat GPT-5.2 - - - - - - - - - - - - - - - - - Version expérimentale
Raisonnement GPT-5.2 - - - - - - - - - - - - - - - - - Version expérimentale

Disponibilité du gouvernement américain

Caractéristique Cloud de la communauté gouvernementale (GCC) Cloud de la communauté gouvernementale – High (GCC High) Département de la Défense (DoD)
GPT-4o mini GA GA -
GPT-4o GA GA -
GPT-4o utilisant l’image ou le document comme entrée - - -

Mises à jour des modèles

Modèle Statut Date de mise hors service Remplacement
GPT-4.1 mini Généralement disponible Aucune date encore n/d
GPT-4.1 Généralement disponible Aucune date encore n/d
Conversation GPT-5 Généralement disponible Aucune date encore n/d
Raisonnement GPT-5 Généralement disponible Aucune date encore n/d
Chat GPT-5.2 Version expérimentale Aucune date encore n/d
Raisonnement GPT-5.2 Version expérimentale Aucune date encore n/d
Claude Sonnet 4.5 Version expérimentale Aucune date encore n/d
Claude Opus 4.1 Version expérimentale Décembre 2025 Claude Opus 4.5
Claude Opus 4.5 Disponibilité en attente Aucune date encore n/d
o3 Mis hors service 4 décembre 2025 Raisonnement GPT-5
GPT-4o mini Mis hors service Juillet 2025 GPT-4.1 mini
GPT-4o Mis hors service Juillet 2025 GPT-4.1
o1 Mis hors service Juillet 2025 o3

Paramètres du modèle

Vous pouvez accéder au panneau des paramètres en sélectionnant les trois points (...) >Paramètres en haut du générateur d’invites. Vous pouvez modifier les paramètres suivants :

  • Température : les températures inférieures entraînent des résultats prévisibles. Les températures plus élevées permettent des réponses plus diversifiées ou créatives.
  • Récupération d’enregistrement : nombre d’enregistrements récupérés pour vos sources de connaissances.
  • Inclure des liens dans la réponse : lorsque ce paramètre est sélectionné, la réponse inclut des citations de lien pour les enregistrements récupérés.

Température

Le curseur vous permet de sélectionner la température du modèle d’IA générative. Il varie entre 0 et 1. Cette valeur guide le modèle d’IA générative sur le degré de créativité (1) par rapport à la réponse déterministe (0) qu’il doit fournir.

La température est un paramètre qui contrôle le caractère aléatoire de la sortie générée par le modèle d’IA. Une température plus basse génère des résultats plus prévisibles et plus conservateurs. À titre de comparaison, une température plus élevée offre plus de créativité et de diversité dans les réponses. Cela permet d’affiner l’équilibre entre le caractère aléatoire et le déterminisme dans la sortie du modèle.

Par défaut, la température est 0, comme dans les invites créées précédemment.

Température Fonctionnalité Utiliser dans
0 Résultats plus prévisibles et conservateurs.
Les réponses sont plus cohérentes.
Invites qui nécessitent une grande précision et moins de variabilité.
1 Plus de créativité et de diversité dans les réponses.
Des réponses plus variées et parfois plus innovantes.
Invites qui créent un nouveau contenu prêt à l’emploi.

L’ajustement de la température peut influencer la sortie du modèle, mais elle ne garantit pas un résultat spécifique. Les réponses de l’IA sont intrinsèquement probabilistes et peuvent varier même avec le même paramètre de température.

Note

Le paramètre de température n’est pas disponible pour le modèle de raisonnement GPT-5. Pour cette raison, le curseur est désactivé lorsque vous sélectionnez le modèle de raisonnement GPT-5.