Optimiser les performances du modèle
Après avoir déployé votre modèle sur un point de terminaison, vous pouvez commencer à interagir avec celui-ci pour voir comment il fonctionne. Examinons comment vous pouvez utiliser des techniques d’ingénierie promptes pour optimiser les performances de votre modèle.
Appliquer des modèles de prompts pour optimiser les résultats de votre modèle
La qualité des questions que vous envoyez au modèle de langage influence directement la qualité des réponses que vous recevez. Vous pouvez construire avec soin votre question, ou invite, pour recevoir des réponses plus intéressantes et optimales. Le processus de conception et d’optimisation des invites pour améliorer les performances du modèle est également appelé ingénierie d’invite.
L’ingénierie rapide exige que les utilisateurs posent des questions pertinentes, spécifiques, non ambiguës et bien structurées, demandant au modèle de générer des réponses plus précises. Pour comprendre comment créer des incitations bien définies, nous allons explorer certains modèles qui vous aident à améliorer les résultats d’un modèle.
- Instruisez le modèle à agir comme un personnage.
- Guidez le modèle pour suggérer de meilleures questions.
- Fournissez un modèle pour générer la sortie dans un format spécifique.
- Comprenez comment un modèle a des raisons en lui demandant de refléter.
- Ajoutez un contexte pour améliorer la précision de la sortie du modèle.
Remarque
Les motifs répertoriés ici sont basés sur le travail de White et al., (2023) qui ont construit un catalogue de motifs d’invite.
En tant que développeur, une approche efficace consiste à ajouter des instructions à votre modèle déployé sous la forme d’une invite système. L’invite système définit le comportement du modèle et vous permet de guider le modèle sans exposer l’utilisateur final aux instructions. Les meilleurs résultats sont souvent obtenus par le biais de l’attribution d’une invite système explicite et de conseils (ou modèles) qui aident les utilisateurs à envoyer des invites qui reflètent les modèles décrits ici.
Demander au modèle d’agir en tant que personnage
Lorsque vous souhaitez que le modèle prenne un point de vue ou une perspective spécifique lors de la réponse à une question, vous pouvez lui demander de jouer un rôle.
Par exemple, vous pouvez demander au modèle de répondre comme s’il s’agit d’un professionnel du marketing chevronné si vous travaillez dans les ventes et avez besoin d’informations sur un nouveau logiciel CRM.
| Aucune personne spécifiée | Avec personnage spécifié | |
|---|---|---|
| Invite système | Aucun | Vous êtes un professionnel du marketing chevronné qui écrit une copie publicitaire pour un public de clients techniques. |
| Requête Utilisateur | Écrivez une description en une phrase d’un produit CRM. | Écrivez une description en une phrase d’un produit CRM. |
| Réponse du modèle | Un produit CRM est un outil logiciel conçu pour gérer les interactions d’une entreprise avec les clients actuels et potentiels, englobant les ventes, le marketing, le service clientèle et le support technique. | Découvrez une gestion transparente des relations client avec notre produit CRM, conçu pour simplifier vos opérations commerciales, améliorer les interactions client et stimuler la croissance des ventes avec son interface intuitive et ses outils d’analyse robustes. |
Vous pouvez créer différents personnages pour différents rôles d’entreprise. Considérez des rôles tels qu’un responsable de produit, un analyste de données, un expert du service clientèle ou un enseignant. Définissez le personnage et ajoutez plus de détails à ce que vous attendez de ce personnage à connaître ou à faire pour obtenir des réponses personnalisées basées sur le contexte.
Poser de meilleures suggestions de questions
Lorsque vous souhaitez que le modèle vous aide à affiner votre question, vous pouvez lui demander de suggérer de meilleures façons de formuler votre question. Vous pouvez également lui demander de fournir un contexte supplémentaire.
Par exemple, si vous recherchez des conseils sur la cuisson d’un repas, vous pouvez inviter le modèle à suggérer des questions de clarification pour vous aider à obtenir une réponse plus ciblée.
| Aucune suggestion donnée | Avec des suggestions données | |
|---|---|---|
| Invite système | Vous êtes un chef IA qui peut conseiller sur les menus. | Vous êtes un chef IA qui peut conseiller sur les menus. Vous êtes accessible et souhaitez toujours fournir les meilleurs conseils que vous pouvez. |
| Requête Utilisateur | Je dois accueillir une soirée pour quatre personnes. Que dois-je cuisiner ? | Je dois accueillir une soirée pour quatre personnes. Que dois-je cuisiner ? Quelles autres informations avez-vous besoin pour m’aider à planifier un excellent repas pour mes invités ? |
| Réponse du modèle | Organiser un dîner pour quatre personnes est une merveilleuse occasion de mettre en valeur vos talents culinaires. Voici un menu à trois cours suggéré qui équilibre les saveurs et offre une expérience agréable à manger : Amuse-gueule Brochettes de salade caprese - Ingrédients : tomates cerises, boules de mozzarella fraîches, feuilles de basilic frais, glaçage balsamique, huile d’olive, sel et poivre. - Instructions : Filer une tomate cerise, une feuille de basilic et une boule de mozzarella sur de petites brochettes. Drizzle avec huile d’olive et glaçage balsamique, puis assaisonner avec du sel et du poivre. Ce plat est léger, rafraîchissant et facile à préparer à l’avance. Plat principal Herb-Crusted saumon avec des asperges de citron - Ingrédients : filets de saumon, herbes fraîches (comme le persil, l'aneth et le thym), chapelure, citron, asperges, huile d'olive, sel et poivre. - Instructions : Préchauffez votre four à 400°F (200°C). Mélanger les barres de pain avec des herbes fraîches hachées et un peu d’huile d’olive pour former une pâte. Appuyez sur ce mélange sur les filets de saumon et assaisonner avec du sel et du poivre. Placez le saumon sur une plaque de cuisson et cuire pendant environ 15 à 20 minutes, ou jusqu’à ce qu’il soit cuit. Au cours des 10 dernières minutes de cuisson, tosse les asperges d’huile d’olive, le zeste de citron, le sel et le poivre, et rôti en même temps que le saumon. Servir avec un pressé de jus de citron frais sur le saumon et les asperges. Dessert Mousse au chocolat avec des baies fraîches - Ingrédients : chocolat foncé, œufs, sucre, crème lourde, extrait de vanille et baies mélangées (comme les fraises, les bleuets et les framboises). - Instructions : fondez le chocolat sur une double chaudière, puis laissez-le refroidir légèrement. Séparez les jaunes d’œufs et les blancs. Fouetter les blancs d’œufs aux pics mous, puis ajouter progressivement du sucre pour faire un meringue. Fouettez la crème lourde jusqu’à ce que les pics mous se forment et mélangent dans l’extrait de vanille. Pliez le chocolat fondu dans les jaunes d’œufs, puis pliez doucement dans la crème fouettée et meringue jusqu’à combiner. Répartir la mousse dans des plats de service et laisser refroidir au réfrigérateur pendant au moins 2 heures. Servir avec des baies fraîches pour une rafale de couleur et de fraîcheur. Conseils supplémentaires - Jumelages : pensez à servir un vin blanc léger avec l'entrée et le plat principal, et peut-être un vin de dessert avec la mousse au chocolat. - Minutage : préparez l’entrée et le dessert à l’avance pour minimiser le stress de dernière minute. Le plat principal prendra le plus de temps dans le four, donc prévoyez en conséquence. Ce menu est conçu pour être élégant et accessible, ce qui garantit à vos invités de profiter à la fois de la nourriture et de l’expérience. Profitez de votre soirée de dîner ! |
Organiser un dîner est une merveilleuse occasion de mettre en valeur vos talents culinaires et de créer des expériences mémorables pour vos invités. Pour vous aider à planifier un bon repas, voici quelques questions qui peuvent vous guider dans le choix du menu parfait :
Avec ces informations, je peux suggérer un menu personnalisé. Voici une idée générale qui peut être adaptée en fonction de vos réponses : Starter
Plat principal
Plats côte à côte
Dessert
Boissons
N’hésitez pas à partager plus de détails, et je peux aider à affiner le menu plus loin ! |
Lorsque vous encouragez le modèle à suggérer des clarifications ou des détails supplémentaires, vous pouvez poser les bonnes questions et obtenir de meilleures réponses plus précises dans moins d’interactions.
Spécifier le format souhaité pour les réponses
Lorsque vous souhaitez que le modèle génère une sortie dans un format spécifique, vous pouvez fournir un modèle ou une structure dans votre invite.
Par exemple, si vous êtes un journaliste sportif qui compose un article historique, vous pouvez demander que le modèle suive un modèle spécifique, qui inclut des titres, des points à puces et des répartitions de données.
| Aucun modèle spécifié | Avec le modèle spécifié | |
|---|---|---|
| Invite système | Vous êtes un assistant IA utile. | Vous êtes un assistant IA utile pour les journalistes sportifs. |
| Requête Utilisateur | Qu’est-ce qui s’est passé lors de la finale de la Coupe du monde de football de 2018 ? | Qu’est-ce qui s’est passé lors de la finale de la Coupe du monde de football de 2018 ? Mettez en forme le résultat pour afficher la date de correspondance, l’emplacement et les deux équipes concurrentes. Ensuite, le score final, et enfin tous les événements notables qui se sont produits pendant le match. |
| Réponse du modèle | La finale de la Coupe du Monde de la FIFA 2018 a eu lieu le 15 juillet 2018 au stade Loujniki de Moscou, en Russie. La France face à la Croatie dans le match. La France est apparue victorieuse avec une victoire de 4-2. Les buts pour la France ont été marqués par Mario Mandzukic (propre but), Antoine Griezmann (pénalité), Paul Pogba et Kylian Mbappé. Les buts de la Croatie ont été marqués par Ivan Perišić et Mandzukic. Kylian Mbappé, à seulement 19 ans, est devenu le deuxième joueur le plus jeune à marquer en finale de la Coupe du Monde, après Pelé. Cette victoire a marqué le deuxième titre de la Coupe du Monde de France, leur premier étant en 1998. |
Date de correspondance : 15 juillet 2018 Lieu : Stade Luzhniki, Moscou, Russie Équipes concurrentes : France vs Croatie Final Score : France 4, Croatie 2 Événements notables :
|
Vous pouvez appliquer cette approche à d’autres scénarios où un format spécifique est nécessaire, comme la génération d’e-mails, de résumés, de propositions ou même de code et de scripts. Définissez clairement le modèle de format et fournissez des détails sur la façon dont vous souhaitez que la sortie soit structurée pour obtenir des réponses cohérentes et organisées.
Vous pouvez également utiliser une approche à un coup ou à quelques coups en fournissant un ou plusieurs exemples pour aider le modèle à identifier un schéma souhaité.
Demander une explication du raisonnement
Lorsque vous souhaitez que le modèle explique le raisonnement derrière ses réponses, vous pouvez demander au modèle de réfléchir automatiquement à ses raisonnements et hypothèses après avoir fourni une réponse.
Par exemple, si vous travaillez sur un problème mathématique, vous pouvez demander au modèle d’expliquer le raisonnement derrière des calculs spécifiques.
| Aucune réflexion spécifiée | Avec réflexion spécifiée | |
|---|---|---|
| Invite système | Vous êtes un assistant mathématique IA. | Vous êtes un assistant mathématique IA. Vous expliquez toujours vos réponses. |
| Requête Utilisateur | Un triangle rectangle a un côté hypoténuse de longueur 3 cm et un côté adjacent de longueur 2 cm. Quelle est la longueur du côté restant ? | Un triangle rectangle a un côté hypoténuse de longueur 3 cm et un côté adjacent de longueur 2 cm. Quelle est la longueur du côté restant ? |
| Réponse du modèle | Environ 2,24 cm. | Nous pouvons utiliser le théorème Pythagorean pour résoudre ce problème. Le théorème de Pythagore stipule que dans un triangle rectangle, le carré de la longueur de l'hypoténuse (le côté opposé à l'angle droit) est égal à la somme des carrés des longueurs des deux autres côtés. Mathématiquement, cela peut être écrit comme suit : c² = a² + b² où c est la longueur de l'hypoténuse, et a et b sont les longueurs des deux autres côtés. Dans ce problème, on nous donne la longueur de l'hypoténuse (c = 3 cm) et la longueur d'un des autres côtés (a = 2 cm). Nous devons trouver la longueur du côté restant (b). En insérant les valeurs données dans le théorème de Pythagore, nous obtenons : 3² = 2² + b² 9 = 4 + b² À présent, nous pouvons résoudre les problèmes de b² : b² = 9 - 4 b² = 5 Enfin, nous prenons la racine carrée des deux côtés pour trouver la longueur du côté restant : b = √5 ≈ 2,24 cm Ainsi, la longueur du côté restant est d’environ 2,24 cm. |
Vous pouvez appliquer cette approche lorsque vous souhaitez obtenir des explications dans l’analyse des données, la stratégie marketing ou la résolution des problèmes techniques. Lorsque vous demandez au modèle de définir son raisonnement, vous utilisez une technique appelée chaîne de pensée pour la faire penser pas à pas.
Ajouter un contexte
Lorsque vous souhaitez que le modèle se concentre sur des rubriques spécifiques, vous pouvez spécifier le contexte à prendre en compte. Vous pouvez également indiquer au modèle d’ignorer les informations non pertinentes.
Par exemple, si vous planifiez un voyage, vous pouvez fournir au modèle plus de contexte pour améliorer la pertinence de sa réponse.
| Aucun contexte spécifié | Avec le contexte spécifié | |
|---|---|---|
| Invite système | Vous êtes assistant de voyage IA. | Vous êtes assistant de voyage IA. |
| Question de l’utilisateur | Quand dois-je visiter Édimbourg ? | Quand dois-je visiter Édimbourg ? Je m’intéresse particulièrement à assister aux matchs à domicile de l’Écosse dans le tournoi de rugby des Six Nations. |
| Réponse du modèle | Édimbourg, la capitale de l’Écosse, est une destination merveilleuse avec une riche histoire et une culture dynamique. Le meilleur moment pour visiter Edimbourg dépend en grande partie de vos préférences en matière de météo, d’événements et de foules touristiques.
En résumé, le meilleur moment pour visiter Édimbourg dépend de vos préférences. Le printemps et l’automne offrent un temps agréable et moins de foules, tandis que l’été est idéal pour les activités extérieures et les festivals. L’hiver peut être une expérience plus calme, plus magique, avec des événements festifs à apprécier. |
Le tournoi de rugby des Six Nations s’étend généralement de fin janvier à début mars. Édimbourg, en tant que ville hôte, a souvent des matchs au Murrayfield Stadium, qui est le stade national de l’Écosse. Pour vous assurer que vous ne manquez pas les matchs à domicile de l’Écosse dans les Six Nations, je vous recommande de planifier votre visite pour cette période. Toutefois, gardez à l’esprit que les dates et heures de match peuvent varier, il est donc judicieux de consulter le site officiel des Six Nations ou le site web de l’Union de rugby écossaise pour le calendrier exact des matchs. En outre, Édimbourg a beaucoup à offrir au-delà du rugby, avec sa riche histoire, son architecture magnifique et une scène culturelle dynamique, donc vous pourriez envisager d’étendre votre séjour pour explorer la ville avant ou après le tournoi. N'oubliez pas non plus que visiter pendant le tournoi peut signifier des foules plus importantes et des hébergements plus fréquentés, alors réservez vos vols, votre hôtel et votre transport bien à l'avance pour garantir une expérience agréable. Profitez de votre voyage à Édimbourg et de l’atmosphère excitante des matchs de rugby des Six Nations ! |
En définissant sur quoi le modèle doit se concentrer ou ce qu'il doit ignorer, vous pouvez vous assurer que la conversation reste sur la bonne voie et générer des réponses plus pertinentes et personnalisées.
Vous pouvez spécifier le contexte en décrivant ce qu’il doit inclure ou ne doit pas inclure, et en connectant le modèle à des sources de données, il doit récupérer le contexte avant de générer une réponse.
Appliquer des stratégies d’optimisation de modèle
Remarque
Cette section décrit les options et considérations relatives à l’optimisation du modèle que vous pouvez envisager au-delà de l’ingénierie rapide. Une exploration complète de la manière d’appliquer ces stratégies d’optimisation dépasse le cadre de ce module.
L’ingénierie d’invite peut être un moyen efficace d’optimiser les réponses de modèle, mais dans certains cas, il peut ne pas fournir suffisamment de contexte ou de conseils pour toujours répondre à vos besoins exacts. En tant que développeur, vous pouvez prendre en compte les stratégies d’optimisation supplémentaires suivantes pour améliorer la pertinence des réponses de votre application IA générative :
- Récupération d’une génération augmentée (RAG) : technique qui implique l’utilisation d’une source de données pour fournir un contexte de base aux invites. RAG peut être une approche utile lorsque vous avez besoin du modèle pour répondre à des questions basées sur un domaine de connaissances spécifique ou lorsque vous avez besoin du modèle pour prendre en compte les informations relatives aux événements qui se sont produits après les données d’entraînement sur lesquelles le modèle est basé.
- Réglage précis : technique qui implique l’extension de l’entraînement d’un modèle de base en fournissant des exemples d’invites et de réponses qui reflètent le format et le style de sortie souhaités.
Ces deux approches impliquent des problèmes de coût, de complexité et de facilité de maintenance supplémentaires. Par conséquent, en règle générale, il est préférable de démarrer vos efforts d’optimisation à l’aide de l’ingénierie rapide, puis de prendre en compte des stratégies supplémentaires si nécessaire.
La stratégie que vous devez choisir en tant que développeur dépend de vos besoins :
- Optimiser le contexte : lorsque le modèle n’a pas de connaissances contextuelles et que vous souhaitez optimiser la précision des réponses.
- Optimisez le modèle : lorsque vous souhaitez améliorer le format de réponse, le style ou la parole en optimisant la cohérence du comportement.
Pour optimiser le contexte, vous pouvez appliquer un modèle de génération augmentée de récupération (RAG). Avec RAG, vous basez vos données en récupérant d’abord le contexte à partir d’une source de données avant de générer une réponse. Par exemple, vous souhaitez que les employés posent des questions sur les processus de réclamation de dépenses et les limites en fonction de la documentation relative à la stratégie des dépenses de votre société.
Lorsque vous souhaitez que le modèle réponde dans un format ou un style spécifique, vous pouvez demander au modèle de le faire en ajoutant des instructions dans le message système. Lorsque vous remarquez que le comportement du modèle n’est pas cohérent, vous pouvez appliquer davantage la cohérence dans le comportement en définissant un modèle. Avec le réglage fin, vous entraînez un modèle de langage de base sur un ensemble de données d'exemples d'invites et de réponses avant de l'intégrer dans votre application, ce qui a pour résultat que le modèle affiné produira des réponses cohérentes avec les exemples de l'ensemble de données de formation de réglage fin.
Vous pouvez utiliser n’importe quelle combinaison de stratégies d’optimisation, par exemple l’ingénierie rapide, RAG et un modèle affiné, pour améliorer votre application de langage.