Partager via


Concepts d’ajustement des modèles

Le réglage précis vous permet d’adapter des modèles IA préentraînés pour mieux fonctionner avec vos données et vos cas d’usage spécifiques. Cette technique peut améliorer les performances du modèle tout en nécessitant moins de données d’apprentissage que la création d’un modèle à partir de zéro.

Cet article couvre :

  • Qu’est-ce que l’optimisation est et comment elle fonctionne ?
  • Quand utiliser le réglage précis par rapport à d’autres approches
  • Comment sélectionner et préparer des modèles pour le réglage précis
  • Meilleures pratiques pour itérer et améliorer vos résultats

Prerequisites

Avant de commencer, vous devez avoir :

  • Compréhension de base des concepts de Machine Learning
  • Connaissance de votre cas d’usage et de vos exigences de données spécifiques
  • Accès à des exemples de données pour l’apprentissage et la validation

Qu’est-ce que le réglage précis ?

Le réglage précis est une technique d’apprentissage automatique qui adapte un modèle préentraîné pour améliorer votre tâche spécifique. Au lieu d’entraîner un modèle à partir de zéro, vous commencez par un modèle qui comprend déjà les modèles généraux et l’ajustez pour travailler avec vos données.

Cette approche tire parti de l’apprentissage du transfert, à l’aide des connaissances acquises à partir d’une tâche pour améliorer les performances sur une tâche associée. Le réglage précis est particulièrement efficace lorsque vous disposez de données d’apprentissage limitées ou que vous souhaitez créer des fonctionnalités de modèle existantes.

Quand peaufiner

Le réglage précis fonctionne bien lorsque vous disposez d’une petite quantité de données et que vous souhaitez améliorer les performances de votre modèle. En commençant par un modèle préentraîné, vous pouvez utiliser les connaissances que le modèle a déjà appris et l’ajuster pour mieux adapter vos données. Cette approche vous permet d’améliorer les performances de votre modèle et de réduire la quantité de données nécessaires à l’entraînement.

Lorsque vous avez une grande quantité de données, vous n’avez généralement pas besoin d’ajuster votre modèle. Vous pouvez entraîner votre modèle à partir de zéro et obtenir de bons résultats sans réglage précis. Toutefois, le réglage précis peut toujours vous aider si vous souhaitez améliorer les performances de votre modèle. Vous pouvez également affiner votre modèle si vous avez une tâche spécifique différente de la tâche sur laquelle le modèle préentraîné a été formé à l’origine.

Vous pourriez éviter un réglage coûteux en utilisant l’ingénierie d’invite ou le chaînage d’invites. Ces techniques vous aident à générer du texte de haute qualité sans réglage précis.

Sélectionner un modèle pré-entraîné

Choisissez un modèle préentraîné qui répond aux besoins de votre tâche. De nombreux modèles préentraînés sont disponibles, chacun formé sur différentes tâches. Choisissez un modèle entraîné sur une tâche similaire à la vôtre. Ce choix vous aide à utiliser les connaissances que le modèle a déjà appris et à l’ajuster pour s’adapter à vos données.

Les modèles HuggingFace sont un bon point de départ lors de la recherche de modèles préentraînés. Les HuggingFace modèles sont regroupés en catégories en fonction de la tâche sur laquelle ils ont été formés, ce qui facilite la recherche d’un modèle qui correspond à votre tâche.

Ces catégories sont les suivantes

  • Multimodal
  • Vision par ordinateur
  • Traitement en langage naturel
  • Audio
  • Tabulaire
  • Apprentissage par renforcement

Vérifiez si le modèle fonctionne avec votre environnement et vos outils. Par exemple, si vous utilisez Visual Studio Code (VS Code), vous pouvez utiliser l'extension Azure Machine Learning pour VS Code afin d'affiner votre modèle.

Vérifier le statut et la licence du modèle. Certains modèles préentraînés sont disponibles sous licence open source, tandis que d’autres nécessitent une licence commerciale ou personnelle. Tous les modèles figurant sur HuggingFace comprennent des informations sur la licence. Assurez-vous que vous disposez des permissions nécessaires pour utiliser le modèle avant de l'affiner.

Préparer les données de l'échantillon

La préparation de votre échantillon de données implique le nettoyage et le prétraitement de vos données afin de les rendre aptes à la formation. Vous devez également diviser vos données en ensembles de formation et de validation afin d'évaluer les performances de votre modèle. Le format de vos données doit correspondre au format attendu par le modèle préentraîné que vous utilisez. Vous trouverez ces informations avec les modèles dans HuggingFace la section Format d’instruction de la carte de modèle. La plupart des fiches de modèle incluent un modèle pour élaborer une invite destinée au modèle et du pseudocode pour vous aider à démarrer.

Améliorez votre modèle

Après avoir affiné votre modèle, évaluez ses performances sur le jeu de validation. Utilisez des métriques telles que la précision, la précision, le rappel et le score F1 pour évaluer les performances de votre modèle. Si les performances de votre modèle ne sont pas satisfaisantes, ajustez les hyperparamètres, modifiez l’architecture ou ajustez le modèle sur plus de données. Vous pouvez également examiner la qualité et la diversité de vos données pour voir s'il y a des problèmes à régler. En règle générale, un petit ensemble de données de haute qualité a plus de valeur qu'un grand ensemble de données de faible qualité.

Voir aussi

Pour en savoir plus sur le réglage fin des modèles d'IA, consultez les ressources suivantes :

Lors de l’utilisation des fonctionnalités d’IA, passez en revue : Développement d’applications et de fonctionnalités d’INTELLIGENCE artificielle responsable sur Windows.