Comprendre le cycle de vie du développement d’une application de grand modèle de langage (LLM)

Effectué

Avant de comprendre comment utiliser le flux de requêtes, examinons le cycle de vie du développement d'une application de modèle de langage de grande taille (LLM).

Le cycle de vie comprend les étapes suivantes :

Diagramme des quatre étapes du cycle de vie du développement.

  1. Initialisation : définissez le cas d’usage et concevez la solution.
  2. Expérimentation : développez un flux et testez avec un petit jeu de données.
  3. Évaluation et affinement : évaluez le flux avec un jeu de données plus grand.
  4. Production : déployez et surveillez le flux et l’application.

Pendant l’évaluation et l’affinement, et la production, vous pouvez constater que votre solution doit être améliorée. Vous pouvez revenir à l’expérimentation pendant laquelle vous développez votre flux en continu, jusqu’à ce que vous soyez satisfait des résultats.

Examinons chacune de ces phases plus en détail.

Initialisation

Imaginez que vous souhaitez concevoir et développer une application LLM pour classifier les articles d’actualités. Avant de commencer à créer quoi que ce soit, vous devez définir les catégories souhaitées comme sortie. Vous devez comprendre à quoi ressemble un article d’actualité classique, comment présenter l’article en tant qu’entrée à votre application et comment l’application génère la sortie souhaitée.

En d’autres termes, lors de l’initialisation , vous :

Diagramme des quatre étapes pendant l’initialisation.

  1. Définir l’objectif
  2. Collectez un exemple de jeu de données
  3. Générer une invite de base
  4. Concevoir le flux

Pour concevoir, développer et tester une application LLM, vous avez besoin d’un exemple de jeu de données qui sert d’entrée. Un exemple de jeu de données est un petit sous-ensemble représentatif des données que vous prévoyez d’analyser en tant qu’entrée à votre application LLM.

Lors de la collecte ou de la création de l’exemple de jeu de données, vous devez garantir la diversité des données pour couvrir différents scénarios et cas de périphérie. Vous devez également supprimer toutes les informations sensibles à la confidentialité du jeu de données pour éviter les vulnérabilités.

Expérimentation

Vous avez collecté un exemple de jeu de données d’articles d’actualités et choisi les catégories dans lesquelles vous souhaitez que les articles soient classés. Vous avez conçu un flux qui prend un article d’actualité en tant qu’entrée et utilise un LLM pour classifier l’article. Pour tester si votre flux génère la sortie attendue, vous l’exécutez sur votre exemple de jeu de données.

Diagramme des quatre étapes pendant l’expérimentation.

La phase d’expérimentation est un processus itératif pendant lequel vous (1) exécutez le flux sur un exemple de jeu de données. Vous évaluez ensuite (2) les niveaux de performance de l’invite. Si vous êtes satisfait (3) du résultat, vous pouvez passer à l’évaluation et à l’affinement. Si vous pensez qu’il existe une possibilité d’amélioration, vous pouvez (4) modifier le flux en modifiant l’invite ou le flux lui-même.

Évaluation et affinement

Lorsque vous êtes satisfait de la sortie du flux qui classifie les articles d’actualités, en fonction de l’exemple de jeu de données, vous pouvez évaluer les performances du flux sur un jeu de données plus volumineux.

En testant le flux sur un jeu de données plus volumineux, vous pouvez évaluer le niveau de généralisation de l’application LLM sur de nouvelles données. Pendant l’évaluation, vous pouvez identifier les goulots d’étranglement potentiels ou les zones d’optimisation ou d’affinement.

Lorsque vous modifiez votre flux, vous devez d’abord l’exécuter sur un jeu de données plus petit avant de l’exécuter à nouveau sur un jeu de données plus volumineux. Le test de votre flux avec un jeu de données plus petit vous permet de répondre plus rapidement aux problèmes.

Une fois que votre application LLM semble robuste et fiable dans la gestion de différents scénarios, vous pouvez décider de déplacer l’application LLM en production.

Production

Enfin, votre application de classification d’articles d’actualités est prête pour la production.

Diagramme des trois étapes pendant la production.

Pendant la production, vous :

  1. Optimisez le flux qui classifie les articles entrants pour l'efficacité et l'efficience.
  2. Déployez votre flux sur un point de terminaison. Lorsque vous appelez le point de terminaison, le flux est déclenché pour s’exécuter et la sortie souhaitée est générée.
  3. Surveillez les performances de votre solution en collectant les données d’utilisation et les commentaires des utilisateurs finaux. En comprenant l’exécution de l’application, vous pouvez améliorer le flux chaque fois que nécessaire.

Explorer le cycle de vie complet du développement

Maintenant que vous comprenez chaque étape du cycle de vie de développement d’une application LLM, vous pouvez explorer la vue d’ensemble complète :

Diagramme de toutes les étapes, y compris leurs étapes du cycle de vie de développement.