Partager via


Stratégies d’IA générative pour les requêtes mathématiques et de données

Actuellement, il existe des opinions variables sur la façon dont les outils comme ChatGPT ou d’autres modèles de langage gèrent les requêtes mathématiques et de données. Dans cet article, nous allons identifier les stratégies et définir des attentes lors de la création d’assistants dans Copilot Studio qui gèrent des requêtes mathématiques et de données.

Définitions de requêtes mathématiques et de données dans cet article

Le but de cet article n’est pas d’évaluer si l’IA générative peut aider à calculer le périmètre d’un rectangle ou le diamètre d’un cercle. Dans ce contexte, les mathématiques font référence à des questions typiques en langage naturel que quelqu’un poserait à un assistant. Ces questions supposent que l’IA peut agréger et interpréter des sommes, des moyennes et des tendances dans les sources de connaissances ou les tables de données utilisées pour ancrer les modèles.

Le résultat souhaité, dans ce cas, n’est pas de répondre à une équation mathématique. Au lieu de cela, il s’agit d’aider l’utilisateur à évaluer ou à comprendre les données plus efficacement. Lorsque les utilisateurs recherchent une analytique approfondie des données, comme la recherche d’analyses prédictives avancées ou prescriptives, un assistant personnalisé n’est généralement pas l’outil de choix. Toutefois, il existe plusieurs assistants dans Microsoft Stack qui sont plus directement axés sur l’analytique. Par exemple, les assistants suivants complètent le modèle de langage avec le code d’application Microsoft à cet effet :

Agrégats de données dans la compréhension du langage naturel

Lorsque nous mettons en place un assistant dans nos propres sources de connaissances, nous simplifions la découverte des informations demandées par un utilisateur en langage naturel. Gardez à l’esprit que les modèles de langage sont conçus pour prédire le mot suivant dans une séquence plutôt que d’effectuer des mathématiques rigoureuses. Toutefois, ils peuvent toujours fournir des informations et des explications utiles. Ces informations sont plus rapides pour la découverte d’informations que la navigation dans les résultats de la recherche par mot-clé ou le défilement manuel dans tous les enregistrements d’une table.

Les assistants copilot Studio peuvent analyser les sources de connaissances en notre nom. Ces assistants résument les réponses entre les rubriques, les outils et les sources de connaissances, qu’ils impliquent des agrégats de données numériques ou non. Toutefois, au fur et à mesure que nous mettons en place les modèles avec nos données, nous devons contextualiser les données requises pour que l’IA réponde. En fonction de cette compréhension, nous savons quand nous devons fournir davantage de nœuds de contexte ou de rubrique. Cette compréhension supplémentaire est pertinente lorsque des termes de niche ou un verbiage hautement technique sont trouvés dans les sources de données. Voici des exemples de requêtes de données qui impliquent des expressions mathématiques :

Exemples de questions Éléments à prendre en compte
Combien de nos clients en Amérique du Nord ont acheté le produit X ? Cette invite implique plusieurs tables structurées dans une base de données relationnelle et examine généralement plus de centaines ou même des milliers d’enregistrements.
Quel est l’impact total des coûts pour les travaux de réparation après l’ouragan ? Cette invite implique une table des éléments réparés, avec une colonne pour l’impact sur les coûts pour chaque élément de travail. Si le tableau a plus de réparations que les éléments de travail liés à l’ouragan, une colonne de catégorie ou de raison serait nécessaire pour que l’IA sache qui est liée à l’ouragan.
Lequel de nos clients a soumis le plus de demandes de modification ? Cette invite implique une table avec des demandes de modification et une table associée avec des noms de clients. Toutefois, cela compte d’abord les demandes par le client, puis renvoie le client avec le nombre de requêtes le plus élevé (et non la valeur de dollar d’impact sur le coût le plus élevé).

Clarté et structure de l’invite

Les modèles de langage s’appuient fortement sur la façon dont la question est mise en forme. Une invite bien structurée qui explique clairement le problème mathématique, définit des variables et interrompt la tâche en étapes conduit à des réponses plus précises. Par exemple, demander une réponse directe à un problème arithmétique simple fonctionne probablement bien, mais des questions vagues ou multicouches sans contexte clair peuvent confondre le modèle.

Voici quelques exemples d’invites basés sur une source de connaissances structurée comme une table Dataverse. Cet exemple illustre l’ajout d’une table Dataverse Power Apps, comme illustré dans l’image suivante.

Capture d’écran d’une table Dataverse Power Apps.

La table Dataverse a été ajoutée en tant que source de connaissances et a donné une description précise des connaissances, ainsi que des synonymes et des définitions de glossaire pour aider l’IA à interpréter les données.

Capture d’écran d’une source de connaissances mettant en évidence la description.

Capture d’écran d’une source de connaissances mettant en évidence les synonymes et les définitions de glossaire.

Invites spécifiques

Ces invites sont spécifiques et limitées aux informations demandées.

  • « Pouvez-vous fournir des détails complets sur la référence de commande de modification PCO-1003, y compris le nom du compte, le montant demandé et la raison de la demande ? »
  • « Combien de comptes ont soumis des demandes de modification en août 2024 ? »
  • « Quel est le nombre total de commandes de modification demandées à ce jour ? »
  • « Quel client a soumis l’impact le plus élevé sur les coûts en 2024 ? »

Invites généralisées

Ces invites sont généralisées et il est peu probable qu’elles agrègent de manière cohérente tous les résultats ; elles ne renvoient probablement que les trois premiers résultats.

  • « Veuillez répertorier nos comptes dans l’ordre de leur chiffre d’affaires respectif. »
  • « Veuillez répertorier les demandes de modification qui ont été soumises cette année en août, et inclure les montants de modification et le statut. »
  • « Pouvez-vous répertorier toutes les demandes de commande de modification envoyées à ce jour ? »

Note

L’activation ou la désactivation de la capacité de l’IA à utiliser ses propres connaissances générales peut affecter l’exactitude ou la pertinence des réponses renvoyées.

Conseils et astuces

Voici quelques suggestions lors de l’utilisation de Copilot Studio qui vous aident à définir des attentes autour des réponses génératives qui s’appuient sur des expressions mathématiques.

  • Planifiez les scénarios qui mettent en évidence les principales tendances, plutôt que d’attendre des calculs sur des milliers d’enregistrements. Sensibilisez à cette approche conversationnelle qui résume plutôt que détaille.

  • Privilégiez les sources de connaissances structurées (tabulaires sur non tabulaires) pour optimiser les expressions mathématiques.

  • Prenez en charge des scénarios spécifiques et comprenez les dépendances pour les différences. Par exemple, notez la différence entre ces deux questions :

    • Lequel de nos clients a soumis le plus de demandes de modification ? Compte les ID de demande et renvoie le client avec la plupart des requêtes : ignorer d’autres colonnes

    • Parmi nos clients, quel est l’impact le plus élevé sur les coûts entre les demandes de modification ? Additionne la colonne d’impact sur le coût par le client et renvoie le client qui a soumis le montant total le plus élevé du dollar. Elle retourne uniquement ces informations si elle trouve une colonne appropriée qui est numérique ou monétaire.

  • Veillez à identifier et à définir toutes les colonnes numériques pour les calculs. Assurez-vous qu’elles sont mises en forme avec le type de données approprié ; au niveau de la source de connaissances et lorsqu’elles sont utilisées dans les variables Copilot Studio. Si possible, incluez une description claire et incluez des synonymes courants pour les colonnes pertinentes dans les tables, colonnes ou descriptions d’outils.

    Astuce

    Avec la compréhension du langage naturel, si les en-têtes de table sont trop techniques dans leur protocole d’affectation de noms, l’IA peut ne pas être en mesure de répondre aux questions centrées sur l’homme posées pendant le flux de conversation. Ajoutez des descripteurs avec des verbiages classiques utilisés par vos utilisateurs.

  • Reconnaissez que les personnes obtiennent uniquement des réponses sur les données qu’elles sont autorisées à voir. Par exemple, une table Sales dans Dataverse peut uniquement exposer certains enregistrements à des groupes d’entreprise spécifiques, mais pas tous. Par conséquent, assurez-vous que votre assistant ne définit pas les mauvaises attentes sur la façon dont les données sont résumées. Par exemple, une demande de ventes totales en 2024 additionne uniquement les enregistrements détenus ou partagés.

  • Définissez toujours les attentes des consommateurs pour les réponses basées sur l’IA. Utilisez le Début de la conversation de l’agent ou le premier message suivant les déclencheurs de rubrique, pour mettre en évidence correctement l’objectif et les contraintes pour une ou plusieurs sources de connaissances pertinentes.

Utiliser des invites en tant qu’outils

Les invites vous permettent d’ajouter des fonctionnalités d’IA générative depuis Power Apps vers vos assistants et solutions dans Copilot Studio. Cette fonctionnalité vous permet d’effectuer des tâches telles que la classification, la synthèse, la génération de contenu brouillon, la transformation des données et bien plus encore. Avec des invites, vous pouvez également personnaliser les réponses d’IA génératives pour utiliser des filtres et des agrégations spécifiques à partir de tables.