Partager via


Forum aux questions sur la préparation des données pour l’IA

Note

La création de toutes les données de préparation pour les fonctionnalités IA n’est pas disponible dans le service Power BI et Power BI Desktop. La consommation de ces fonctionnalités est disponible partout où Copilot existe.

Fonctionnalités d’outils

Quelles fonctionnalités Power BI ont aujourd’hui pour m’aider à préparer mes données pour Copilot ?

Aujourd’hui, Power BI propose quatre fonctionnalités d’outils principales pour configurer votre modèle afin qu’il soit prêt pour le traitement du langage naturel :

  • Schéma de données IA : vous permet de sélectionner un sous-ensemble du schéma pour la consommation de Copilot.
  • Réponses vérifiées : un jeu de réponses configuré par un auteur de modèle validé pour la précision et la fiabilité. Les auteurs peuvent définir des visuels spécifiques pour Copilot à utiliser dans une réponse vérifiée lorsqu’un utilisateur pose une question qui tombe dans la catégorie affectée.
  • Instructions d’IA : les instructions que vous pouvez définir sur votre modèle pour fournir davantage de contexte sur les données du modèle, guident Copilot pour comprendre quand se concentrer sur les données et comprendre certains utilisateurs de langage de mappage peuvent utiliser lors de l’interaction avec Copilot.
  • Descriptions : Descriptions définies sur des tables et des colonnes pour fournir plus de détails sur le contexte des données. Les descriptions sont utilisées uniquement dans les fonctionnalités de requête Q (DAX) et de recherche Copilot.

Dans quel ordre dois-je implémenter les fonctionnalités d’outils Power BI Copilot ?

Pour obtenir la plus grande valeur de Power BI Copilot, nous vous suggérons d’implémenter ses fonctionnalités d’outils dans la séquence suivante :

  1. Définissez le schéma de données IA.

    Commencez par sélectionner les tables, champs et mesures spécifiques que Copilot doit référencer lors de la réponse aux questions de données.

    Pendant le développement de modèles, vous pouvez inclure des éléments qui ne sont pas pertinents pour les requêtes de l’utilisateur final. L’étroitesse du schéma permet à Copilot de se concentrer sur les parties les plus significatives de votre modèle, ce qui réduit l’ambiguïté, en particulier dans les jeux de données volumineux avec des champs qui se chevauchent ou de manière similaire.

    Ici, nous avons un exemple de la façon dont le schéma de données IA peut aider Copilot à se concentrer sur les données appropriées.

    Lorsque l’ensemble du schéma est utilisé, Copilot n’est pas toujours clair sur l’intention de l’utilisateur lorsqu’il dit des ventes. Dans ce cas, Copilot a retourné GPM, ou marge bénéficiaire brute, une interprétation légitime des ventes, mais pas la métrique que cette équipe utilise généralement pour analyser les ventes.

    L’auteur du modèle passe aux données de préparation pour l’IA et supprime la mesure GPM totale d’être incluse dans le schéma passé à Copilot.

    Maintenant, lorsque l’utilisateur pose la même question, Copilot a plus de clarté sur l’endroit où obtenir la réponse et interprète correctement les ventes comme définies et mesures par cette équipe.

    Capture d’écran d’un exemple montrant comment affiner le schéma de données IA aide Copilot à se concentrer sur les données appropriées pour les requêtes utilisateur.

  2. Créez des réponses vérifiées.

    Configurer des réponses vérifiées pour les questions courantes ou nuances que les utilisateurs peuvent poser.

    Pour ce faire, sélectionnez un visuel et choisissez « Créer une réponse vérifiée ». Ajoutez ensuite des expressions de déclencheur qui reflètent la façon dont les utilisateurs sont susceptibles d’formuler leurs questions. Lorsque les utilisateurs entrent une expression correspondante ou similaire dans Copilot, il retourne le visuel approuvé, ce qui garantit des réponses cohérentes et de haute qualité entre les rapports.

    L’exemple suivant montre l’avantage d’une réponse vérifiée. L’utilisateur demande des ventes par zone. Copilot interprète la zone comme zone de produit et retourne une liste de produits et de leurs ventes. Toutefois, l’utilisateur recherchait des ventes par région ou emplacement.

    L’auteur du modèle définit une réponse vérifiée, à l’aide d’un visuel qui inclut les ventes par région. Après avoir choisi de définir une réponse vérifiée sur le visuel, l’auteur du modèle inclut des expressions de déclencheur qui, lorsqu’un utilisateur est invité, doit retourner cette réponse visuelle spécifique.

    À présent, lorsque l’utilisateur demande ce que sont les ventes par zone, la réponse vérifiée, approuvée par l’auteur du modèle, est retournée par Copilot.

    Capture d’écran d’un exemple montrant comment les réponses vérifiées améliorent la précision des réponses de Copilot aux requêtes utilisateur.

  3. Ajoutez des instructions d’IA.

    Après avoir défini le schéma et vérifié les réponses, utilisez des instructions IA pour guider le comportement de Copilot au niveau du modèle.

    Les instructions permettent de clarifier la logique métier, de mapper la terminologie utilisateur aux champs de modèle et de diriger Copilot sur la façon d’interpréter ou d’analyser des types de données spécifiques. Ils sont utiles pour fournir le contexte Copilot ne serait pas autrement déduit par lui-même.

    L’exemple suivant montre comment les instructions d’IA peuvent être utilisées pour fournir davantage de contexte à Copilot. L’utilisateur a demandé des ventes pendant la saison occupée de 2012. La saison occupée est une expression bien définie et couramment utilisée au sein de cette organisation. Toutefois, le modèle sémantique n’a aucune indication de ce terme n’importe où. L’auteur du modèle définit une instruction que la saison occupée est définie en juin-août.

    Maintenant, lorsque l’utilisateur pose à nouveau la question des ventes pendant la saison occupée, Copilot comprend ce terme défini et peut fournir la réponse.

    Capture d’écran d’un exemple montrant comment les instructions IA fournissent un contexte supplémentaire à Copilot pour interpréter les requêtes utilisateur.

  4. Ajoutez des descriptions aux tables et aux colonnes.

    Les descriptions fournissent des métadonnées supplémentaires que Copilot peut utiliser pour comprendre votre modèle.

    Bien que les descriptions n’influencent actuellement que certains comportements Copilot, ils jouent un rôle plus important dans les fonctionnalités futures. L’ajout de ces éléments permet désormais de créer une base solide pour la réussite à long terme des interactions en langage naturel dans Power BI.

Puis-je créer des outils sur un rapport au lieu du modèle ?

Aujourd’hui, les fonctionnalités d’outils et de configuration ne sont disponibles que sur le modèle. La configuration de différents rapports créés sur le même modèle n’est pas encore prise en charge. Le schéma, les réponses vérifiées, les instructions et les descriptions sont définis sur le modèle sémantique, mais pas sur le rapport.

Quelles sont les fonctionnalités de Copilot affectées par la préparation de mes données pour Copilot ?

Reportez-vous au tableau suivant :

Capability Schéma de données IA Réponses vérifiées Instructions d’IA Descriptions
Obtenir un résumé de mon rapport No No Yes No
Poser une question sur les visuels sur mon rapport No Yes Yes No
Poser une question sur mon modèle sémantique Yes Yes Yes No
Créer une page de rapport No No Yes No
Search No Yes No Yes
Requête DAX No No Yes Yes

Connaître la fonctionnalité à utiliser

J’essaie d’obtenir Copilot pour sélectionner le champ approprié. Quelle fonctionnalité dois-je utiliser ?

  1. Définissez votre schéma de données IA.

    Supprimez les tables, colonnes ou champs qui ne sont pas pertinents pour les besoins de vos utilisateurs. Cela permet à Copilot de se concentrer sur les parties les plus pertinentes de votre modèle, en s’assurant qu’il sélectionne les champs appropriés lors de la réponse aux requêtes.

  2. Utilisez des réponses vérifiées pour les visuels dans les rapports.

    Si la réponse à une question peut être dérivée d’un visuel dans votre rapport, créez une réponse vérifiée. Cela garantit que lorsque les utilisateurs posent des questions avec des expressions de déclencheur spécifiques, Copilot retourne le visuel correct de manière cohérente.

  3. Personnalisez les instructions pour des champs spécifiques.

    Une fois que vous avez défini le schéma et vérifié les réponses, vous pouvez utiliser des instructions IA pour guider Copilot lors de la sélection de champs particuliers. Nous vous recommandons d’utiliser des instructions pour affiner et pour les scénarios avancés une fois que d’autres fonctionnalités ia de données de préparation sont définies. En utilisant cette séquence d’étapes, vous assurez que Copilot retourne les résultats les plus précis et contextuelment pertinents aux utilisateurs, guidés par la structure de votre modèle et vos instructions définies.

J’essaie d’obtenir Copilot pour comprendre le terme que j’utilise. Quelle fonctionnalité dois-je utiliser ?

Si vous avez un terme Copilot est difficile à comprendre que toujours avoir le même élément correct unique à référencer dans votre modèle, vous pouvez fournir un autre nom par le biais d’instructions IA.

Par exemple, si votre équipe appelle les personnes qui vendent vos produits « plus proches », la meilleure option consiste à donner une référence dans les instructions d’IA en définissant « vendeurs » comme « plus proches ».

J’essaie d’obtenir Copilot pour comprendre les conditions ou les regroupements. Quelle fonctionnalité dois-je utiliser ?

Si votre équipe utilise certains termes qui ne correspondent pas exactement à 1:1 avec les tables/champs de votre modèle, l’utilisation d’instructions IA permet de clarifier différents éléments avec certaines conditions ou regroupements.

Par exemple, une équipe commerciale peut classifier les « hauts artistes » comme toute personne qui vend plus de 100% de ses cibles au cours d’un mois donné. Vous pouvez ensuite fournir les instructions suivantes à Copilot :

Un vendeur qui rencontre 100% ou plus de sa cible mensuelle est élevé.

Maintenant, quand un utilisateur demande « Qui étaient les meilleurs artistes le mois dernier ? » Copilot comprend la définition de ce qu’une haute performance signifie dans votre équipe et votre organisation.

Un autre exemple peut être venu avec la façon dont une équipe classifie différentes saisons. Par exemple, Jan-May peut être référencée dans votre équipe comme la saison lente, juin à septembre peut être occupé saison, et octobre à décembre peut être la saison standard.

Dans les instructions d’IA, vous pouvez définir les éléments suivants :

  • La saison lente signifie janvier à mai.
  • La saison occupée signifie juin à septembre.
  • La saison standard signifie octobre à décembre.

Maintenant, quand un utilisateur demande « Quelles sont les ventes totales de la saison occupée l’année dernière ? » Copilot comprend quelle période l’utilisateur signifie par saison occupée.

J’essaie d’obtenir Copilot pour retourner la réponse correcte aux questions les plus fréquemment posées. Quelle fonctionnalité dois-je utiliser ?

Les consommateurs de vos rapports et données ont probablement des questions courantes qui sont posées le plus fréquemment. La meilleure façon de résoudre ce problème consiste à appliquer des réponses vérifiées à votre modèle. Appliquez une réponse vérifiée en sélectionnant un visuel et en définissant des expressions de déclencheur que lorsqu’un utilisateur demande à la rubrique, il retourne des informations à l’aide du visuel affecté.

Par exemple, les consommateurs du rapport et du modèle posent souvent la question « Quel produit a eu les ventes les plus élevées la semaine dernière » sur le total des ventes et les montants. La définition d’une réponse vérifiée permet à Copilot de comprendre où obtenir les bonnes informations et permet de créer une confiance de l’auteur et du consommateur avec la réponse fournie.

J’essaie d’obtenir copilot retourner différentes réponses en fonction des domaines ou des groupes d’utilisateurs. Quelle fonctionnalité dois-je utiliser ?

Les capacités telles qu’elles existent aujourd’hui sont limitées à une grande consommation. La création d’un glossaire basé sur différents groupes n’est pas prise en charge aujourd’hui. Par exemple, si l’utilisation pour les ingénieurs signifie « nombre de fois cliqué » et l’utilisation à un responsable de produit signifie « payer les clients au cours d’un mois donné », puis définir « utilisation » dans le modèle de deux façons différentes ne peut pas être prise en charge aujourd’hui.

Données de préparation pour l’IA

J’obtiens une erreur indiquant que « Copilot est actuellement synchronisé avec le modèle de données ». Qu’est-ce que cela signifie ?

Pour que Copilot puisse s’exécuter au mieux, il est essentiel que Copilot puisse comprendre les données sous-jacentes dans le modèle sémantique. L’une des façons dont Power BI Copilot tente de comprendre les données sous-jacentes consiste à indexer le modèle sémantique pour rechercher avec précision les valeurs pertinentes à mettre en correspondance. Cela permet à Copilot de répondre efficacement aux questions en fonction de l’invite de l’utilisateur.

Considérez le jeu de données du tourisme Hawaï. Pour répondre à des questions comme : « Comment le temps a-t-il affecté les visites touristiques sur Maui ? » Copilot doit comprendre que Maui est une valeur d’instance dans le modèle sémantique dans la colonne Island name de la table Island .

Pour permettre à Copilot de rechercher efficacement ces valeurs d’instance, le modèle sémantique est indexé lorsque Q&A est activé et réindexé lorsque Power BI détecte les modifications apportées au modèle.

Fréquence d’indexation du modèle

L’indexation est effectuée pour tous les modèles sur utilisant le paramètre Q&A activé.

Note

Le paramètre Q&A est activé par défaut pour les modèles d’importation . Vous trouverez plus d’informations sur ce paramètre dans la documentation relative aux paramètres Q&A.

La réindexation se produit lorsque l’une des actions suivantes a lieu :

  • Pour les modèles d’importation :
    • Le modèle a été publié/republié sur le service.
    • Le modèle a été actualisé via une actualisation manuelle ou planifiée et Copilot/Q&A a été utilisé au cours des 14 derniers jours.
  • Pour les modèles Direct Query et Direct Lake :
    • Le modèle a été publié/republié sur le service.
    • L’index est antérieur à 24 heures et Copilot/Q&A a été utilisé au cours des 14 derniers jours.

Le message suivant dans Copilot indique que le modèle est actuellement en cours d’indexation. Le message doit être résolu automatiquement une fois l’indexation terminée.

Capture d’écran du message Copilot indiquant que le modèle est actuellement indexé.

Note

Cette erreur ne signifie pas que Copilot n’est pas disponible pour les utilisateurs. Ce message indique que les nouvelles valeurs d’instance ajoutées ou modifiées dans le modèle peuvent ne pas refléter les réponses de Copilot tant que l’activité d’indexation n’est pas terminée.

Méthodologie d’indexation

Les colonnes de texte dans le modèle sémantique sont les seules colonnes indexées. Les colonnes masquées dans le schéma IA via la préparation de vos données pour la fonctionnalité IA ne sont pas indexées.

Jusqu’à cinq millions de valeurs d’instance sont indexées avec des colonnes, la plus petite cardinalité étant indexée en premier. La cardinalité de la colonne est déterminée avec DISTINCTCOUNT pour les modèles d’importation et COLUMNSTATISTICS pour les modèles Direct Query. Pour les sources Direct Query, la COLUMNSTATISTICS fonction utilise la APPROXIMATEDISTINCTCOUNT fonction pour les sources de données sous-jacentes qui la prennent en charge pour déterminer efficacement les cardinalités de colonne approximatives. Pour empêcher davantage la surcharge du système sous-jacent pour les modèles Direct Query avec un afflux de requêtes en raison de l’indexation, les résultats sont COLUMNSTATISTICS mis en cache et les statistiques sont recomputées tous les sept jours. Pendant le processus d’indexation, si la limite supérieure de la valeur d’instance de cinq millions est croisée avec l’indexation de la colonne suivante, l’indexation de la colonne est entièrement ignorée.

Si la limite de l’indexation est atteinte, Copilot répond toujours, mais en fonction de l’index généré, qui n’inclut pas toutes les valeurs d’instance. Les utilisateurs voient l’avertissement suivant lorsque le modèle sémantique en question atteint la limite d’indexation.

Capture d’écran du message Copilot indiquant que le modèle est actuellement indexé.

Limitations connues

  • L’indexation a une limite supérieure de cinq millions de valeurs d’instance ou 1 000 entités de modèle (tables/colonnes) pour les modèles sémantiques volumineux.
  • Les valeurs de texte de 100 caractères+ ne sont pas indexées.
  • Les modèles Direct Query indexent uniquement les colonnes pour les sources de données qui prennent en charge APPROXIMATEDISTINCTCOUNT.
  • L’indexation pour les modèles Direct Query et Direct Lake se produit une fois pendant une période de 24 heures, sauf si le modèle est republié.