Partager via


Concepts de l’agent de données Fabric (version préliminaire)

L’agent de données dans Microsoft Fabric est une nouvelle fonctionnalité Microsoft Fabric qui vous permet de créer vos propres systèmes Q&A conversationnels à l’aide de l’IA générative. Un assistant de données Fabric rend les insights de données plus accessibles et exploitables pour tous les membres de votre organisation. Avec un assistant de données Fabric, votre équipe peut avoir des conversations, avec des questions purement en langue anglaise, sur les données stockées par votre organisation dans Fabric OneLake, puis recevoir des réponses pertinentes. De cette façon, même les personnes sans expertise technique en IA ou sans compréhension approfondie de la structure des données peuvent recevoir des réponses précises et riches en contexte.

Vous pouvez également ajouter des instructions, des exemples et des conseils spécifiques à l’organisation pour affiner l’assistant de données Fabric. Cette approche garantit que les réponses s’alignent sur les besoins et les objectifs de votre organisation, ce qui permet à tout le monde d’interagir plus efficacement avec les données. L’assistant de données Fabric favorise une culture de la prise de décision basée sur les données, car il réduit les obstacles à l’accessibilité des insights, facilite la collaboration et permet à votre organisation d’extraire plus de valeur de ses données.

Important

Cette fonctionnalité est en version préliminaire.

Conditions préalables

Fonctionnement de l’assistant de données Fabric

L’agent de données Fabric utilise des modèles de langage volumineux (LLMs) pour aider les utilisateurs à interagir naturellement avec leurs données. L’agent de données Fabric applique les API de l’Assistant Azure OpenAI et se comporte comme un agent. Il traite les questions utilisateur, détermine la source de données la plus pertinente (Lakehouse, Warehouse, jeu de données Power BI, bases de données KQL, ontologie) et appelle l’outil approprié pour générer, valider et exécuter des requêtes. Les utilisateurs peuvent ensuite poser des questions purement en anglais et recevoir des réponses structurées et lisibles par les utilisateurs, ce qui élimine la nécessité d’écrire des requêtes complexes et garantit un accès précis et sécurisé aux données.

Voici comment cela fonctionne en détail :

Analyse et validation des questions : l’agent de données Fabric applique les API de l’Assistant Azure OpenAI en tant qu’agent sous-jacent pour traiter les questions utilisateur. Cette approche garantit que la question est conforme aux protocoles de sécurité, aux stratégies d’IA responsable et aux autorisations utilisateur. L'agent de données Fabric applique strictement l'accès en lecture seule, maintenant des connexions de données en lecture seule à toutes les sources de données.

Identification de la source de données : l’agent de données Fabric utilise les informations d’identification de l’utilisateur pour accéder au schéma de la source de données. Cette approche garantit que le système extrait les informations de structure de données que l’utilisateur a l’autorisation d’afficher. Il évalue ensuite la question de l’utilisateur sur toutes les sources de données disponibles, notamment les bases de données relationnelles (Lakehouse et Warehouse), les jeux de données Power BI (modèles sémantiques), les bases de données KQL et les ontologies. Il peut également faire référence aux instructions de l’assistant de données fournies par l’utilisateur pour déterminer la source de données la plus pertinente.

Appel d’outils et génération de requête : une fois que la source de données ou les sources correctes sont identifiées, l’agent de données Fabric réédifie la question pour la clarté et la structure, puis appelle l’outil correspondant pour générer une requête structurée :

  • Langage naturel vers SQL (NL2SQL) pour les bases de données relationnelles (lakehouse/entrepôt).
  • Langage naturel vers DAX (NL2DAX) pour les jeux de données Power BI (modèles sémantiques).
  • Langage naturel en KQL (NL2KQL) pour les bases de données KQL.

L’outil sélectionné génère une requête basée sur le schéma, les métadonnées et le contexte fournis que l’assistant sous-jacent à l’assistant de données Fabric transmet ensuite.

Validation de la requête : l’outil effectue la validation pour vous assurer que la requête est correctement formée et respecte ses propres protocoles de sécurité et stratégies RAI.

Exécution et réponse de la requête : une fois validé, l’agent de données Fabric exécute la requête sur la source de données choisie. Les résultats sont mis en forme dans une réponse lisible par les utilisateurs, qui peut inclure des données structurées telles que des tables, des résumés ou des insights clés.

Cette approche garantit que les utilisateurs peuvent interagir avec leurs données à l’aide du langage naturel, tandis que l’assistant de données Fabric gère les complexités de la génération, de la validation et de l’exécution des requêtes, sans que les utilisateurs n’écrivent de langage SQL, DAX ou KQL eux-mêmes.

Configuration de l’assistant de données Fabric

La configuration d’un assistant de données Fabric est similaire à la création d’un rapport Power BI. Vous commencez par le créer et l’affiner pour vous assurer qu’il répond à vos besoins, puis le publiez et le partagez avec vos collègues afin qu’ils puissent interagir avec les données. La configuration d’un assistant de données Fabric implique :

Sélection de sources de données : un agent de données Fabric prend en charge jusqu’à cinq sources de données dans n’importe quelle combinaison, notamment les lakehouses, les entrepôts, les bases de données KQL, les modèles sémantiques Power BI et les ontologies. Par exemple, un assistant de données Fabric configuré peut inclure cinq modèles sémantiques Power BI. Il peut inclure un mélange de deux modèles sémantiques Power BI, un lakehouse et une base de données KQL. Vous disposez de nombreuses options.

Choix des tables pertinentes : après avoir sélectionné les sources de données, ajoutez-les une à la fois et définissez les tables spécifiques de chaque source utilisée par l’agent de données Fabric. Cette étape garantit que l’assistant de données Fabric récupère des résultats précis en se concentrant uniquement sur les données pertinentes.

Ajout de contexte : pour améliorer la précision de l’agent de données Fabric, fournissez davantage de contexte via des instructions d’agent de données Fabric et des exemples de requêtes. En tant qu’assistant sous-jacent pour l’assistant de données Fabric, le contexte aide l’API de l’Assistant Azure OpenAI à prendre des décisions plus éclairées sur la façon de traiter les questions utilisateur et à déterminer la source de données la plus pertinente pour y répondre.

  • Instructions de l’agent de données : ajoutez des instructions pour guider l’agent qui sous-tend l’agent de données Fabric, en déterminant la meilleure source de données pour répondre à des types de questions spécifiques. Vous pouvez également fournir des règles ou des définitions personnalisées pour clarifier la terminologie ou des exigences spécifiques de l’organisation. Ces instructions peuvent fournir plus de contexte ou de préférences qui influencent la façon dont l’assistant sélectionne et interroge des sources de données.

    • Questions directes sur les métriques financières vers un modèle sémantique Power BI.
    • Attribuez des requêtes impliquant l’exploration de données brutes au lakehouse.
    • Routez les questions nécessitant une analyse des journaux vers la base de données KQL.
  • Exemples de requêtes : ajoutez des exemples de paires question-requête pour illustrer la façon dont l’agent de données Fabric doit répondre aux requêtes courantes. Ces exemples servent de guide pour l’assistant, ce qui lui permet de comprendre comment interpréter des questions similaires et générer des réponses précises.

Remarque

L'ajout d'exemples de paires requête/question n'est actuellement pas pris en charge pour les sources de données du modèle sémantique Power BI.

En combinant des instructions d’IA claires et des exemples de requêtes pertinents, vous pouvez mieux aligner l’agent de données Fabric avec les besoins de données de votre organisation, ce qui garantit des réponses plus précises et plus contextuelles.

Différence entre un assistant de données Fabric et un copilote

Bien que les agents de données Fabric et les copilotes Fabric utilisent l’IA générative pour traiter et raisonner les données, les principales différences existent dans leurs fonctionnalités et leurs cas d’usage :

Flexibilité de la configuration : vous pouvez configurer hautement les agents de données Fabric. Vous pouvez fournir des instructions et des exemples personnalisés pour adapter leur comportement à des scénarios spécifiques. Les copilotes fabric, d’autre part, sont préconfigurés et ne proposent pas ce niveau de personnalisation.

Étendue et cas d’usage : les copilotes Fabric aident à effectuer des tâches dans Microsoft Fabric, telles que la génération de code de notebook ou de requêtes d’entrepôt. Les assistants de données Fabric, en revanche, sont des artefacts autonomes. Pour rendre les assistants de données Fabric plus polyvalents pour des cas d’usage plus larges, il est possible de les intégrer à des systèmes externes tels que Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams ou d’autres outils en dehors de Fabric.

Évaluation de l’assistant de données Fabric

L’équipe produit a évalué rigoureusement la qualité et la sécurité des réponses de l’agent de données Fabric :

Test de benchmark : l’équipe produit a testé des assistants de données Fabric dans une gamme de jeux de données publics et privés pour garantir des réponses de haute qualité et précises.

Atténuations améliorées des dommages : l’équipe produit a implémenté des mesures de protection pour garantir que les sorties de l’agent de données Fabric restent axées sur le contexte des sources de données sélectionnées, ce qui réduit le risque de réponses non pertinentes ou trompeuses.

Limites

L’agent de données Fabric est actuellement en préversion publique et présente des limitations. Des mises à jour futures permettront d’améliorer l’assistant de données Fabric au fil du temps.

  • L’agent de données Fabric génère uniquement des requêtes SQL, DAX et KQL « read ». Elle ne génère pas de requêtes SQL, DAX ou KQL qui créent, mettent à jour ou suppriment des données.
  • L’agent de données Fabric ne prend pas en charge les données non structurées, telles que .pdf, .docxou les fichiers .txt. Vous ne pouvez pas utiliser l’assistant de données Fabric pour accéder à des ressources de données non structurées.
  • L’agent de données Fabric ne prend actuellement pas en charge les langues non anglaises. Pour des performances optimales, fournissez des questions, des instructions et des exemples de requêtes en anglais.
  • Vous ne pouvez pas modifier le LLM que l’assistant de données Fabric utilise.
  • L’historique des conversations dans l’agent de données Fabric peut ne pas toujours persister. Dans certains cas, tels que les modifications apportées à l’infrastructure principale, les mises à jour de service ou les mises à niveau de modèles, l’historique des conversations passées peut être réinitialisé ou perdu.
  • L’agent de données Fabric ne peut pas exécuter de requêtes lorsque la capacité de l’espace de travail de la source de données se trouve dans une région différente de la capacité de l’espace de travail de l’agent de données. Par exemple, un lakehouse avec une capacité en Europe du Nord échouera si la capacité de l’Agent de données est en France Centrale.