Partager via


Confidentialité, sécurité et utilisation responsable de Copilot dans les notebooks et les agents de données Fabric

Dans cet article, découvrez comment Microsoft Copilot dans Notebooks et les agents de données Fabric (anciennement appelés agents de données) fonctionnent, comment vos données professionnelles sont sécurisées et respectent les exigences de confidentialité, et comment utiliser l’IA générative de manière responsable. Pour obtenir une vue d’ensemble de ces rubriques pour Copilot dans Fabric, consultez Confidentialité, sécurité et utilisation responsable de Copilot (préversion).

Utilisation des données

Utilisation des données dans Copilot pour les notebooks de Fabric

  • Dans les notebooks, Copilot peut accéder seulement aux données accessibles au notebook actuel de l’utilisateur, dans un lakehouse attaché, chargé ou importé directement dans ce notebook par l’utilisateur. Dans les cahiers, Copilot ne peut accéder à aucune donnée qui n'est pas accessible au cahier.

  • Par défaut, Copilot a accès aux types de données suivants :

    • Historique des conversations : messages précédents envoyés et réponses de Copilot pour cet utilisateur. (voir ci-dessous pour plus d’informations sur le stockage de l’historique des conversations)
    • Contenu des cellules exécutées par l’utilisateur.
    • Sorties des cellules exécutées par l’utilisateur.
    • Schémas de sources de données dans le notebook.
    • Exemples de données issus de sources de données dans le carnet de notes.
    • Schémas provenant de sources de données externes dans un lakehouse attaché.

Utilisation des données dans les agents de données Fabric

  • Les agents de données Fabric s’appuient sur l’historique des conversations de l’utilisateur pour mieux répondre aux questions de l’utilisateur. (voir ci-dessous pour plus d’informations sur le stockage de l’historique des conversations)
  • Informations de schéma des sources de données ajoutées. Cela inclut les noms de table et de colonne. (Le créateur d’un agent de données sélectionne les tables à inclure.)

Comment nous gérons l’historique des conversations

Pour Copilot dans les agents de données Notebooks et Fabric, nous stockons l’historique des conversations entre les sessions utilisateur.

Pourquoi stockons-nous l’historique des conversations et où est-il stocké ?

Pour utiliser des expériences IA agentiques entièrement conversationnelles, l’agent doit stocker l’historique des conversations entre les sessions utilisateur pour maintenir le contexte. Cela garantit que l’agent IA conserve le contexte sur ce qu’un utilisateur a demandé dans les sessions précédentes et est généralement un comportement souhaité dans de nombreuses expériences IA agentiques. Les expériences telles que Copilot dans les notebooks et les agents de données Fabric sont des expériences IA qui stockent l’historique des conversations entre les sessions de l’utilisateur.

Cet historique est stocké à l’intérieur de la limite de sécurité Azure, dans la même région et dans les mêmes ressources Azure OpenAI qui traitent toutes vos demandes d’IA Fabric. La différence dans ce cas est que l’historique des conversations est stocké tant que l’utilisateur l’autorise. Pour les expériences qui ne stockent pas l’historique des conversations entre les sessions, aucune donnée n’est stockée. Les instructions sont traitées uniquement par les ressources Azure OpenAI utilisées par Fabric.

Vos utilisateurs peuvent supprimer leur historique des conversations à tout moment, simplement en désactivant la conversation. Cette option existe à la fois pour Copilot dans Notebooks et pour les agents de données. Si l’historique des conversations n’est pas supprimé manuellement, il est stocké pendant 28 jours.

Copilot dans les Notebooks : FAQ sur l’IA responsable

Avec Copilot dans les notebooks pour la science des données et l’ingénierie des données dans Microsoft Fabric, nous offrons un assistant IA pour aider à transformer, explorer et créer des solutions dans le contexte du notebook.

Pour les considérations et limitations, consultez Limitations.

Comment avons-nous évalué Copilot dans les carnets pour la science des données et l’ingénierie des données ?

  • L’équipe produit a testé Copilot pour voir comment le système fonctionne dans le contexte des cahiers numériques, et si les réponses de l'IA sont pertinentes et utiles.
  • L’équipe a également investi dans d’autres atténuations des dommages, y compris des approches technologiques pour concentrer la sortie de Copilot sur les sujets liés à la science des données.

Comment tirer le meilleur parti de Copilot dans les notebooks pour la science des données et l'ingénierie des données ?

  • Copilot est mieux équipé pour gérer les sujets de science des données, donc limitez vos questions à ce domaine.
  • Décrivez explicitement les données que Copilot doit examiner. Si vous décrivez la ressource de données ( par exemple, en nommant des fichiers, des tables ou des colonnes), Copilot peut probablement récupérer des données pertinentes et générer des sorties utiles.
  • Pour des réponses plus granulaires, chargez les données dans le notebook en tant que DataFrames ou épinglez les données dans votre lakehouse. Cela donne à Copilot plus de contexte avec lequel effectuer l’analyse. Si une ressource est trop volumineuse pour être chargée, l’épinglage est une alternative utile.

Agent de données Fabric : FAQ sur l’IA responsable

Qu’est-ce que l’agent de données Fabric ?

L’agent de données est une nouvelle fonctionnalité Microsoft Fabric qui vous permet de créer vos propres systèmes Q&A conversationnels avec l’IA générative. Un assistant de données Fabric rend les insights de données plus accessibles et exploitables pour tous les membres de votre organisation. Avec un agent de données Fabric, votre équipe peut avoir des conversations, avec des questions en langue anglaise simple, sur les données stockées dans Fabric OneLake, puis recevoir des réponses pertinentes. Même les personnes sans expertise technique dans l’IA, ou sans compréhension approfondie de la structure des données, peuvent recevoir des réponses précises et riches en contexte.

Que peut faire l’agent de données ?

L’agent de données Fabric permet des interactions en langage naturel avec des données structurées, ce qui permet aux utilisateurs de poser des questions et de recevoir des réponses riches et contextuelles. Il peut permettre aux utilisateurs de se connecter et d’obtenir des insights à partir de sources de données telles que Lakehouse, Warehouse, jeu de données Power BI, bases de données KQL sans avoir besoin d’écrire des requêtes complexes. L’agent de données est conçu pour aider les utilisateurs à accéder et traiter facilement les données, ce qui améliore la prise de décision par le biais d’interfaces conversationnelles tout en conservant le contrôle sur la sécurité et la confidentialité des données.

Quelles sont les utilisations prévues pour l’agent de données ?

  • L’agent de données Fabric est destiné à simplifier le processus d’interrogation des données. Il permet aux utilisateurs d’interagir avec des données structurées par le biais du langage naturel. Il prend en charge les insights utilisateur, la prise de décision et la génération de réponses à des questions complexes sans avoir besoin de connaissances spécialisées en langage de requête. L’agent de données est particulièrement utile pour les analystes d’entreprise, les décideurs et d’autres utilisateurs non techniques qui ont besoin d’insights rapides et exploitables à partir de données stockées dans des sources telles que la base de données KQL, Lakehouse, le jeu de données Power BI et les ressources de l’entrepôt.

  • L’agent de données Fabric n’est pas destiné aux cas d’usage où les résultats déterministes et 100% exacts sont requis, en raison des limitations LLM actuelles.

  • L’agent de données Fabric n’est pas destiné aux cas d’utilisation qui nécessitent une analyse approfondie ou une analytique causale. Par exemple, « pourquoi les chiffres de vente ont-ils chuté le mois dernier ? » est hors du cadre actuel.

Comment l’agent de données Fabric a-t-il été évalué ? Quelles métriques sont utilisées pour mesurer les performances ?

L’équipe produit a testé l’agent de données sur différents benchmarks publics et privés pour déterminer la qualité de la requête sur différentes sources de données. L’équipe a également investi dans d’autres atténuations des dommages, y compris des approches technologiques pour s’assurer que la sortie de l’agent de données est limitée au contexte des sources de données sélectionnées.

Quelles sont les limitations de l’agent de données Fabric ? Comment les utilisateurs peuvent-ils réduire l’impact des limitations de l’agent de données Fabric lors de l’utilisation du système ?

  • Veillez à utiliser des noms de colonnes descriptifs. Au lieu des noms de colonnes « C1 » ou « ActCu » (par exemple), utilisez « ActiveCustomer » ou « IsCustomerActive ». Il s’agit du moyen le plus efficace d’obtenir des requêtes plus fiables à partir de l’IA.

  • Pour améliorer la précision de l’agent de données Fabric, vous pouvez fournir davantage de contexte avec des instructions d’agent de données et des exemples de requêtes. Ces entrées aident l’API De l’Assistant Azure OpenAI, qui alimente l’agent de données Fabric, à prendre de meilleures décisions sur la façon d’interpréter les questions utilisateur et la source de données la plus appropriée à utiliser.

  • Vous pouvez utiliser des instructions de l’agent de données pour guider le comportement de l’agent sous-jacent, ce qui lui permet d’identifier la meilleure source de données pour répondre à des types spécifiques de questions.

  • Vous pouvez également fournir des exemples de paires question-requête pour montrer comment l’agent de données Fabric doit répondre aux requêtes courantes. Ces exemples servent de modèles pour interpréter des entrées utilisateur similaires et générer des résultats précis. Les exemples de paires question-requête ne sont actuellement pas pris en charge pour les sources de données de modèle sémantique Power BI.

  • Reportez-vous à cette ressource pour obtenir la liste complète des limitations actuelles de l’agent de données.

Quels sont les facteurs opérationnels et les paramètres qui permettent une utilisation efficace et responsable de l’agent de données Fabric ?

  • L’agent de données Fabric peut uniquement accéder aux données que vous fournissez. Il utilise le schéma (nom de la table et nom de colonne), ainsi que les instructions de l’agent de données Fabric et les exemples de requêtes que vous fournissez, dans l’interface utilisateur (IU) ou via le Kit de développement logiciel (SDK).

  • L’agent de données Fabric ne peut accéder qu’aux données auxquelles l’utilisateur peut accéder. Si vous utilisez l’agent de données, vos informations d’identification sont utilisées pour accéder à la base de données sous-jacente. Si vous n’avez pas accès aux données sous-jacentes, l’agent de données ne peut pas accéder à ces données sous-jacentes. Cela est vrai lorsque vous consommez l’agent de données sur différents canaux, par exemple Microsoft Foundry ou Microsoft Copilot Studio, où d’autres utilisateurs peuvent utiliser l’agent de données.