Partager via


Vue d’ensemble de Copilot pour la science des données et l’ingénierie des données (aperçu)

Important

Cette fonctionnalité est en préversion.

Copilot pour la science des données et l’ingénierie des données est un assistant IA qui permet d’analyser et de visualiser les données. Il fonctionne avec les tables et fichiers Lakehouse, les ensembles de données Power BI et les cadres de données pandas/spark/fabric pour fournir des réponses et des extraits de code directement dans un bloc-notes. Les connexions à OneLake et aux Lakehouses attachés par défaut permettent Copilot de fournir des suggestions de code contextualisées et des réponses en langage naturel adaptées à vos données.

Copilot peut vous aider à mieux comprendre vos données et à proposer des suggestions pour commencer votre bloc-notes, notamment la génération de code pour les cellules initiales. Après avoir identifié et ajouté des sources de données via l’Explorateur d’objets Fabric, Copilot Chat suggère des types de modèles à implémenter. Vous pouvez copier ces suggestions directement dans votre carnet pour commencer le développement. Si vous n’êtes pas sûr de vos étapes suivantes, vous pouvez appeler Copilot dans la cellule pour obtenir des insights sur la direction du modèle.

Lorsque vous rencontrez des erreurs, Copilot fournit des correctifs suggérés. Pour obtenir de l’aide supplémentaire, vous pouvez discuter avec Copilot pour explorer d'autres options, afin d'éviter les recherches en ligne constantes.

Vous bénéficiez également de la documentation automatique avec une fonctionnalité simple « Ajouter des commentaires » qui résume les modifications de code et de données. Cela rend les cellules claires pour vous et pour les autres. Tout au long de votre flux de travail, vous pouvez consulter Copilot à des moments précis, en recevant une assistance et des conseils en temps réel pour accélérer votre processus de développement.

Remarque

Avec Spark 3.4 et les versions ultérieures dans Microsoft Fabric, aucune cellule d’installation n’est requise pour l’utiliser Copilot dans votre notebook. Les versions précédentes qui nécessitaient une cellule d'installation (Spark 3.3 et versions antérieures) ne sont plus prises en charge.

Remarque

Présentation de Copilot pour la science des données et l’ingénierie des données pour Fabric Data Science

Avec Copilot data Science and Data Engineering, vous pouvez discuter avec un assistant IA pour gérer vos tâches d’analyse et de visualisation des données. Vous pouvez poser des questions à Copilot sur les tables lakehouse, les jeux de données Power BI ou les DataFrames Pandas/Spark à l’intérieur des notebooks. Copilot fournit des réponses en langage naturel ou en extraits de code. Copilot peut également générer du code spécifique aux données pour vous en fonction de la tâche. Par exemple, Copilot pour la science des données et l’ingénierie des données peuvent générer du code pour :

  • Créer des graphiques
  • Filtrage des données
  • Appliquer des transformations
  • Modèles Machine Learning

Tout d’abord, sélectionnez l’icône Copilot dans le ruban des blocs-notes. Le panneau de conversation Copilot s’ouvre et une nouvelle cellule apparaît en haut de votre bloc-notes. Vous pouvez également sélectionner Copilot en haut de votre cellule Notebooks Fabric.

Pour maximiser l’efficacité de Copilot, chargez une table ou un jeu de données comme dataframe dans votre notebook. L’IA peut alors accéder aux données et comprendre leur structure et leur contenu. Ensuite, commencez à converser avec l’IA. Sélectionnez l’icône de conversation dans la barre d’outils du notebook, puis tapez votre question ou demande dans le panneau de conversation. Par exemple, vous pouvez demander :

  • « Quel est l’âge moyen des clients dans ce jeu de données ? »
  • « Afficher un graphique à barres des ventes par région ».

Copilot répond avec la réponse ou le code, que vous pouvez copier et coller dans votre cahier. Copilot pour la science des données et l’ingénierie des données est un moyen pratique et interactif d’explorer et d’analyser vos données.

Utilisation du Copilot panneau de conversation pour interagir avec vos données

Pour discuter avec vos données et obtenir des informations, sélectionnez l'icône de chat dans la barre d'outils du bloc-notes pour ouvrir le panneau de Conversation Copilot. Tapez vos questions ou requêtes dans le panneau de Conversation. Par exemple, vous pouvez demander :

  • « Quel est l’âge moyen des clients dans ce jeu de données ? »
  • « Afficher un graphique à barres des ventes par région ».

Copilot répond avec la réponse ou le code, que vous pouvez copier et coller dans votre cahier. De plus, Copilot peut suggérer ce qu'il faut faire ensuite avec vos données. Copilot fournit des suggestions et génère des extraits de code pertinents pour vous aider à procéder à vos tâches d'analyse et de visualisation de données.

Pour interagir avec le panneau de Conversation Copilot dans les blocs-notes Microsoft Fabric, procédez comme suit :

  1. Ouvrir le Copilot Panneau de conversation : sélectionnez l’icône de conversation dans la barre d’outils du bloc-notes.

  2. Poser des questions ou faire des requêtes : Tapez vos questions ou requêtes dans le panneau de Conversation. Voici quelques exemples spécifiques de science des données et l’ingénieurs de données :

  • Exploration des données :

    • « Quelle est la distribution de la colonne « âge » dans cet ensemble de données ? »
    • « Afficher un histogramme de la colonne « revenu ».
  • Nettoyage des données :

    • « Comment puis-je gérer les valeurs manquantes dans cet ensemble de données ? »
    • « Générer du code pour supprimer les doublons de ce dataframe. »
  • Transformation des données :

    • « Comment normaliser la colonne « ventes » ? »
    • « Créer une nouvelle colonne « bénéfice » en soustrayant « coût » de « revenu ». »
  • Visualisation :

    • « Tracer un nuage de points entre la « taille » et le « poids ». »
    • « Générer un diagramme en boîte pour la colonne « salaire ». »
  • Machine Learning :

    • « Entraîner un classificateur d’arbre de décision sur cet ensemble de données. »
    • « Générer du code pour un algorithme de clustering k-means avec 3 clusters. »
  • Évaluation du modèle :

    • « Comment évaluer la précision d’un modèle de régression logistique ? »
    • « Générer une matrice de confusion pour les prédictions. »
  1. Recevoir des réponses : Copilot répond avec des explications en langage naturel ou des extraits de code. Vous pouvez copier et coller le code dans votre notebook pour l'exécuter.

  2. Obtenir des suggestions : si vous ne savez pas comment procéder, demandez Copilot pour des suggestions :

  • « Que dois-je faire ensuite avec cet ensemble de données ? »
  • « Quelles sont les techniques d’ingénierie des fonctionnalités recommandées pour ces données ? »
  1. Utiliser le code généré : Copiez les extraits de code générés à partir du panneau de Conversation et collez-les dans les cellules de votre bloc-notes pour les exécuter.

Grâce à ces étapes et aux exemples fournis, vous pouvez interagir efficacement avec le panneau de Conversation Copilot pour améliorer vos flux de travail de science des données et d’ingénieurs de données dans les blocs-notes Microsoft Fabric.

Utilisation du panneau Copilot dans la cellule et des actions rapides

Vous pouvez interagir avec Copilot directement dans vos cellules de notebook pour générer du code et effectuer des actions rapides sur vos cellules de code. Voici comment utiliser le panneau Copilot dans la cellule :

  1. Générer du code : pour générer du code pour des tâches spécifiques, vous pouvez utiliser le panneau Copilot dans la cellule. Par exemple, vous pouvez saisir votre requête dans le panneau de texte au-dessus de la cellule de code :
Can you generate code for a logistic regression that fits this data?

Copilot fournit l'extrait de code nécessaire directement dans la cellule ci-dessous.

  1. Code de correction : Vous pouvez demander Copilot à corriger les erreurs dans votre code. Tapez votre requête dans le panneau de texte au-dessus de la cellule de code et Copilot suggérez des corrections.

  2. Ajouter des commentaires : Pour documenter automatiquement votre code, utilisez la fonctionnalité « Ajouter des commentaires ». Copilot génère des commentaires qui résument le code et les modifications de données, ce qui rend votre bloc-notes plus lisible.

  3. Optimiser le code : Pour améliorer les performances, vous pouvez demander Copilot à optimiser votre code. Copilot fournit des suggestions pour améliorer l'efficacité de votre code.

  4. Expliquer le code : si vous avez besoin d’éclaircissements sur un morceau de code, demandez Copilot pour une explication. Copilot fournit une explication détaillée de la fonctionnalité du code.

Étapes pour utiliser les actions rapides

  1. Appeler Copilot dans la cellule : sélectionnez l’icône Copilot dans la barre d’outils du bloc-notes pour commencer à interagir avec Copilot.

  2. Tapez votre requête : Saisissez votre requête ou question dans le panneau de texte au-dessus de la cellule de code. Par exemple:

Explain the following code snippet.
  1. Recevoir des suggestions : Copilot répond avec le code pertinent, les correctifs, les commentaires, les optimisations ou les explications.

  2. Appliquer les suggestions : Copiez le code généré ou les suggestions de Copilot et collez-les dans les cellules de votre bloc-notes pour les exécuter.

Avec le panneau intégré à la cellule Copilot, vous pouvez générer du code, corriger les erreurs, ajouter des commentaires, optimiser les performances et mieux comprendre votre code, le tout dans vos blocs-notes Microsoft Fabric.

capture d’écran Capture d'écran montrant la génération du code de régression logistique.

Copilot pour la Science des données et l'ingénierie des données, il dispose également d'une connaissance des schémas et des métadonnées des tables Lakehouse. Copilot peut fournir des informations pertinentes dans le contexte de vos données hébergées dans un lakehouse attaché. Par exemple, vous pouvez demander :

  • « Combien de tables se trouvent dans la maison sur le lac ? »
  • « Quelles sont les colonnes de la table customers ? »

Copilot répond avec les informations pertinentes si vous avez ajouté le lakehouse au notebook. Copilot a également conscience des noms de fichiers ajoutés à n’importe quel lakehouse attaché au notebook. Vous pouvez faire référence à ces fichiers par nom dans votre conversation. Par exemple, si vous avez un fichier nommé sales.csv dans votre lakehouse, vous pouvez demander Copilot à « Créer un dataframe à partir de sales.csv ». Copilot génère le code et l’affiche dans le panneau de conversation. Avec Copilot pour les blocs-notes, vous pouvez facilement accéder à vos données et les interroger à partir de différentes sources. Vous n’avez pas besoin de la syntaxe de commande exacte pour le faire.

Copilot saisie semi-automatique du code en ligne (aperçu)

Copilot La complétion de code en ligne est une fonctionnalité basée sur l’IA qui vous permet d’écrire du code plus rapidement et plus efficacement dans les notebooks Fabric. Cette fonctionnalité fournit des suggestions de code intelligentes et contextuelles au fur et à mesure que vous tapez du code. Pour en savoir plus, Copilot consultez la saisie semi-automatique du code en ligne

Conseils

  • « Effacer » votre conversation dans le panneau de conversation Copilot avec le balai situé en haut du panneau de conversation. Copilot conserve la connaissances des entrées ou sorties pendant la session, mais cela vous aide si le contenu actuel vous distrait.
  • Utilisez la bibliothèque de magie de chat pour configurer les paramètres liés à Copilot, y compris les paramètres de confidentialité. Le mode de partage par défaut maximise le contexte auquel le partage de Copilot peut accéder. Par conséquent, limiter les informations fournies à Copilot peut avoir un impact direct et significatif sur la pertinence de ses réponses.
  • Lors de son premier lancement, Copilot propose un ensemble d’invites utiles qui peuvent vous aider à franchir les premières étapes. Ils peuvent vous aider à lancer votre conversation avec Copilot. Pour faire référence aux invites ultérieurement, vous pouvez utiliser le bouton étincelle en bas du panneau de conversation.
  • Vous pouvez « faire glisser » la barre latérale de la Copilot conversation pour développer le panneau de conversation, afficher le code plus clairement ou améliorer la lisibilité des sorties sur votre écran.

Limites

  • Les fonctionnalités de Copilot dans l’expérience de la science des données sont actuellement étendues aux notebooks. Ces fonctionnalités incluent le volet de conversation Copilot, les commandes magiques IPython qui peuvent être utilisées dans une cellule de code et les suggestions de code automatiques lorsque vous tapez une cellule de code. Copilot peut également lire des modèles sémantiques Power BI grâce à une intégration de lien sémantique.

  • Si votre locataire est configuré avec un lien privé, l’expérience Copilot de conversation (chat sidecar) ne fonctionnera pas. CopilotLes suggestions de code inline et les actions rapides peuvent toujours fonctionner, mais les interactions de chat ne parviennent pas à se charger.

  • Copilot a deux utilisations principales prévues :

    • Vous pouvez demander à Copilot d’examiner et d’analyser des données dans votre notebook (par exemple, en chargeant d’abord un DataFrame, puis en demandant Copilot sur les données à l’intérieur du DataFrame).
    • Vous pouvez demander à Copilot de générer une gamme de suggestions sur votre processus d'analyse de données - par exemple, quels modèles prédictifs pourraient être pertinents, du code pour effectuer différents types d'analyse de données et de la documentation pour un bloc-notes terminé.
  • La génération de code avec des bibliothèques à évolution rapide ou récemment publiées peut inclure des inexactitudes ou des fabrications.

Suppression et exportation de données

Copilot dans les notebooks fournit aux utilisateurs deux commandes essentielles pour gérer l'historique des discussions dans les cellules du notebook : show_chat_history et clear_chat_history. La commande show_chat_history exporte l'historique complet des conversations à des fins de conformité, afin de garantir que toutes les interactions nécessaires sont documentées et accessibles pour examen. Par exemple, l’exécution de show_chat_history génère un journal complet de l’historique des conversations, qui peut ensuite être examiné ou archivé pour des raisons de conformité.

La commande clear_chat_history supprime toutes les conversations précédentes du bloc-notes, afin que l'utilisateur puisse repartir à zéro. Cette commande efface les anciennes interactions pour démarrer un nouveau fil de conversation. Par exemple, l’exécution de clear_chat_history supprime l’historique des conversations précédentes pour laisser le bloc-notes libre de toutes les conversations passées. Ces fonctionnalités améliorent la fonctionnalité globale et l’expérience utilisateur des Copilot dans les notebooks.