Partager via


Explorer les données de votre base de données mise en miroir avec des notebooks

Vous pouvez explorer les données répliquées à partir de votre base de données mise en miroir avec des requêtes Spark dans des notebooks.

Les notebooks sont un élément de code puissant pour vous permettre de développer des travaux Apache Spark et des expériences de Machine Learning sur vos données. Vous pouvez utiliser des blocs-notes dans Fabric Lakehouse pour explorer vos tables mises en miroir.

Prerequisites

Créer un raccourci

Vous devez d’abord créer un raccourci à partir de vos tables mises en miroir dans Lakehouse, puis créer des notebooks avec des requêtes Spark dans votre Lakehouse.

  1. Dans le portail Fabric, ouvrez Data Engineering.

  2. Si vous n’avez pas encore créé de Lakehouse, sélectionnez Lakehouse et créez un lakehouse en lui donnant un nom.

  3. Sélectionnez Obtenir des données ->Nouveau raccourci.

  4. Sélectionnez Microsoft OneLake.

  5. Vous pouvez voir toutes vos bases de données mises en miroir dans l’espace de travail Fabric.

  6. Sélectionnez la base de données mise en miroir que vous souhaitez ajouter à votre Lakehouse, sous forme de raccourci.

  7. Sélectionnez les tables souhaitées dans la base de données mise en miroir.

  8. Sélectionnez Suivant, puis Créer.

  9. Dans l’Explorateur, vous pouvez maintenant voir les données de table sélectionnées dans votre Lakehouse. Capture d’écran du portail Fabric montrant l’Explorateur Lakehouse affichant les tables et données de base de données mises en miroir.

    Conseil / Astuce

    Vous pouvez ajouter d’autres données directement dans Lakehouse ou apporter des raccourcis tels que S3, ADLS Gen2. Vous pouvez accéder au point de terminaison d’analytique SQL du Lakehouse et joindre les données à toutes ces sources avec des données mises en miroir en toute transparence.

  10. Pour explorer ces données dans Spark, sélectionnez les ... points en regard de n’importe quelle table. Sélectionnez Nouveau bloc-notes ou bloc-notes existant pour commencer l’analyse. Capture d’écran du portail Fabric montrant le menu contextuel pour ouvrir une table de base de données mise en miroir dans un bloc-notes.

  11. Le notebook s’ouvre automatiquement et charge le dataframe avec une SELECT ... LIMIT 1000 requête Spark SQL.

    • Les nouveaux blocs-notes peuvent prendre jusqu’à deux minutes pour charger complètement. Vous pouvez éviter ce délai à l’aide d’un notebook existant avec une session active. Capture d’écran du portail Fabric montrant les données d’une table de base de données mise en miroir dans un nouveau notebook avec une requête Spark SQL.