Partager via


Charger des exemples de données dans Data Warehouse

Dans ce tutoriel, vous créez un pipeline pour déplacer un jeu de données d'exemple vers l’entrepôt de données. Cette expérience vous montre une démonstration rapide sur l’utilisation de l’activité de copie de pipeline et sur le chargement de données dans Data Warehouse.

Prérequis

Pour commencer, vous devez remplir les conditions préalables suivantes :

  • Un compte de locataire Microsoft Fabric avec un abonnement actif. Créez un compte gratuitement.
  • Vérifiez que vous disposez d’un espace de travail avec Microsoft Fabric : Créer un espace de travail.
  • Vérifiez que vous avez déjà créé un Data Warehouse. Pour le créer, reportez-vous à Créer un Data Warehouse

Créer une chaîne de traitement

  1. Accédez à Power BI.

  2. Sélectionnez l’icône Power BI en bas à gauche de l’écran, puis sélectionnez Fabric pour ouvrir la page d’accueil de Data Factory.

  3. Accédez à votre espace de travail Microsoft Fabric. Si vous avez créé un espace de travail dans la section Prérequis précédente, utilisez celui-ci.

    Capture d’écran de la fenêtre Espaces de travail à partir de laquelle vous accédez à votre espace de travail.

  4. Sélectionnez + Nouvel élément.

  5. Recherchez et sélectionnez Pipeline , puis entrez un nom de pipeline pour créer un pipeline. pour créer un pipeline.

    Capture d’écran montrant le bouton nouveau pipeline dans l’espace de travail nouvellement créé.

    Capture d’écran du nom du pipeline en cours de création.

Copier des données à l’aide d’un pipeline

Dans cette session, vous commencez à générer votre pipeline en suivant les étapes ci-dessous sur la copie à partir d’un exemple de jeu de données fourni par le pipeline dans Data Warehouse.

Étape 1 : commencer par l’assistant de copie

  1. Sélectionnez l’Assistant Copier des données sur le canevas pour ouvrir l’outil Assistant copie pour commencer. Vous pouvez également sélectionner Utiliser l’Assistant Copier des données dans la liste déroulante Copier des données sous l’onglet Activités du ruban.

    Capture d'écran montrant le bouton Copier les données sur un nouveau pipeline.

Étape 2 : configurer votre source

  1. Choisissez nyC Taxi - Vert dans les options d’exemples de données de votre source de données.

    Capture d’écran montrant la sélection de l'exemple de données

  2. Dans la section Se connecter à la source de données de l’assistant Copier des données, un aperçu des données d’échantillon NYC Taxi - Green s’affiche. Sélectionnez Suivant pour passer à la destination des données.

    Capture d'écran montrant un aperçu de l'échantillon de données Bing COVID-19.

Étape 3 : configurer votre destination

  1. Sélectionnez l’onglet OneLake et choisissez un entrepôt existant.

    Capture d’écran montrant la sélection de la destination de l’entrepôt.

  2. Configurez et mappez vos données sources à la table de l’entrepôt de destination en entrant Table, puis sélectionnez Suivant une fois de plus.

    Capture d’écran montrant le nom de la table à créer dans la destination de l’entrepôt.

  3. Configurez d’autres paramètres sur la page Paramètres. Dans ce tutoriel, sélectionnez Suivant directement, car vous n’avez pas besoin d’utiliser la commande de mise en lots et de copie.

    Capture d'écran des paramètres de destination.

Étape 4 : Vérifier et exécuter votre activité de copie

  1. Passez en revue les paramètres de votre activité de copie dans les étapes précédentes, puis sélectionnez Enregistrer + Exécuter pour démarrer l’activité. Vous pouvez également revenir sur les étapes précédentes de l’outil pour modifier vos paramètres, si nécessaire.

    Capture d’écran de la page Vérifier + créer de l’assistant de copie de données avec la source et la destination mises en évidence.

  2. L’activité Copy est ajoutée à votre nouvelle interface de pipeline. Tous les paramètres, y compris les paramètres avancés pour l’activité, sont disponibles dans les onglets situés sous le canevas du pipeline lorsque l’activité Copier les données créée est sélectionnée.

    Capture d’écran montrant l’activité de copie terminée dans l’interface du pipeline.

Planifier votre pipeline

  1. Vous pouvez superviser le processus en cours d’exécution, puis vérifier les résultats sous l’onglet Sortie sous le canevas du pipeline. Sélectionnez le bouton Détails de l’exécution (avec l’icône de lunettes mise en surbrillance) pour afficher les détails de l’exécution.

    Capture d’écran de l’onglet Sortie de l’exécution de pipeline en cours avec le bouton Détails mis en évidence dans l’état de l’exécution.

  2. Les détails de l’exécution indiquent la quantité de données lues et écrites, ainsi que divers autres détails sur l’exécution.

    Capture d’écran de la fenêtre Détails de l’exécution.

  3. Vous pouvez également planifier l’exécution du pipeline avec une fréquence spécifique si nécessaire. Voici un exemple de planification de l’exécution du pipeline toutes les 15 minutes. Vous pouvez également spécifier l’heure de début et l’heure de fin de votre planification. Si vous ne spécifiez pas d’heure de début, elle correspond à l’heure à laquelle votre planification s’applique. Si vous ne spécifiez pas d’heure de fin, l’exécution de votre pipeline reste récurrente toutes les 15 minutes.

    Capture d’écran de la boîte de dialogue Planifier pour le pipeline avec une planification périodique de 15 minutes.

Cet exemple vous montre comment charger des exemples de données dans un entrepôt de données à l’aide de Data Factory dans Microsoft Fabric. Vous avez appris à :

  • Créez un pipeline.
  • Copiez des données à l’aide de votre pipeline.
  • Exécutez et planifiez votre pipeline.

Ensuite, avancez pour en savoir plus sur la surveillance des exécutions de votre pipeline.