Partager via


Ingérer des données dans votre entrepôt à l’aide de pipelines

S'applique à : ✅ Entrepôt dans Microsoft Fabric

Dans cet article, vous allez apprendre à utiliser l’activité de travail de copie dans les pipelines Data Factory.

  • Les pipelines offrent une alternative à l’utilisation de la commande COPY via une interface utilisateur graphique.
  • Un pipeline est un regroupement logique d’activités qui effectuent ensemble une tâche d’ingestion de données.
  • Les pipelines vous permettent de gérer toutes les activités d’extraction, de transformation et de chargement (ETL) au lieu de gérer chacune individuellement.

Remarque

Certaines fonctionnalités d’Azure Data Factory ne sont pas disponibles dans Microsoft Fabric. Toutefois, les concepts sont interchangeables. Vous pouvez en savoir plus sur Azure Data Factory et les pipelines dans pipelines et activités dans Azure Data Factory et Azure Synapse Analytics. Pour obtenir un guide de démarrage rapide, consultez Démarrage rapide : Créer votre premier pipeline pour copier des données.

Créer un travail de copie

Pour créer une nouvelle tâche de copie, procédez comme suit.

  1. Dans l’écran d’accueil de votre espace de travail, sélectionnez le bouton + Nouvel élément . Dans la section Obtenir des données , sélectionnez Copier le travail.

  2. Dans la boîte de dialogue Nouvelle tâche de copie , entrez un nom pour votre nouveau pipeline, puis sélectionnez Créer. La nouvelle fenêtre copie de la tâche s’ouvre.

  3. Choisissez votre source de données dans le catalogue OneLake.

  4. Dans la page Choisir des données , affichez un aperçu du jeu de données sélectionné. Après avoir examiné les données, sélectionnez Suivant.

  5. Dans la page Choisir la destination des données , sélectionnez votre entrepôt souhaité dans le catalogue OneLake.

  6. La page Choisir un mode de travail de copie vous permet de configurer la façon dont vous souhaitez que les données soient copiées : une copie complète ou des copies incrémentielles qui effectuent uniquement des copies ultérieures lorsque les données sources changent.

    Pour l’instant, sélectionnez Copie complète. Pour d’autres sources de données et scénarios, vous pouvez charger de manière incrémentielle des données à mesure que la source de données est mise à jour.

  7. Vous pouvez ajuster les tables de destination avec le nom de votre schéma de destination souhaité et le nom de la table. Fournissez des noms de schéma et de table qui correspondent à votre convention d’affectation de noms souhaitée. Lorsque vous avez terminé d’apporter des modifications, sélectionnez Suivant.

    Capture d’écran de la page Carte vers la destination de la fenêtre de la Tâche de copie. La destination est dbo.NYC_taxi.

  8. Si vous le souhaitez, pour modifier les mappages de colonnes, sélectionnez Modifier le mappage de colonne. Vous pouvez mapper les noms de colonnes source à de nouveaux noms, types de données, ou ignorer les colonnes sources.

    Capture d’écran des options de chargement de données dans une table existante ou de création d’une table.

    Lorsque vous avez terminé d’examiner les mappages de colonnes, sélectionnez Suivant.

  9. La page Révision + enregistrement est un résumé du nouveau travail de copie.

    Passez en revue le résumé et les options, puis sélectionnez Enregistrer + Exécuter.

  10. Vous êtes dirigé vers la zone de canevas du pipeline, où une nouvelle activité de travail de copie avec sa source et sa destination est déjà configurée pour vous. Si vous avez sélectionné Démarrer le transfert de données immédiatement sur la page précédente, le travail de copie démarre dès qu’il est prêt à s’exécuter.

  11. Vous pouvez surveiller l’état de votre pipeline dans le volet Résultats .

  12. Après quelques secondes, votre pipeline se termine. Lorsque vous revenez à votre entrepôt, vous pouvez sélectionner votre table pour afficher un aperçu des données et confirmer que l’opération de copie s’est terminée.

Étape suivante

Options d’ingestion des données

Voici d’autres façons d’ingérer des données dans votre entrepôt :