Partager via


Démarrer avec Azure Data Factory

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, la business intelligence et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Bienvenue dans Azure Data Factory ! Cet article vous aide à créer votre première fabrique de données et votre pipeline dans les cinq minutes.

Le modèle Azure Resource Manager (modèle ARM) dans cet article crée et configure tout ce dont vous avez besoin. Vous pouvez ensuite accéder à votre fabrique de données de démonstration et déclencher le pipeline, ce qui déplace certains exemples de données d’un dossier Stockage Blob Azure vers un autre.

Prérequis

Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.

Résumé vidéo

La vidéo suivante propose un guide étape par étape de l’exemple dans cet article :

Étape 1 : Utiliser la démonstration pour créer des ressources

Dans ce scénario de démonstration, vous utilisez l’activité de copie dans une fabrique de données pour copier un objet blob nommé moviesDB2.csv à partir d’un dossier d’entrée dans Stockage Blob Azure vers un dossier de sortie. Dans un scénario réel, cette opération de copie peut être entre l’une des nombreuses sources de données et récepteurs pris en charge disponibles dans le service. Elle peut également impliquer des transformations de données.

  1. Sélectionnez le bouton suivant.

    Essayer votre première fabrique de données de démonstration

    La sélection du bouton crée les ressources Azure suivantes :

    • Un compte Azure Data Factory
    • Une fabrique de données qui contient un pipeline avec une activité Copy
    • Un compte de Stockage Blob Azure avec moviesDB2.csv chargé dans un dossier d’entrée en tant que source
    • Un service lié pour connecter l'usine de données au stockage Blob
  2. Vous êtes dirigé vers la page de configuration pour déployer le modèle. Sur cette page :

    1. Pour le groupe de ressources, sélectionnez Créer nouveau pour créer un groupe de ressources. Vous pouvez conserver toutes les autres valeurs avec leurs valeurs par défaut.

    2. Sélectionnez Vérifier + créer, puis créer pour déployer les ressources.

    Capture d’écran de la page pour le déploiement d’un modèle pour la création de ressources.

Remarque

L’utilisateur qui déploie le modèle doit attribuer un rôle à une identité managée. Cette étape nécessite des autorisations qui peuvent être accordées via le rôle Propriétaire, Administrateur de l’accès utilisateur ou Opérateur d’identité managée.

Toutes les ressources de cette démonstration sont créées dans le nouveau groupe de ressources. Vous pouvez donc les nettoyer facilement ultérieurement.

Étape 2 : Vérifier les ressources déployées

  1. Dans le message montrant la réussite de votre déploiement, sélectionnez Accéder au groupe de ressources.

    Capture d’écran de la page du portail Azure montrant le déploiement réussi du modèle de démonstration.

  2. Le groupe de ressources inclut la nouvelle fabrique de données, le compte de stockage Blob et l’identité gérée créée par le déploiement. Sélectionnez la fabrique de données dans le groupe de ressources pour la voir.

    Capture d’écran du contenu du groupe de ressources créé pour la démonstration, avec l'usine de données mise en surbrillance.

  3. Sélectionnez le bouton Launch Studio .

    Capture d’écran du portail Azure montrant les détails de la fabrique de données nouvellement créée, avec le bouton permettant d’ouvrir Azure Data Factory Studio mis en surbrillance.

  4. Dans Azure Data Factory Studio :

    1. Sélectionnez .Author tab
    2. Sélectionnez le pipeline que le modèle a créé.
    3. Vérifiez les données sources en sélectionnant Ouvrir.

    Capture d’écran d’Azure Data Factory Studio montrant le pipeline créé par le modèle.

  5. Dans le jeu de données source, sélectionnez Parcourir pour afficher le fichier d’entrée créé pour la démonstration.

    Capture d’écran du jeu de données source, avec le bouton Parcourir mis en surbrillance.

    Notez le fichier moviesDB2.csv, qui a déjà été chargé dans le dossier d’entrée.

    Capture d’écran du contenu du dossier d’entrée, montrant le fichier d’entrée utilisé dans la démonstration.

Étape 3 : Déclencher le pipeline de démonstration à exécuter

  1. Sélectionnez Ajouter un déclencheur, puis sélectionnez Déclencheur maintenant.

    Capture d’écran du bouton permettant de déclencher l’exécution du pipeline de démonstration.

  2. Dans le volet droit, sous Pipeline run, sélectionnez OK.

Surveiller le pipeline

  1. Sélectionnez l’onglet MoniteurOnglet Moniteur. Cet onglet fournit une vue d’ensemble de vos exécutions de pipeline, y compris l’heure de début et l’état.

    Capture d’écran de l’onglet permettant de surveiller l’exécution du pipeline dans une fabrique de données.

  2. Dans ce guide de démarrage rapide, le pipeline a un seul type d’activité : Copier des données. Sélectionnez le nom du pipeline pour afficher les détails des résultats de l’exécution de l’activité de copie.

    Capture d’écran des résultats d’exécution d’une activité de copie sur l’onglet de surveillance d’une usine de données.

  3. Sélectionnez l’icône Détails pour afficher le processus de copie détaillé. Dans les résultats, les tailles de données lues et de données écrites sont identiques, et un fichier a été lu et écrit. Ces informations prouvent que toutes les données ont été correctement copiées dans la destination.

    Capture d’écran des résultats d’exécution détaillés pour une activité de copie.

Nettoyer les ressources

Vous pouvez nettoyer toutes les ressources que vous avez créées dans cet article de deux façons :

  • Vous pouvez supprimer tout le groupe de ressources Azure qui comprend toutes les ressources qui y ont été créées.

  • Si vous souhaitez conserver certaines ressources intactes, accédez au groupe de ressources et supprimez uniquement les ressources spécifiques que vous souhaitez supprimer.

    Par exemple, si vous utilisez ce modèle pour créer une fabrique de données utilisée dans un autre tutoriel, vous pouvez supprimer les autres ressources et garder uniquement la fabrique de données.

Dans cet article, vous avez créé une fabrique de données qui contenait un pipeline avec une activité Copy. Pour en savoir plus sur Azure Data Factory, passez à l’article et au module de formation suivants :