Partager via


Se connecter à Matillion Data Productivity Cloud

Matillion Data Productivity Cloud est un outil ETL/ELT conçu spécifiquement pour les plateformes de base de données cloud, notamment Azure Databricks. Matillion Data Productivity Cloud dispose d’une interface utilisateur moderne basée sur un navigateur, avec des fonctionnalités ETL/ELT puissantes et poussées.

Vous pouvez intégrer vos entrepôts Databricks SQL (anciennement points de terminaison Databricks SQL) et vos clusters Azure Databricks avec Matillion.

Se connecter à Matillion l’aide de Partner Connect

Cette section décrit comment utiliser Partner Connect pour simplifier le processus de connexion d’un entrepôt SQL ou d’un cluster existant dans votre espace de travail Azure Databricks à Matillion.

Exigences

Consultez la configuration requise pour l’utilisation de Partner Connect.

Étapes de connexion

Pour vous connecter à Matillion à l’aide de Partner Connect, suivez les étapes décrites dans cette section.

  1. Dans la barre latérale, cliquez sur l’icône Icône Place de marchéPlace de marché.

  2. Dans les intégrations Partner Connect, cliquez sur Afficher tout.

  3. Cliquez sur la vignette Matillion Data Productivity Cloud .

  4. Sélectionnez un catalogue Azure Databricks pour que Matillion puisse écrire, puis cliquez sur Suivant.

  5. Sélectionnez un entrepôt SQL Databricks existant à utiliser avec Matillion. Cette ressource de calcul est utilisée pour exécuter vos pipelines.

  6. Choisissez le schéma Matillion à utiliser pour créer et gérer vos pipelines de données. Cliquez sur Ajouter.

  7. Cliquez sur Suivant.

  8. Passez en revue vos informations de connexion, puis cliquez sur Suivant.

  9. Passez en revue et acceptez les conditions générales d’utilisation de Partner Connect, puis cliquez sur Se connecter à Matillion Data Productivity Cloud.

  10. La page Matillion Data Productivity Cloud se charge. Suivez les instructions à l’écran pour créer votre compte d’essai de 14 jours ou connectez-vous à votre compte Matillion existant.

    Matillion peut prendre quelques minutes pour créer l’infrastructure nécessaire et se connecter en toute sécurité à votre environnement Azure Databricks.

  11. Une fois que Matillion a terminé le processus d’installation, le Designer se charge.

    Notes

    Si vous n’êtes pas sur la page Concepteur, revenez à Azure Databricks et reconnectez-vous à Matillion.

Démarrer avec Matillion

Une fois l’installation terminée, vous atterrissez dans le Concepteur où vous pouvez commencer à créer des pipelines de données. Les pipelines sont le mode de conception, d’organisation et d’exécution des flux de travail dans le cloud de productivité des données.

Pour vous assurer que votre espace de travail Azure Databricks est connecté à Matillion, recherchez les éléments suivants :

  • Projet par défaut avec le logo Azure Databricks en haut à gauche.
  • Votre environnement est nommé à l’aide de la terminologie Azure Databricks.
  • Si vous cliquez sur Schémas en haut à gauche, un panneau s’ouvre et affiche votre schéma sélectionné dans Azure Databricks, ainsi que toutes les tables et vues.

Explorez le contenu du schéma pour vérifier que Matillion est correctement connecté à votre espace de travail Databricks.

Après avoir vérifié que vous êtes connecté à Azure Databricks, commencez à créer des pipelines sur Matillion :

  • Créez votre premier pipeline d’orchestration pour déplacer des données vers Azure Databricks à partir de sources.
  • Créez votre premier pipeline de transformation pour mettre en forme, nettoyer et préparer des données qui existent déjà directement dans Azure Databricks.
  • Utilisez le Concepteur visuel pour créer des flux de travail de données à l’aide d’une interface de canevas glisser-déplacer.

Étapes suivantes

Explorez une ou plusieurs des ressources suivantes sur le site web de Matillion :