Compartir a través de


Conexión a Matillion Data Productivity Cloud

Matillion Data Productivity Cloud es una herramienta ETL/ELT creada específicamente para plataformas de base de datos en la nube, como Azure Databricks. Matillion Data Productivity Cloud tiene una interfaz de usuario moderna basada en explorador, con una potente funcionalidad ETL/ELT de inserción.

Con Matillion, puede integrar los almacenes de Databricks SQL (anteriormente conocidos como puntos de conexión de Databricks SQL) y los clústeres de Azure Databricks.

Conexión a Matillion mediante Partner Connect

En esta sección se describe el uso de Partner Connect para simplificar el proceso de conexión de un almacén o clúster de SQL existente en el área de trabajo de Azure Databricks a Matillion.

Requisitos

Consulte los requisitos para usar Partner Connect.

Pasos para establecer la conexión

Para conectarse a Matillion mediante Partner Connect, siga los pasos de esta sección.

  1. En la barra lateral, haz clic en Icono de MarketplaceMarketplace.

  2. En Integraciones de Partner Connect, haz clic en Ver todos.

  3. Haga clic en el icono Matillion Data Productivity Cloud .

  4. Seleccione un catálogo de Azure Databricks para que Matillion escriba en y haga clic en Siguiente.

  5. Seleccione una instancia de Databricks SQL Warehouse existente para usarla con Matillion. Este recurso de cómputo se usa para ejecutar tus canalizaciones.

  6. Elija el esquema que Debe usar Matillion para crear y administrar las canalizaciones de datos. Haga clic en Agregar.

  7. Haga clic en Siguiente.

  8. Revise la información de conexión y haga clic en Siguiente.

  9. Revise y acepte los términos y condiciones para usar Partner Connect y haga clic en Conectar a Matillion Data Productivity Cloud.

  10. Se carga la página Matillion Data Productivity Cloud. Complete las instrucciones en pantalla para crear su cuenta de prueba de 14 días o iniciar sesión en su cuenta de Matillion existente.

    Matillion puede tardar unos minutos en crear la infraestructura necesaria y conectarse de forma segura al entorno de Azure Databricks.

  11. Después de que Matillion complete el proceso de configuración, el Diseñador se carga.

    Nota:

    Si no está en la página Diseñador, vuelva a Azure Databricks e inicie sesión en Matillion de nuevo.

Introducción a Matillion

Una vez completada la configuración, llegará al Diseñador, donde puede empezar a crear canalizaciones de datos. Las canalizaciones son la forma de diseñar, organizar y ejecutar flujos de trabajo de Data Productivity Cloud.

Para asegurarse de que el área de trabajo de Azure Databricks está conectada a Matillion, busque lo siguiente:

  • Un proyecto predeterminado con el logotipo de Azure Databricks en la parte superior izquierda.
  • El entorno se denomina mediante la terminología de Azure Databricks.
  • Si hace clic en Esquemas en la esquina superior izquierda, se abre un panel y muestra el esquema seleccionado en Azure Databricks, junto con las tablas y vistas.

Explore el contenido del esquema para confirmar que Matillion está conectado correctamente al área de trabajo de Databricks.

Después de comprobar que está conectado a Azure Databricks, empiece a crear canalizaciones en Matillion:

  • Cree su primera canalización de orquestación para mover datos a Azure Databricks desde diversas fuentes.
  • Cree la primera canalización de transformación para dar forma, limpiar y preparar los datos que ya existen directamente en Azure Databricks.
  • Use el Diseñador visual para crear flujos de trabajo de datos mediante una interfaz de lienzo de arrastrar y colocar.

Pasos siguientes

Explore uno o varios de los siguientes recursos en el sitio web de Matillion: