Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Esta característica se encuentra en su versión beta. Los administradores del área de trabajo pueden controlar el acceso a esta característica desde la página Vistas previas . Consulte Administración de versiones preliminares de Azure Databricks.
Use la tarea de la plataforma dbt para organizar y supervisar los trabajos existentes de la plataforma dbt directamente desde Azure Databricks. En esta página se explica cómo seleccionar y desencadenar trabajos de dbt, establecer opciones de reintento automático para errores y supervisar ejecuciones.
Diferencias entre la plataforma dbt y las tareas de dbt
En la plataforma Jobs, se ofrecen dos tipos de tareas para proyectos de dbt. Elija la correcta en función de dónde se administre el proyecto de dbt:
tarea de la plataforma dbt: úselo para orquestar trabajos de plataforma dbt preexistentes. Se conecta a la API de la plataforma dbt y desencadena una ejecución allí. Elija esta opción si quiere centralizar la orquestación en Azure Databricks mientras conserva todas las ventajas de la plataforma dbt, como la supervisión y la programación.
tarea dbt: úselo para ejecutar proyectos principales de dbt en un clúster de Azure Databricks con código de Git. Elija esto si necesita un control total sobre el entorno de ejecución y prefiere administrar las dependencias completamente dentro de Azure Databricks. Consulte tarea dbt para trabajos.
Prerrequisitos
Para usar la tarea de la plataforma dbt, debe cumplir los siguientes requisitos previos:
- Un administrador del área de trabajo debe habilitar la versión preliminar. Consulte Administración de versiones preliminares de Azure Databricks.
- Debe tener
CREATE CONNECTIONprivilegios en los metadatos del Catálogo Unity en su área de trabajo. - Acceso a un proyecto de dbt existente con un trabajo definido en la plataforma dbt. Para más información, consulte Trabajos en la plataforma dbt en la documentación de dbt.
- Permisos para generar un token de servicio en la plataforma dbt. Para más información, consulte Tokens de cuenta de servicio.
Nota:
Para la estabilidad operativa y de seguridad, Databricks recomienda generar un token de cuenta de servicio, no un token de acceso personal. Los tokens de cuenta de servicio no están vinculados a un usuario individual y se pueden limitar fácilmente para proporcionar los permisos mínimos necesarios.
Recopilación de detalles de la plataforma dbt
Para integrar dbt con Azure Databricks, necesita los tres detalles siguientes:
- Identificador de la cuenta de la plataforma dbt.
- Clave de API generada en la plataforma dbt.
- Dirección URL del host de implementación de la plataforma dbt.
En las secciones siguientes se describe cómo encontrar esta información necesaria.
Obtenga el identificador de la cuenta:
Para recuperar el identificador de la cuenta:
- Inicie sesión en la plataforma dbt.
- Vaya a Configuración>de la cuenta.
- Obtenga el identificador de cuenta del sufijo de dirección URL, que tiene el formato siguiente:
https://cloud.getdbt.com/settings/accounts/{account_id}.
Obtención de la clave de API
Para recuperar la clave de API:
- Inicie sesión en la plataforma dbt.
- Vaya a Configuración>Configuración de Perfil>Tu Perfil>Acceso a la API>Clave de API.
URL del host
La dirección URL del host depende de la ubicación y del inquilino. Consulte Acceso, regiones y direcciones IP en la documentación de dbt para encontrar la dirección URL de su región.
Identifique su región y el tipo de alojamiento (multiarrendamiento o basado en celular). Use la columna Dirección URL de acceso para obtener la dirección URL del host.
| Tipo de inquilino | Ejemplo de región | Ejemplo de dirección URL de host |
|---|---|---|
| Multiinquilino | América del Norte | https://cloud.getdbt.com |
| Basado en celdas | Norteamérica (us-east-1) |
https://12345.us1.dbt.com (con 12345 como id. de cuenta) |
configuración de conexión de la plataforma dbt
Siga estos pasos para configurar la conexión de la plataforma dbt en Azure Databricks.
- Haga clic en
Catálogo en la barra lateral.
- Haga clic en
El icono de signo más en el explorador de esquemas. A continuación, haga clic en Crear una conexión. Se abre el formulario Configurar conexión .
- Escriba la siguiente información y haga clic en Siguiente:
- En Nombre de conexión, escriba un nombre.
- En Tipo de conexión, elija plataforma dbt.
- Escriba la dirección URL del host de la plataforma dbt en el campo Texto del host . No incluya una barra diagonal final (
/). - Escriba el identificador de cuenta de la plataforma dbt y el token de API que recopiló en un paso anterior.
- Haga clic en Crear conexión para confirmar los detalles de la conexión.
- (Opcional) Conceda a otros usuarios privilegios para usar la conexión:
- Elija las ID de usuario y los grupos a los que desea conceder privilegios en el menú desplegable Principales.
- Seleccione los privilegios que desea conceder.
- Haga clic en Confirmar.
Crea un nuevo trabajo con una tarea de plataforma dbt
- En el área de trabajo, haga clic en
Trabajos y canalizaciones en la barra lateral.
- Haga clic en Crear y, a continuación, en Trabajo. El nuevo trabajo se nombra automáticamente con una marca de tiempo asociada.
- (Opcional) Haga clic en el nombre del trabajo y escriba un nombre nuevo para editarlo.
- Haga clic en Agregar otro tipo de tarea. Busque la plataforma dbt y haga clic en el icono para seleccionarlo.
- Escriba un Nombre de tarea.
- Utilice el menú desplegable de conexión a la plataforma dbt para seleccionar la conexión creada anteriormente.
- Use el menú desplegable trabajo de la plataforma dbt para seleccionar el trabajo de la plataforma dbt que desea organizar.
- Haga clic en Guardar tarea.
- (Opcional) Haga clic en Ejecutar ahora para probar manualmente el trabajo.
Establecer una programación o un desencadenador
Puede configurar trabajos para que se desencadenen automáticamente según una programación basada en el tiempo o la llegada de nuevos datos. Para obtener más información sobre las opciones disponibles, consulte Automatización de trabajos con programaciones y desencadenadores.
Nota:
No se admiten desencadenadores continuos para los trabajos de la plataforma dbt.
Monitoreo de procesos
Puede supervisar los trabajos de Lakeflow en la interfaz de usuario de Azure Databricks. En el caso de los trabajos de la plataforma dbt, también puede abrir un vínculo que apunte a los detalles de ejecución del trabajo en la plataforma dbt.
Para supervisar una ejecución:
Haga clic en Trabajos y canalizaciones en la barra lateral del área de trabajo.
(Opcional) Seleccione los filtros Trabajos y Propiedad de mí .
Haga clic en el vínculo Nombre del trabajo.
Aparece la pestaña Ejecuciones , en la que se muestran las vistas de matriz y lista de ejecuciones activas y completadas.
Haga clic en el vínculo de la ejecución en la columna Hora de inicio de la vista de lista de ejecuciones. Se abre el estado del trabajo de la plataforma dbt.
Haga clic en Ver en dbt para ver los detalles de ejecución del trabajo en la plataforma dbt.