Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Obtenga una vista previa de la ingesta de tareas de instalación de origen de SQL Server en Azure Databricks mediante Lakeflow Connect.
Seguimiento de cambios frente a captura de datos modificados
El seguimiento de cambios y la captura de datos modificados (CDC) permiten a Databricks realizar un seguimiento de los cambios en las tablas de origen. Databricks recomienda usar el seguimiento de cambios para cualquier tabla que tenga una clave principal para minimizar la carga en la base de datos de origen. Si el seguimiento de cambios y CDC están habilitados, el conector de SQL Server usa el seguimiento de cambios.
| Método | Description |
|---|---|
| Change Tracking | Captura el hecho de que las filas de una tabla han cambiado, pero no captura las operaciones reales. El seguimiento de cambios requiere que una tabla tenga una clave principal, pero es un proceso ligero que no tiene un gran impacto en la base de datos de origen. |
| captura de datos modificados | Captura todas las operaciones de una tabla y contiene una vista histórica de los cambios realizados a lo largo del tiempo. CDC no requiere que una tabla tenga una clave principal, pero puede tener más impacto en el rendimiento de la base de datos de origen. |
Para obtener más información sobre estas opciones, consulte Seguimiento de los cambios de datos (SQL Server) en la documentación de SQL Server.
Información general sobre las tareas de configuración de origen
Debe completar las siguientes tareas en SQL Server antes de ingerir datos en Azure Databricks:
Compruebe que cumple los requisitos de la versión de SQL Server:
- Para usar el seguimiento de cambios, debe tener SQL Server 2012 o superior.
- Para usar CDC, debe tener el paquete de actualización acumulativa 3 (CU3) de SQL Server 2012 Service Pack 1 (SP1) o superior. Para las versiones anteriores a SQL Server 2016, también se requiere Enterprise Edition.
Configure las opciones de firewall, si es necesario.
Cree un usuario de base de datos en SQL Server dedicado a la ingesta de Databricks y cumpla los requisitos de privilegios.
Configure la base de datos de origen, incluida la administración de permisos, la habilitación del seguimiento de cambios y la habilitación CDC. Consulte Preparar SQL Server para la ingestión usando el script de objetos de utilidad.