Compartir a través de


Federación de Lakehouse para el uso compartido de archivos de Salesforce Data 360

En esta página se describe cómo leer datos en Salesforce Data 360 (anteriormente Data Cloud) mediante el conector de uso compartido de archivos.

¿Qué conector de Salesforce debo usar?

Databricks ofrece varios conectores para Salesforce. Hay dos conectores de copia cero: el conector de uso compartido de archivos de Salesforce Data 360 y el conector de federación de consultas de Salesforce Data 360. Estos le permiten consultar datos en Salesforce Data 360 sin moverlos. También hay un conector de ingesta de Salesforce que copia datos de varios productos de Salesforce.

En la tabla siguiente se resumen las diferencias entre los conectores de Salesforce en Databricks:

Conector Caso de uso Productos de Salesforce compatibles
Uso compartido de archivos de Salesforce Data 360 Cuando se usa el conector de uso compartido de archivos de Salesforce Data 360 en la Federación de Lakehouse, Databricks llama directamente a las API de Salesforce Data-as-a-Service (DaaS) para leer datos en una ubicación de almacenamiento de objetos en la nube subyacente. Las consultas se ejecutan en el proceso de Databricks sin usar el protocolo JDBC.
En comparación con la federación de consultas, el uso compartido de archivos es ideal para federar una gran cantidad de datos. Ofrece un rendimiento mejorado para leer archivos de varios orígenes de datos y mejoradas las capacidades de pushdown. Consulte Federación de Lakehouse para la compartición de archivos de Salesforce Data 360.
Datos de Salesforce 360
Federación de consultas de Salesforce Data 360 Cuando se usa el conector de federación de consultas de Salesforce Data 360 en Lakehouse Federation, Databricks utiliza JDBC para conectarse a los datos de origen y empuja las consultas en Salesforce. Consulte Ejecución de consultas federadas en Salesforce Data 360. Datos de Salesforce 360
Integración de Salesforce El conector de ingesta de Salesforce en Lakeflow Connect permite crear canalizaciones de ingesta totalmente administradas a partir de datos de Salesforce Platform. Este conector maximiza el valor aprovechando no solo los datos de CDP, sino también los datos de CRM en la Plataforma de inteligencia de datos. Consulte Ingesta de datos de Salesforce. Consulte ¿Qué productos de Salesforce admite el conector de ingesta de Salesforce?

Antes de empezar

Requisitos del área de trabajo:

  • Área de trabajo habilitada para Unity Catalog.

Requisitos de proceso:

  • Conectividad de red desde el recurso de proceso de Databricks a la API de Salesforce Data 360 y los cubos S3 públicos de Salesforce Data 360 donde residen los datos. Consulte Recomendaciones de redes para Lakehouse Federation.
  • Los clústeres de Azure Databricks deben usar Databricks Runtime 16.3 o superior y el modo de acceso estándar.
  • Los almacenes de SQL deben ser Pro o sin servidor.

Permisos necesarios:

  • Para crear una conexión, debe ser administrador del metastore o usuario con el privilegio CREATE CONNECTION en el metastore de Unity Catalog adjunto al área de trabajo.
  • Para crear un catálogo externo, debe tener el permiso CREATE CATALOG en el metastore, y ser el propietario de la conexión o tener el privilegio CREATE FOREIGN CATALOG en la conexión.

Los requisitos de permisos adicionales se especifican en cada sección basada en tareas que se indica a continuación.

Creación de una conexión y un catálogo externo

Una conexión especifica una ruta de acceso y credenciales para acceder a un sistema de base de datos externo. Para crear una conexión, puede usar el Explorador de catálogos o el comando CREATE CONNECTION SQL en un cuaderno de Azure Databricks o en el editor de consultas SQL de Databricks.

Nota:

También puede usar la API REST de Databricks o la CLI de Databricks para crear una conexión. Vea POST/api/2.1/unity-catalog/connections y Comandos de Unity Catalog.

Permisos necesarios: administrador del metastore o usuario con el privilegio CREATE CONNECTION.

Explorador de catálogos

  1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

  2. En la parte superior del panel Catálogo, haga clic en el icono Icono Agregar o másAgregar y seleccione Agregar una conexión en el menú.

    Como alternativa, en la página de acceso rápido, haga clic en el botón Datos externos >, vaya a la pestaña Conexiones y haga clic en Crear conexión.

  3. En la página Conceptos básicos de conexión del asistente para Configurar la conexión, escribe un Nombre de conexión intuitivo.

  4. Seleccione un tipo de conexión de Uso compartido de archivos de Salesforce Data 360.

  5. (Opcional) Agregue un comentario.

  6. Haga clic en Crear conexión.

  7. En la página Autenticación , escriba las siguientes propiedades para la instancia de Uso compartido de archivos de Salesforce Data 360:

    • Punto de conexión específico del inquilino: por ejemplo, https://mvsw0mbrmqzdcyj-m02t0mrsh1.pc-rnd.c360a.salesforce.com
    • Id. de inquilino principal: por ejemplo, core/falcontest8-core4sdb26/00DVF000001E16v2AC
  8. En la página Aspectos básicos del catálogo, escriba un nombre para el catálogo externo. Un catálogo externo refleja una base de datos en un sistema de datos externo para que pueda consultar y administrar el acceso a los datos de esa base de datos mediante Azure Databricks y Unity Catalog.

  9. (Opcional) Haga clic en Probar conexión para confirmar que funciona.

  10. Haga clic en Crear catálogo.

  11. En la página Access, seleccione las áreas de trabajo en las que los usuarios pueden acceder al catálogo que creó. Puedes seleccionar Todas las áreas de trabajo tienen acceso, o hacer clic en Asignar a áreas de trabajo, seleccionar las áreas de trabajo y luego hacer clic en Asignar.

  12. Cambia el Propietario que podrá administrar el acceso a todos los objetos del catálogo. Comienza a escribir una entidad de seguridad en el cuadro de texto y, después, haz clic en la entidad de seguridad dentro de los resultados devueltos.

  13. Concede Privilegios en el catálogo. Haz clic en Conceder:

    a) Especifica las Entidades de seguridad que tendrán acceso a los objetos del catálogo. Comienza a escribir una entidad de seguridad en el cuadro de texto y, después, haz clic en la entidad de seguridad dentro de los resultados devueltos. a) Selecciona los Preajustes de privilegios que vas a conceder a cada entidad de seguridad. A todos los usuarios de la cuenta se les concede BROWSE de forma predeterminada.

    • Seleccione Data Reader en el menú desplegable para conceder privilegios read sobre objetos en el catálogo.
    • Seleccione Editor de datos en el menú desplegable para conceder los privilegios read y modify en objetos del catálogo.
    • Seleccione manualmente los privilegios que se van a conceder.

    a) Haz clic en Conceder.

  14. Haga clic en Next.

  15. En la página Metadatos, especifica pares clave-valor de etiquetas. Para obtener más información, consulte Aplicar etiquetas a los objetos securitizables de Unity Catalog.

  16. (Opcional) Agregue un comentario.

  17. Haz clic en Guardar.

  18. Anote el Account URL y el Connection URL. Necesitará estos valores para crear un destino para compartir datos en Salesforce.

SQL

  1. Ejecute el siguiente comando en un cuaderno o en el editor de consultas de Databricks SQL.

    CREATE CONNECTION <connection-name> TYPE SALESFORCE_DATA_CLOUD_FILE_SHARING
    OPTIONS (
        tenant_specific_endpoint '<tenant_specific_endpoint>',
        core_tenant_id '<core_tenant_id>'
    );
    
  2. Vaya a la página de conexión de la conexión recién creada y tome nota de Account URL y Connection URL. Necesitará estos valores para crear un destino para compartir datos en Salesforce.

Crear un objetivo de intercambio de datos en Salesforce

Cree un destino de compartición de datos en Salesforce usando el Account URL y el Connection URL que recuperó en el paso anterior.

Consulte Crear un destino de compartición de datos (Databricks) en la documentación de Salesforce.

Mapeo de tipos de datos

Al leer de Salesforce Data 360 File Sharing a Spark, los tipos de datos se asignan de la siguiente manera:

Tipo de uso compartido de archivos de Datos de Salesforce 360 Tipo de Spark
Número DecimalType(38, 18)
Booleano Tipo Booleano
Mensaje de texto tipo de cadena
Fecha TipoFecha
Fecha y hora Tipo de marca de tiempo
Correo electrónico (texto) tipo de cadena
Porcentaje (número) DecimalType(38, 18)
Teléfono (texto) tipo de cadena
Dirección URL (texto) tipo de cadena

Limitaciones

  • El conector no se puede usar con clústeres de usuario único.