Delen via


Lakehouse-federatie voor Salesforce Data 360-bestandsdeling

Op deze pagina wordt beschreven hoe u gegevens leest in Salesforce Data 360 (voorheen Data Cloud) met behulp van de connector voor het delen van bestanden.

Welke Salesforce-connector moet ik gebruiken?

Databricks biedt meerdere connectors voor Salesforce. Er zijn twee zero-copy connectors: de Salesforce Data 360-connector voor bestandsdeling en de Salesforce Data 360-connector voor queryfederatie. Hiermee kunt u query's uitvoeren op gegevens in Salesforce Data 360 zonder deze te verplaatsen. Er is ook een Salesforce-opnameconnector waarmee gegevens uit verschillende Salesforce-producten worden gekopieerd.

De volgende tabel bevat een overzicht van de verschillen tussen de Salesforce-connectors in Databricks:

Verbinder Gebruiksituatie Ondersteunde Salesforce-producten
Salesforce Data 360-bestandsdeling Wanneer u de Salesforce Data 360-connector voor het delen van bestanden in Lakehouse Federation gebruikt, roept Databricks Salesforce Data-as-a-Service-API's (DaaS) aan om gegevens rechtstreeks in de onderliggende opslaglocatie voor cloudobjecten te lezen. Query's worden uitgevoerd op Databricks Compute zonder het JDBC-protocol te gebruiken.
In vergelijking met queryfederatie is het delen van bestanden ideaal voor het federeren van een grote hoeveelheid gegevens. Het biedt verbeterde prestaties voor het lezen van bestanden uit meerdere gegevensbronnen en betere pushdown-mogelijkheden. Zie Lakehouse Federation voor Salesforce Data 360 File Sharing.
Salesforce Data 360
Salesforce Data 360 query-federatie Wanneer u de Salesforce Data 360-queryfederatieconnector in Lakehouse Federation gebruikt, gebruikt Databricks JDBC om verbinding te maken met brongegevens en pusht query's naar Salesforce. Zie Federatieve query's uitvoeren op Salesforce Data 360. Salesforce Data 360
Salesforce-gegevensinvoer Met de Salesforce-opnameconnector in Lakeflow Connect kunt u volledig beheerde opnamepijplijnen maken op basis van Salesforce Platform-gegevens. Deze connector maximaliseert de waarde door niet alleen CDP-gegevens, maar ook CRM-gegevens in het Data Intelligence Platform te gebruiken. Zie Gegevens opnemen uit Salesforce. Zie welke Salesforce-producten worden ondersteund door de Salesforce-opnameconnector?

Voordat u begint

Vereisten voor werkruimte:

  • Werkruimte geactiveerd voor Unity Catalog.

Rekenvereisten:

  • Netwerkconnectiviteit van uw Databricks-rekenresource met de Salesforce Data 360-API en de openbare S3-buckets van Salesforce Data 360 waar gegevens zich bevinden. Zie De aanbevelingen voor netwerken voor Lakehouse Federation.
  • Azure Databricks-clusters moeten Databricks Runtime 16.3 of hoger en de standaardtoegangsmodus gebruiken.
  • SQL-warehouses moeten Pro of Serverless zijn.

Vereiste toestemmingen:

  • Als u een verbinding wilt maken, moet u een metastore-beheerder of een gebruiker zijn met de CREATE CONNECTION bevoegdheid voor de Unity Catalog-metastore die is gekoppeld aan de werkruimte.
  • Als u een buitenlandse catalogus wilt maken, moet u de machtiging CREATE CATALOG hebben voor de metastore en ofwel de eigenaar van de verbinding zijn of het privilege CREATE FOREIGN CATALOG voor de verbinding hebben.

Aanvullende machtigingsvereisten worden opgegeven in elke sectie op basis van taken die volgt.

Maak een verbinding en een externe catalogus

Een verbinding geeft een pad en referenties op voor toegang tot een extern databasesysteem. Als u een verbinding wilt maken, kunt u Catalog Explorer of de CREATE CONNECTION SQL-opdracht gebruiken in een Azure Databricks-notebook of de Databricks SQL-queryeditor.

Opmerking

U kunt ook de Databricks REST API of de Databricks CLI gebruiken om een verbinding te maken. Zie POST /api/2.1/unity-catalog/connections en Unity Catalog-opdrachten.

Vereiste machtigingen: Metastore-beheerder of gebruiker met de CREATE CONNECTION bevoegdheid.

Catalogusverkenner

  1. Klik in uw Azure Databricks-werkruimte op het pictogram Gegevens.Catalogus.

  2. Klik boven in het deelvenster Catalogus op het Toevoegen- of pluspictogramToevoegen pictogram en selecteer Verbinding toevoegen in het menu.

    U kunt ook op de pagina Snelle toegang op de knop Externe gegevens > klikken, naar het tabblad Verbindingen gaan en op Verbinding maken klikken.

  3. Voer op de pagina Verbindingsbeginselen van de wizard Verbinding instellen een gebruiksvriendelijke verbindingsnaam in.

  4. Selecteer een verbindingstype van Salesforce Data 360-bestandsdeling.

  5. (Optioneel) Voeg een opmerking toe.

  6. Klik op Verbinding maken.

  7. Op de pagina Authenticatie voert u de volgende eigenschappen in voor uw exemplaar van Salesforce Data 360 bestandsdeling:

    • Tenantspecifiek eindpunt: bijvoorbeeld https://mvsw0mbrmqzdcyj-m02t0mrsh1.pc-rnd.c360a.salesforce.com
    • Kerntenant-id: bijvoorbeeld core/falcontest8-core4sdb26/00DVF000001E16v2AC
  8. Voer op de pagina Catalogus Basis een naam in voor de buitenlandse catalogus. Een refererende catalogus spiegelt een database in een extern gegevenssysteem, zodat u de toegang tot gegevens in die database kunt opvragen en beheren met behulp van Azure Databricks en Unity Catalog.

  9. (Optioneel) Klik op Verbinding testen om te bevestigen dat deze werkt.

  10. Klik op Catalogus maken.

  11. Selecteer op de pagina Access de werkruimten waarin gebruikers toegang hebben tot de catalogus die u hebt gemaakt. U kunt Alle werkruimten hebben toegang selecteren, of op Toewijzen aan werkruimten klikken, de werkruimten selecteren en vervolgens op Toewijzen klikken.

  12. Wijzig de eigenaar die de toegang tot alle objecten in de catalogus kan beheren. Begin met het typen van een principe in het tekstvak en klik vervolgens op het principe in de weergegeven resultaten.

  13. Verleen privileges aan de catalogus. Klik op Toestaan:

    een. Geef de principals op die toegang hebben tot objecten in de catalogus. Begin met het typen van een principe in het tekstvak en klik vervolgens op het principe in de weergegeven resultaten. een. Selecteer de vooraf ingestelde bevoegdheden om aan elke principal toe te kennen. Alle accountgebruikers krijgen standaard BROWSE toegewezen.

    • Selecteer Gegevenslezer in de vervolgkeuzelijst om bevoegdheden voor objecten in de catalogus te verlenen read .
    • Selecteer Gegevenseditor in de vervolgkeuzelijst om read en modify rechten toe te kennen op objecten in de catalogus.
    • Selecteer handmatig de bevoegdheden die u wilt verlenen.

    een. Klik op Toestaan.

  14. Klik op Volgende.

  15. Op de pagina Metagegevens geef je sleutel-waardeparen voor tags op. Zie Tags toepassen op beveiligbare objecten in Unity Catalog voor meer informatie.

  16. (Optioneel) Voeg een opmerking toe.

  17. Klik op Opslaan.

  18. Noteer de Account URL en de Connection URL. U hebt deze waarden nodig om een gegevenssharedoel te maken in Salesforce.

SQL

  1. Voer de volgende opdracht uit in een notebook of de Sql-query-editor van Databricks.

    CREATE CONNECTION <connection-name> TYPE SALESFORCE_DATA_CLOUD_FILE_SHARING
    OPTIONS (
        tenant_specific_endpoint '<tenant_specific_endpoint>',
        core_tenant_id '<core_tenant_id>'
    );
    
  2. Ga naar de verbindingspagina van de zojuist gemaakte verbinding en noteer de Account URL en de Connection URL. U hebt deze waarden nodig om een gegevenssharedoel te maken in Salesforce.

Een gegevenssharedoel maken in Salesforce

Maak een gegevensdeling-doel in Salesforce door gebruik te maken van de Account URL en de Connection URL die u in de vorige stap hebt opgehaald.

Zie Een datadelingsdoel (Databricks) maken in de Salesforce-documentatie.

Gegevenstypetoewijzingen

Wanneer u gegevens uit Salesforce Data 360 File Sharing naar Spark leest, worden de gegevenstypen als volgt toegewezen:

Salesforce Data 360-bestandsdelingstype Sparktype
Aantal DecimalType(38, 18)
Booleaan BoolType
Tekst Stringtype
Datum Datumtype
Datum/tijd Tijdstempeltype
E-mail (tekst) Stringtype
Percentage (getal) DecimalType(38, 18)
Telefoon (tekst) Stringtype
URL (tekst) Stringtype

Beperkingen

  • De connector kan niet worden gebruikt met clusters met één gebruiker.