Udostępnij przez


Lakehouse Federation for Salesforce Data 360 Udostępnianie Plików

Na tej stronie opisano sposób odczytywania danych w usłudze Salesforce Data 360 (dawniej Data Cloud) przy użyciu łącznika udostępniania plików.

Którego łącznika usługi Salesforce należy użyć?

Usługa Databricks oferuje wiele łączników dla usługi Salesforce. Istnieją dwa łączniki bez kopiowania: łącznik udostępniania plików usługi Salesforce Data 360 i łącznik federacji zapytań usługi Salesforce Data 360. Umożliwiają one wykonywanie zapytań dotyczących danych w usłudze Salesforce Data 360 bez ich przenoszenia. Istnieje również łącznik pozyskiwania usługi Salesforce, który kopiuje dane z różnych produktów usługi Salesforce.

W poniższej tabeli przedstawiono podsumowanie różnic między łącznikami usługi Salesforce w usłudze Databricks:

Łącznik Przypadek użycia Obsługiwane produkty Salesforce
Udostępnianie plików w usłudze Salesforce Data 360 Gdy używasz łącznika udostępniania plików usługi Salesforce Data 360 w Federacji Lakehouse, Databricks wywołuje interfejsy API Salesforce Data-as-a-Service (DaaS), aby bezpośrednio odczytywać dane w podstawowej lokalizacji magazynu obiektów w chmurze. Zapytania są uruchamiane w obliczeniach usługi Databricks bez używania protokołu JDBC.
W porównaniu z federacją zapytań udostępnianie plików jest idealne do sfederowania dużej ilości danych. Zapewnia lepszą wydajność odczytu plików z wielu źródeł danych i lepsze możliwości optymalizacji przetwarzania. Zobacz Federację Lakehouse do udostępniania plików w Salesforce Data 360.
Salesforce Data 360
Federacja zapytań usługi Salesforce Data 360 W przypadku korzystania z łącznika federacji zapytań usługi Salesforce Data 360 w usłudze Lakehouse Federation usługa Databricks używa protokołu JDBC do nawiązywania połączenia z danymi źródłowymi i wypychania zapytań do usługi Salesforce. Zobacz Uruchamianie zapytań federacyjnych w usłudze Salesforce Data 360. Salesforce Data 360
Wczytywanie danych do Salesforce Łącznik pozyskiwania usługi Salesforce w usłudze Lakeflow Connect umożliwia tworzenie w pełni zarządzanych potoków pozyskiwania na podstawie danych platformy Salesforce. Ten łącznik maksymalizuje wartość dzięki wykorzystaniu nie tylko danych CDP, ale także danych CRM na platformie analizy danych. Zobacz Pozyskiwanie danych z usługi Salesforce. Zobacz Jakie produkty usługi Salesforce obsługuje łącznik pozyskiwania usługi Salesforce?

Zanim rozpoczniesz

Wymagania dotyczące obszaru roboczego:

  • Obszar roboczy z dostępem do Unity Catalog.

Wymagania dotyczące obliczeń:

  • Łączność sieciowa z Twojego zasobu obliczeniowego Databricks do interfejsu API Salesforce Data 360 oraz publicznych zasobników S3 Salesforce Data 360, gdzie znajdują się dane. Zobacz Zalecenia dotyczące sieci dla Lakehouse Federation.
  • Klastry usługi Azure Databricks muszą używać środowiska Databricks Runtime 16.3 lub nowszego i standardowego trybu dostępu.
  • Magazyny SQL muszą mieć wartość Pro lub Bezserwerową.

Wymagane uprawnienia:

  • Aby utworzyć połączenie, musisz być administratorem magazynu metadanych lub użytkownikiem z uprawnieniami CREATE CONNECTION w magazynie metadanych Unity Catalog dołączonym do obszaru roboczego.
  • Aby utworzyć katalog zagraniczny, musisz mieć uprawnienie CREATE CATALOG w metastore i być właścicielem połączenia lub mieć uprawnienia CREATE FOREIGN CATALOG dla połączenia.

Dodatkowe wymagania dotyczące uprawnień są określone w każdej sekcji dotyczącej poszczególnych zadań.

Utwórz połączenie i katalog zewnętrzny

Połączenie określa ścieżkę dostępu i dane uwierzytelniające do zewnętrznego systemu bazodanowego. Aby utworzyć połączenie, możesz użyć Eksploratora wykazu lub polecenia CREATE CONNECTION SQL w notesie usługi Azure Databricks lub edytorze zapytań SQL usługi Databricks.

Uwaga / Notatka

Do utworzenia połączenia można również użyć interfejsu API REST usługi Databricks lub interfejsu wiersza polecenia usługi Databricks. Zobacz POST /api/2.1/unity-catalog/connections oraz polecenia Unity Catalog.

Wymagane uprawnienia: administrator magazynu metadanych lub użytkownik z uprawnieniami CREATE CONNECTION .

Eksplorator wykazu

  1. W obszarze roboczym usługi Azure Databricks kliknij ikonę Dane.Wykaz.

  2. Na górze okienka Katalog kliknij ikonę Dodaj lub plusDodaj i wybierz pozycję Dodaj połączenie z menu.

    Alternatywnie na stronie szybki dostęp do kliknij przycisk Zewnętrzne dane >, przejdź do karty połączenia, a następnie kliknij przycisk Utwórz połączenie.

  3. Na stronie Podstawy połączenia w kreatorze Konfigurowanie połączenia, wprowadź nazwę połączenia przyjazną dla użytkownika .

  4. Wybierz typ połączeniausługi Salesforce Data 360 Udostępnianie plików.

  5. (Opcjonalnie) Dodaj komentarz.

  6. Kliknij pozycję Utwórz połączenie.

  7. Na stronie Uwierzytelnianie wprowadź następujące właściwości wystąpienia udostępniania plików usługi Salesforce Data 360:

    • Punkt końcowy specyficzny dla najemcy: na przykład https://mvsw0mbrmqzdcyj-m02t0mrsh1.pc-rnd.c360a.salesforce.com
    • Identyfikator dzierżawy podstawowej: na przykład core/falcontest8-core4sdb26/00DVF000001E16v2AC
  8. Na stronie Podstawy katalogu wprowadź nazwę katalogu obcego. Wykaz obcy odzwierciedla bazę danych w zewnętrznym systemie danych, dzięki czemu można wykonywać zapytania o dostęp do danych w tej bazie danych i zarządzać nimi przy użyciu usług Azure Databricks i Unity Catalog.

  9. (Opcjonalnie) Kliknij pozycję Testuj połączenie , aby potwierdzić, że działa.

  10. Kliknij pozycję Utwórz katalog.

  11. Na stronie Access wybierz obszary robocze, w których użytkownicy mogą uzyskiwać dostęp do utworzonego katalogu. Możesz wybrać opcję Wszystkie obszary robocze mają dostęplub kliknij Przypisać do obszarów roboczych, wybierz obszary robocze, a następnie kliknij Przypisz.

  12. Zmień właściciela , który będzie mógł zarządzać dostępem do wszystkich obiektów w katalogu. Zacznij wpisywać nazwę podmiotu w polu tekstowym, a następnie kliknij ten podmiot w wynikach wyszukiwania.

  13. Nadaj przywileje w katalogu. Kliknij Zezwól:

    a. Określ podmioty, które będą miały dostęp do obiektów w katalogu. Zacznij wpisywać nazwę podmiotu w polu tekstowym, a następnie kliknij ten podmiot w wynikach wyszukiwania. a. Wybierz ustawienia wstępne przywilejów, aby przyznać każdemu podmiotowi. Wszyscy użytkownicy konta domyślnie otrzymują BROWSE.

    • Wybierz Czytnik danych z menu rozwijanego, aby nadać read uprawnienia do obiektów w katalogu.
    • Wybierz pozycję Edytor danych z menu rozwijanego, aby przyznać read i modify uprawnienia do obiektów w wykazie.
    • Ręcznie wybierz uprawnienia do udzielenia.

    a. Kliknij Grant.

  14. Kliknij przycisk Dalej.

  15. Na stronie Metadane określ pary klucz-wartość dla tagów. Aby uzyskać więcej informacji, zobacz Zastosuj tagi do obiektów zabezpieczalnych w Unity Catalog.

  16. (Opcjonalnie) Dodaj komentarz.

  17. Kliknij przycisk Zapisz.

  18. Zanotuj wartości Account URL i Connection URL. Te wartości będą potrzebne do utworzenia celu udostępniania danych w usłudze Salesforce.

SQL

  1. Uruchom następujące polecenie w notesie lub edytorze zapytań SQL usługi Databricks.

    CREATE CONNECTION <connection-name> TYPE SALESFORCE_DATA_CLOUD_FILE_SHARING
    OPTIONS (
        tenant_specific_endpoint '<tenant_specific_endpoint>',
        core_tenant_id '<core_tenant_id>'
    );
    
  2. Przejdź do strony połączenia nowo utworzonego i zanotuj Account URL oraz Connection URL. Te wartości będą potrzebne do utworzenia celu udostępniania danych w usłudze Salesforce.

Utwórz docelowy obiekt udostępniania danych w Salesforce

Utwórz punkt udostępniania danych w usłudze Salesforce przy użyciu Account URL i Connection URL pobranych w poprzednim kroku.

Zobacz Utwórz cel udostępniania danych (Databricks) w dokumentacji usługi Salesforce.

Mapowanie typu danych

Podczas odczytywania danych z Salesforce Data 360 do platformy Spark, typy danych są mapowane w następujący sposób:

Typ udostępniania plików w usłudze Salesforce 360 Typ Spark
Liczba DecimalType(38, 18)
logiczny Typ boolowski
Tekst TypCiągu
Data kalendarzowa Typ daty
Data i czas TypZnacznikaCzasu
E-mail tekstowy TypCiągu
Procent (liczba) DecimalType(38, 18)
Telefon (tekst) TypCiągu
Adres URL (tekst) TypCiągu

Ograniczenia

  • Łącznik nie może być używany z klastrami pojedynczego użytkownika.