Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página descreve como ler dados no Salesforce Data 360 (anteriormente Data Cloud) usando o conector de compartilhamento de arquivos.
Qual conector do Salesforce devo usar?
O Databricks oferece vários conectores para o Salesforce. Há dois conectores de cópia zero: o conector de compartilhamento de arquivos do Salesforce Data 360 e o conector de federação de consultas do Salesforce Data 360. Eles permitem que você consulte dados no Salesforce Data 360 sem movê-los. Há também um conector de ingestão do Salesforce que copia dados de vários produtos Salesforce.
A tabela a seguir resume as diferenças entre os conectores do Salesforce no Databricks:
| Conector | Caso de uso | Produtos Salesforce compatíveis |
|---|---|---|
| Compartilhamento de arquivos do Salesforce Data 360 | Quando você usa o conector de compartilhamento de arquivos Salesforce Data 360 no Lakehouse Federation, o Databricks chama APIs de dados como serviço (DaaS) do Salesforce para ler dados diretamente no local de armazenamento de objetos na nuvem subjacente. As consultas são executadas na computação Databricks sem usar o protocolo JDBC. Em comparação com a federação de consultas, o compartilhamento de arquivos é ideal para federar uma grande quantidade de dados. Ele oferece melhor desempenho para leitura de arquivos de várias fontes de dados e melhores recursos de pushdown. Consulte Lakehouse Federation for Salesforce Data 360 File Sharing. |
Dados do Salesforce 360 |
| Federação de consultas do Salesforce Data 360 | Quando você usa o conector de federação de consultas do Salesforce Data 360 no Lakehouse Federation, o Databricks usa JDBC para se conectar aos dados de origem e envia consultas para o Salesforce. Consulte Executar consultas federadas no Salesforce Data 360. | Dados do Salesforce 360 |
| Ingestão do Salesforce | O conector de ingestão do Salesforce no Lakeflow Connect permite criar pipelines de ingestão totalmente gerenciados a partir dos dados da Salesforce Platform. Esse conector maximiza o valor aproveitando não apenas os dados de CDP, mas também os dados de CRM na plataforma de inteligência de dados. Consulte Ingestão de dados do Salesforce. | Consulte Quais produtos Salesforce são compatíveis com o conector de ingestão do Salesforce? |
Antes de começar
Requisitos do espaço de trabalho:
- Espaço de trabalho habilitado para o Unity Catalog.
Requisitos de computação:
- Ligação de rede da sua instância de computação Databricks para a API do Salesforce Data 360 e os buckets S3 públicos do Salesforce Data 360 onde os dados estão armazenados. Consulte as recomendações de rede para a Lakehouse Federation.
- Os clusters do Azure Databricks devem usar o Databricks Runtime 16.3 ou superior e o modo de acesso padrão.
- Os armazéns SQL devem ser Pro ou Serverless.
Permissões necessárias:
- Para criar uma conexão, você deve ser um administrador de metastore ou um usuário com o privilégio de
CREATE CONNECTIONno metastore do Unity Catalog anexado ao espaço de trabalho. - Para criar um catálogo estrangeiro, você deve ter a permissão
CREATE CATALOGno metastore e ser o proprietário da conexão ou ter o privilégio deCREATE FOREIGN CATALOGna conexão.
Os requisitos de permissão adicionais são especificados em cada seção baseada em tarefas a seguir.
Criar uma conexão e um catálogo externo
Uma conexão especifica um caminho e credenciais para acessar um sistema de banco de dados externo. Para criar uma conexão, você pode usar o Gerenciador de Catálogos ou o comando CREATE CONNECTION SQL em um bloco de anotações do Azure Databricks ou no editor de consultas Databricks SQL.
Observação
Você também pode usar a API REST do Databricks ou a CLI do Databricks para criar uma conexão. Consulte POST /api/2.1/unity-catalog/connections e os comandos do Unity Catalog .
Permissões necessárias: administrador do Metastore ou usuário com o CREATE CONNECTION privilégio.
Explorador de Catálogos
No seu espaço de trabalho do Azure Databricks, clique no
Catálogo.
Na parte superior do painel Catálogo, clique no ícone
Adicionar e selecione Adicionar uma conexão no menu.Como alternativa, na página Acesso rápido , clique no botão Dados externos > , vá para a guia Conexões e clique em Criar conexão.
Na página
Noções básicas de conexão do assistenteConfigurar conexão , insira um Nome da conexãoque seja fácil de usar. Selecione um tipo de conexão do Compartilhamento de arquivos do Salesforce Data 360.
(Opcional) Adicione um comentário.
Clique em Criar conexão.
Na página Autenticação , insira as seguintes propriedades para sua instância de compartilhamento de arquivos do Salesforce Data 360:
-
Ponto de extremidade específico do locatário: por exemplo,
https://mvsw0mbrmqzdcyj-m02t0mrsh1.pc-rnd.c360a.salesforce.com -
ID do locatário principal: por exemplo,
core/falcontest8-core4sdb26/00DVF000001E16v2AC
-
Ponto de extremidade específico do locatário: por exemplo,
Na página Noções básicas do catálogo, insira um nome para o catálogo estrangeiro. Um catálogo estrangeiro espelha um banco de dados em um sistema de dados externo para que você possa consultar e gerenciar o acesso aos dados nesse banco de dados usando o Azure Databricks e o Unity Catalog.
(Opcional) Clique em Testar conexão para confirmar se ela funciona.
Clique em Criar o catálogo.
Na página Access , selecione os espaços de trabalho onde os utilizadores podem aceder ao catálogo que criou. Você pode selecionar Todos os espaços de trabalho têm acesso ou clicar em Atribuir a espaços de trabalho, selecionar os espaços de trabalho e clicar em Atribuir.
Altere o Proprietário que poderá gerenciar o acesso a todos os objetos no catálogo. Comece a digitar um principal na caixa de texto e, em seguida, clique no principal nos resultados apresentados.
Conceder privilégios e no catálogo. Selecionar Conceder:
a) Especifique os Principals que terão acesso aos objetos no catálogo. Comece a digitar um principal na caixa de texto e, em seguida, clique no principal nos resultados apresentados. a) Selecione as predefinições de privilégio para conceder a cada principal. Todos os usuários da conta recebem
BROWSEpor padrão.- Selecione Leitor de Dados no menu suspenso para conceder privilégios
reada objetos no catálogo. - Selecione Editor de Dados no menu suspenso para conceder privilégios
reademodifysobre objetos no catálogo. - Selecione manualmente os privilégios a conceder.
a) Clique em Conceder.
- Selecione Leitor de Dados no menu suspenso para conceder privilégios
Clique em Next.
Na página Metadados, especifique pares de chave-valor das etiquetas. Para obter mais informações, consulte Aplicar tags a objetos protegíveis do Unity Catalog.
(Opcional) Adicione um comentário.
Clique em Salvar.
Anote o
Account URLe oConnection URL. Você precisará desses valores para criar um destino de compartilhamento de dados no Salesforce.
SQL
Execute o seguinte comando em um bloco de anotações ou no editor de consultas Databricks SQL.
CREATE CONNECTION <connection-name> TYPE SALESFORCE_DATA_CLOUD_FILE_SHARING OPTIONS ( tenant_specific_endpoint '<tenant_specific_endpoint>', core_tenant_id '<core_tenant_id>' );Vá para a página de conexão da conexão recém-criada e anote o
Account URLe oConnection URL. Você precisará desses valores para criar um destino de compartilhamento de dados no Salesforce.
Criar um destino de compartilhamento de dados no Salesforce
Crie um destino de compartilhamento de dados no Salesforce usando o Account URL e o Connection URL que você recuperou na etapa anterior.
Consulte Criar um destino de compartilhamento de dados (Databricks) na documentação do Salesforce.
Mapeamentos de tipo de dados
Ao utilizar o Salesforce Data 360 File Sharing para ler dados no Spark, os tipos de dados são mapeados da seguinte maneira:
| Tipo de compartilhamento de arquivos do Salesforce Data 360 | Tipo de faísca |
|---|---|
| Número | Tipo Decimal(38, 18) |
| booleano | Tipo Booleano |
| Texto | TipoString |
| Data | Tipo de Data |
| Data e hora | Tipo de Timestamp |
| Email (Texto) | TipoString |
| Percentagem (Número) | Tipo Decimal(38, 18) |
| Telefone (Texto) | TipoString |
| URL (Texto) | TipoString |
Limitações
- O conector não pode ser usado com clusters de usuário único.