Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Esta página descreve como configurar o Compartilhamento Delta no Azure Databricks para provedores de dados (organizações que desejam usar o Compartilhamento Delta para compartilhar dados com segurança).
Se você for um destinatário de dados (uma organização que recebe dados compartilhados usando o Compartilhamento Delta), consulte Ler dados compartilhados usando o Compartilhamento Delta de Databricks para Databricks (para destinatários).
Important
Delta Sharing necessita de um espaço de trabalho com o Catálogo Unity habilitado. Você pode criar um espaço de trabalho habilitado para Catálogo Unity para gerenciamento de compartilhamentos. Em algumas contas, novos espaços de trabalho são habilitados para o Unity Catalog automaticamente. Consulte Ativação automática do Unity Catalog.
Se a criação de um novo espaço de trabalho habilitado para Unity Catalog não for uma opção, você poderá usar o projeto de compartilhamento delta de código aberto para implantar seu próprio servidor de compartilhamento delta para compartilhar tabelas delta de qualquer plataforma.
A configuração inicial do provedor inclui as seguintes etapas:
- Habilite o compartilhamento delta em um metastore do Unity Catalog.
- (Opcional) Instale a CLI do Unity Catalog.
- Conceda privilégios para criar e gerenciar compartilhamentos e destinatários.
- Configurar auditorias das atividades de Compartilhamento Delta.
- Configure o time-to-live (TTL) da materialização de dados.
- Configure o acesso à rede de armazenamento.
Requirements
Como um provedor de dados que está configurando sua conta do Azure Databricks para poder compartilhar dados, você deve ter:
Pelo menos um espaço de trabalho do Azure Databricks que está habilitado para o Unity Catalog.
Você não precisa migrar todos os seus espaços de trabalho para o Unity Catalog para aproveitar o suporte a Databricks para provedores de compartilhamento Delta. Veja Preciso do Unity Catalog para usar o Delta Sharing?.
Os destinatários não precisam ter um espaço de trabalho habilitado para Catálogo Unity.
Função de administrador da conta para ativar o Delta Sharing para o seu metastore do Catálogo Unity e para ativar o registo de auditoria.
Função de administrador do Metastore ou os privilégios
CREATE SHAREeCREATE RECIPIENT. Consulte Funções de administrador.Note
Se seu espaço de trabalho foi habilitado para o Unity Catalog automaticamente, talvez você não tenha um administrador de metastore. No entanto, os administradores de espaço de trabalho nesses espaços de trabalho têm os privilégios de
CREATE SHAREeCREATE RECIPIENTno metastore por padrão.Para obter mais informações, consulte Ativação automática do Unity Catalog e privilégios de administrador do espaço de trabalho quando os espaços de trabalho são ativados para o Unity Catalog automaticamente.
Uma configuração de armazenamento em nuvem que permite o acesso à rede a partir do destinatário.
Habilitar o compartilhamento delta em um metastore
Você não precisa habilitar o Compartilhamento Delta em seu metastore se pretende usar o Compartilhamento Delta apenas para compartilhar dados com usuários em outros metastores do Unity Catalog em sua conta. A partilha entre metastores numa única conta do Azure Databricks está ativada por predefinição.
Caso contrário, siga estas etapas para cada metastore do Unity Catalog que gerencia os dados que você planeja compartilhar usando o Compartilhamento Delta.
Como administrador de conta do Azure Databricks, inicie sessão na consola da conta.
Na barra lateral, clique no
Catálogo.
Clique no nome de um metastore para abrir seus detalhes.
Clique na caixa de seleção ao lado de Permitir compartilhamento delta com partes fora da sua organização.
Configure o tempo de vida do token de destinatário.
Essa configuração define o período de tempo após o qual todos os tokens de destinatário expiram e devem ser regenerados. Os tokens de destinatário são usados apenas no protocolo de compartilhamento aberto. Os tokens são válidos por um máximo de um ano após a criação.
Note
O tempo de vida do token de destinatário para destinatários existentes não é atualizado automaticamente quando você altera o tempo de vida do token de destinatário padrão para um metastore. Para aplicar um novo tempo de vida do token a um determinado destinatário, você deve girar o token dele. Consulte Gerenciar tokens de destinatário.
Para definir o tempo de vida do token de destinatário padrão:
- Confirme se a configuração de expiração está ativada (isto é o padrão).
- Insira um número de segundos, minutos, horas ou dias e selecione a unidade de medida. Os tokens são válidos por um máximo de um ano após a criação.
- Clique em Ativar.
Para obter mais informações, consulte Considerações de segurança para tokens.
Ao compartilhar com um destinatário do Azure Databricks que não esteja em sua conta, insira um nome da organização.
Note
Especificar um nome de organização legível ajuda os destinatários a identificar seus provedores de compartilhamento e os objetos de provedor correspondentes na lista de provedores do destinatário.
Clique em Ativar.
(opcional) Instalar a CLI do catálogo Unity
Para gerenciar compartilhamentos e destinatários, você pode usar o Gerenciador de Catálogos, comandos SQL ou a CLI do Catálogo Unity. A CLI é executada em seu ambiente local e não requer recursos de computação do Azure Databricks.
Para instalar a CLI, consulte O que é a CLI do Databricks?.
Conceder permissão para criar e gerenciar compartilhamentos e destinatários
Os administradores da Metastore têm a capacidade de criar e gerenciar compartilhamentos e destinatários, incluindo a concessão de compartilhamentos aos destinatários. Muitas tarefas do provedor podem ser delegadas por um administrador de metastore usando os seguintes privilégios:
-
CREATE SHAREno metastore concede a capacidade de criar compartilhamentos. -
CREATE RECIPIENTno metastore é concedida a capacidade de criar destinatários. -
USE RECIPIENToferece a capacidade de listar e visualizar detalhes de todos os beneficiários no metastore. -
USE SHAREno metastore concede a capacidade de listar e visualizar detalhes de todos os compartilhamentos no metastore. -
USE RECIPIENT,USE SHARE,eSET SHARE PERMISSIONcombinados dão ao usuário a capacidade de conceder acesso de compartilhamento aos destinatários. - O administrador da metastore tem a capacidade de transferir a propriedade de qualquer ação.
- Os proprietários de compartilhamentos e os destinatários podem atualizar esses objetos e conceder compartilhamentos aos destinatários. Os criadores de objetos recebem propriedade por padrão, mas a propriedade pode ser transferida.
- Os proprietários de compartilhamentos podem adicionar tabelas e volumes aos compartilhamentos, desde que tenham acesso
SELECTàs tabelas eREAD VOLUMEacesso aos volumes.
Para obter detalhes, consulte Privilégios do catálogo Unity e objetos protegíveis e as permissões listadas para as tarefas de compartilhamento delta descritas.
Habilitar o log de auditoria
Como administrador de conta do Azure Databricks, você deve habilitar o log de auditoria para capturar eventos de Compartilhamento Delta, como:
- Quando alguém cria, modifica, atualiza ou exclui um compartilhamento ou um destinatário
- Quando um destinatário acessa um link de ativação e baixa a credencial (somente compartilhamento aberto)
- Quando um destinatário acessa dados
- Quando a credencial de um destinatário é alterada ou expira (apenas partilha aberta)
Important
A atividade de partilha Delta é registada ao nível da conta. Ao configurar a entrega de log, não insira um valor para workspace_ids_filter.
Para habilitar o registo de auditoria, siga as instruções em Referência do log de diagnóstico.
Para obter informações detalhadas sobre como os eventos de Compartilhamento Delta são registrados, consulte Auditar e monitorar o compartilhamento de dados.
Configurar TTL de materialização de dados
Como administrador de conta do Azure Databricks ou de metastore, pode configurar o tempo de vida útil de materialização de dados, que determina por quanto tempo um resultado materializado é armazenado em cache. As materializações ocorrem quando um destinatário consulta visualizações dinâmicas compartilhadas, exibições materializadas, tabelas de streaming e tabelas estrangeiras. Por padrão, o TTL é de oito horas. O cache em si será removido por materialização após mais três horas, fornecendo tempo extra para que as consultas existentes sejam concluídas.
Para alterar esse valor, faça o seguinte:
No seu espaço de trabalho do Azure Databricks, clique no
Catálogo para abrir o Catalog Explorer.
Na parte superior do painel Catálogo , clique no
ícone de engrenagem e selecione Compartilhamento Delta.
Como alternativa, na página Acesso rápido , clique no botão Compartilhamento Delta > .
No separador Partilhado comigo , clique no nome da sua organização no canto superior direito.
Clique em Exibir configurações de compartilhamento delta.
Para TTL de Materialização, insira o valor TTL desejado.
Permitir o acesso da rede ao armazenamento
Se o armazenamento em nuvem subjacente estiver configurado com controles de acesso, adicione a rede do destinatário à lista de permissões para que ele possa ler tabelas compartilhadas.
Para obter detalhes, consulte Configurar firewalls de armazenamento do Azure e redes virtuais e Configurar um firewall para acesso de computação sem servidor.