Compartilhar via


Configurar o acesso a dados para ingestão

Este artigo descreve como os usuários administradores podem configurar o acesso aos dados em um contêiner no AdLS (Azure Data Lake Storage) para que os usuários do Azure Databricks possam carregar dados do ADLS em uma tabela no Azure Databricks.

Este artigo descreve as seguintes maneiras de configurar o acesso seguro aos dados de origem:

  • (Recomendado) Criar um volume do Catálogo do Unity.
  • Crie um local externo do Catálogo do Unity com uma credencial de armazenamento.
  • Inicie um recurso de computação que usa uma entidade de serviço.
  • Gerar credenciais temporárias (um token SAS de Blob).

Antes de começar

Antes de configurar o acesso aos dados no ADLS, verifique se você tem o seguinte:

  • Dados em um contêiner na sua conta de armazenamento do Azure. Para criar um contêiner, consulte Criar um contêiner na documentação de armazenamento do Azure.
  • Para acessar dados usando um recurso de computação com uma entidade de serviço, permissões de administrador do workspace do Azure Databricks.
  • Para acessar dados usando credenciais temporárias:
    • Permissões de administrador do workspace do Azure Databricks.
    • Permissões em sua conta do Azure para criar tokens SAS de Blob. Isso permite que você gere credenciais temporárias.
  • Um SQL warehouse do Databricks. Para criar um SQL warehouse, confira Criar um SQL warehouse.
  • Familiaridade com a interface do usuário do SQL do Databricks.

Configurar o acesso ao armazenamento em nuvem

Use um dos seguintes métodos para configurar o acesso ao ADLS:

Limpar

Você pode limpar os recursos associados em sua conta de nuvem e no Azure Databricks se não quiser mais mantê-los.

Excluir a conta de armazenamento do ADLS

  1. Abra o portal do Azure na sua conta do Azure, normalmente em https://portal.azure.com.
  2. Navegue até sua conta de armazenamento e abra-a.
  3. Clique em Excluir.
  4. Insira o nome da conta de armazenamento e clique em Excluir.

Parar o SQL warehouse

Se você não estiver usando o SQL warehouse para nenhuma outra tarefa, pare-o para evitar custos adicionais.

  1. Na persona do SQL, na barra lateral, clique em SQL Warehouses.
  2. Ao lado do nome do SQL warehouse, clique em Parar.
  3. Quando solicitado, clique novamente em Interromper. novamente.

Próximas etapas

Depois de concluir as etapas neste artigo, os usuários poderão executar o COPY INTO comando para carregar os dados do contêiner do ADLS em seu workspace do Azure Databricks.