Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Esta página descreve como desabilitar o acesso direto ao metastore do Hive herdado usado pelo workspace do Azure Databricks, seja o metastore do Hive local do workspace ou um metastore do Hive externo. Quando você concluir a migração do Catálogo do Unity ou federar seu metastore do Hive como um catálogo estrangeiro que é regido pelo Catálogo do Unity, você pode usar uma configuração de administrador de workspace simples para impedir que os usuários ignorem o Catálogo do Unity e acessem tabelas registradas no metastore do Hive.
Os dados no metastore do Hive não são regidos pelo Catálogo do Unity. Desabilitar o acesso direto ao metastore do Hive é uma etapa importante no processo de migração para o Catálogo do Unity e garantir que você aproveite ao máximo a governança de dados do Catálogo do Unity. Você pode desabilitar o acesso direto e continuar consultando tabelas gerenciadas pelo metastore do Hive aproveitando a federação do metastore do Hive. Você pode federar tabelas do metastore do Hive antes ou depois de desabilitar o acesso direto do workspace a ele. Consulte Atualizar um espaço de trabalho existente para o Catálogo do Unity e Federação de metastore do Hive: habilitar o Catálogo do Unity para governar tabelas registradas em um metastore do Hive.
Importante
Mesmo depois de migrar para o Catálogo do Unity, os clusters de computação do Azure Databricks se conectam ao metastore do Hive por padrão, a menos que você desabilite explicitamente o acesso ao metastore do Hive. Para impedir que a manutenção do metastore do Hive afete suas cargas de trabalho do Catálogo do Unity, você pode desabilitar o acesso direto ao metastore do Hive para todos os clusters e cargas de trabalho ao mesmo tempo (desabilitar todo o acesso direto ao metastore do Hive) ou usar uma configuração do Spark para desabilitar o acesso em uma base cluster por cluster (Desabilitar todo o acesso direto ao metastore do Hive).
Para desabilitar o acesso ao metastore do Hive no nível da conta para novos workspaces, use a configuração de conta Desabilitar recursos herdados .
Antes de começar: quando você precisa desabilitar o metastore herdado?
Antes de desabilitar o metastore herdado do Hive, você deve atender aos seguintes critérios:
- Você terminou de migrar todas as tabelas registradas no metastore herdado para o Catálogo do Unity, ou sempre usou o Catálogo do Unity e nunca o metastore do Hive herdado.
- Você deseja fazer com que seus usuários deixem de usar tabelas registradas no metastore herdado.
- Você atualizou todos os trabalhos para o Databricks Runtime 13.3 LTS ou superior.
O que acontece quando você desabilita o metastore herdado?
Depois de desabilitar o metastore herdado:
Haverá falha em todos os trabalhos em execução em relação às tabelas registradas no metastore do Hive.
O fallback é desabilitado.
Os trabalhos executados nas versões do Databricks Runtime abaixo da 13.3 falharão.
Atualmente, os trabalhos em execução continuarão a funcionar até que sejam encerrados, mas as reinicializações nesses clusters falharão.
O cabeçalho Legacy e o catálogo
hive_metastoredesaparecem do painel do navegador Catalog Explorer.Os comandos SQL que tentam mostrar o conteúdo do
hive_metastorecatálogo falharão.
Note
Desativar o acesso herdado não impede que os usuários usem credenciais em nível de cluster, como principais de serviço, disponíveis em um cluster. O Databricks recomenda que você remova essas credenciais de seus clusters.
Os clusters sem isolamento compartilhado não respeitam a configuração de desabilitação do metastore do Hive herdado. Para impedir que os usuários criem e usem esses clusters, habilite a configuração Impor Isolamento do Usuário para o workspace. Consulte Impor tipos de cluster de isolamento de usuários em um espaço de trabalho.
Desabilitar todo o acesso direto ao metastore do Hive
Desabilite o metastore do Hive herdado do seu workspace usando a configuração do administrador de workspace Desabilitar o acesso herdado:
- Como administrador do workspace, faça logon no workspace do Azure Databricks.
- Clique no menu de perfil do usuário na parte superior direita e selecione Configurações no menu.
- Vá para Administração do Workspace > Segurança.
- Defina Desabilitar acesso herdado como Desabilitado: recursos de acesso herdado não podem ser usados.
- Para garantir que a nova configuração tenha efeito, aguarde aproximadamente cinco minutos.
- Reinicie todos os clusters em execução.
Desabilitar o acesso para clusters de computação individuais
Você também pode desabilitar o acesso direto ao metastore do Hive gradualmente, para cada cluster individualmente. Essa abordagem pode ser útil durante uma migração do Unity Catalog quando você deseja reduzir a dependência do metastore do Hive incrementalmente até poder desabilitá-la para o workspace inteiro.
Para desabilitar o acesso direto, defina as seguintes configurações do Spark no cluster:
spark.databricks.unityCatalogOnlyMode True
spark.databricks.sql.initial.catalog.namespace <catalog-name>
Substitua <catalog-name> pelo nome de um catálogo do Unity Catalog que existe em seu metastore. Ao habilitar o modo somente catálogo do Unity, você também deve definir um catálogo inicial porque o cluster não pode mais usar hive_metastore como o catálogo padrão.