Partilhar via


Configurações de capacidade do driver para o Databricks JDBC Driver (Simba)

Observação

Esta página aplica-se às versões do driver JDBC da Databrick abaixo da versão 3. Para o driver JDBC do Databricks versão 3 e superior, veja o Driver JDBC do Databricks.

Esta página descreve como configurar definições especiais e avançadas de capacidade de driver para o Databricks JDBC Driver.

O Databricks JDBC Driver fornece as seguintes configurações especiais e avançadas de capacidade de driver.

Suporte a consultas ANSI SQL-92 em JDBC

Os drivers Legacy Spark JDBC aceitam consultas SQL no dialeto ANSI SQL-92 e traduzem-nas para Databricks SQL antes de as enviar para o servidor.

Se a sua aplicação gerar Databricks SQL diretamente ou usar uma sintaxe SQL-92 não ANSI específica do Azure Databricks, defina UseNativeQuery=1 na configuração da sua ligação. Esta configuração passa consultas SQL literalmente para o Azure Databricks sem tradução.

Catálogo e esquema padrão

Para especificar o catálogo e o esquema padrão, adicione ConnCatalog=<catalog-name>;ConnSchema=<schema-name> à URL de conexão JDBC.

Tags de consulta para acompanhamento

Importante

Esta funcionalidade está em Pré-visualização Privada. Para solicitar acesso, entre em contato com a equipe da sua conta.

Anexe etiquetas-chave-valor às suas consultas SQL para fins de rastreamento e análise. As tags de consulta aparecem na tabela system.query.history para identificação e análise.

Para adicionar etiquetas de consulta à sua ligação, inclua o parâmetro ssp_query_tags no URL de ligação JDBC.

jdbc:databricks://<server-hostname>:443;httpPath=<http-path>;ssp_query_tags=key1:value1,key2:value2

Defina as etiquetas de consulta como pares chave-valor separados por vírgulas, onde cada chave e valor são separados por dois-pontos. Por exemplo, key1:value1,key2:value2.

Extrair resultados de consulta grandes no JDBC

Para obter o melhor desempenho ao extrair resultados de consulta grandes, use a versão mais recente do driver JDBC, que inclui as seguintes otimizações.

Serialização de seta no JDBC

O driver JDBC versão 2.6.16 e superior suporta um formato de serialização de resultados de consulta otimizado que usa a Seta Apache.

Cloud Fetch no JDBC

O driver JDBC versão 2.6.19 e superior suporta Cloud Fetch, uma funcionalidade que recolhe resultados de consultas através do armazenamento na cloud configurado na sua implementação Azure Databricks.

Quando executa uma consulta, o Azure Databricks carrega os resultados para uma localização interna de armazenamento DBFS como ficheiros serializados em Arrow de até 20 MB. Após a conclusão da consulta, o driver envia pedidos de busca e o Azure Databricks devolve assinaturas de acesso partilhado aos ficheiros carregados. O driver usa então estas URLs para descarregar os resultados diretamente do DBFS.

Cloud Fetch aplica-se apenas a resultados de consulta superiores a 1 MB. O controlador recupera resultados mais pequenos diretamente do Azure Databricks.

O Azure Databricks recolhe automaticamente os ficheiros acumulados, marcando-os para eliminação após 24 horas e eliminando-os permanentemente após mais 24 horas.

Para saber mais sobre a arquitetura Cloud Fetch, consulte Como conseguimos conectividade de alta largura de banda com ferramentas de BI.

Ativar log

Para permitir o login no driver JDBC, defina a LogLevel propriedade para um valor entre 1 (apenas eventos graves) e 6 (toda a atividade do driver). Define a LogPath propriedade para o caminho completo da pasta onde queres guardar os ficheiros de registo.

Para mais informações, consulte Configurar o Registo no Guia de Controladores JDBC do Databricks.