Partilhar via


Definições de capacidade do driver para o Databricks ODBC Driver (Simba)

Esta página descreve como configurar definições especiais e avançadas de capacidade de driver para o Databricks ODBC Driver.

O driver ODBC Databricks fornece as seguintes configurações especiais e avançadas de capacidade de driver.

Definir o esquema inicial no ODBC

O driver ODBC permite especificar o esquema definindo Schema=<schema-name> como uma configuração de conexão. Isso equivale a executar USE <schema-name>o .

Tags de consulta para acompanhamento

Importante

Esta funcionalidade está em Pré-visualização Privada. Para solicitar acesso, entre em contato com a equipe da sua conta.

Anexe etiquetas-chave-valor às suas consultas SQL para fins de rastreamento e análise. As tags de consulta aparecem na tabela system.query.history para identificação e análise.

Para adicionar etiquetas de consulta à sua conexão, inclua o parâmetro ssp_query_tags na configuração da sua conexão ODBC.

Defina as etiquetas de consulta como pares chave-valor separados por vírgulas, onde cada chave e valor são separados por dois-pontos. Por exemplo, ssp_query_tags=team:engineering,env:prod.

Suporte a consultas ANSI SQL-92 em ODBC

Os drivers ODBC do Spark Legacy aceitam consultas SQL no dialeto ANSI SQL-92 e traduzem-nas para SQLs Databricks antes de as enviar para o servidor.

Se a sua aplicação gerar Databricks SQL diretamente ou usar uma sintaxe SQL-92 não ANSI específica do Azure Databricks, defina UseNativeQuery=1 na configuração da sua ligação. Esta configuração passa consultas SQL literalmente para o Azure Databricks sem tradução.

Extrair resultados de consulta grandes no ODBC

Para obter o melhor desempenho ao extrair grandes resultados de consultas, utilize a versão mais recente do driver ODBC, que inclui as seguintes otimizações.

Serialização de seta no ODBC

O driver ODBC versão 2.6.15 e superior suporta um formato de serialização de resultados de consulta otimizado que usa a Seta Apache.

Cloud Fetch em ODBC

O driver ODBC versão 2.6.17 e superior suporta Cloud Fetch, uma funcionalidade que recolhe resultados de consultas através do armazenamento na cloud configurado na sua implementação Azure Databricks.

Quando executa uma consulta, o Azure Databricks carrega os resultados para uma localização interna de armazenamento DBFS como ficheiros serializados em Arrow de até 20 MB. Após a conclusão da consulta, o driver envia pedidos de busca e o Azure Databricks devolve assinaturas de acesso partilhado aos ficheiros carregados. O driver usa então estas URLs para descarregar os resultados diretamente do DBFS.

Cloud Fetch aplica-se apenas a resultados de consulta superiores a 1 MB. O controlador recupera resultados mais pequenos diretamente do Azure Databricks.

O Azure Databricks recolhe automaticamente os ficheiros acumulados, marcando-os para eliminação após 24 horas e eliminando-os permanentemente após mais 24 horas.

Para saber mais sobre a arquitetura Cloud Fetch, consulte Como conseguimos conectividade de alta largura de banda com ferramentas de BI.

Ativar registo

Para permitir o login no driver ODBC, defina a LogLevel propriedade para um valor entre 1 (apenas eventos graves) e 6 (toda a atividade do driver). Define a LogPath propriedade para o caminho completo da pasta onde queres guardar os ficheiros de registo.

Para mais informações, consulte Configurar Opções de Registo numa Máquina Não Windows no Guia de Controladores ODBC Databricks.