Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page explique comment configurer des paramètres de fonctionnalité de pilote spéciaux et avancés pour le pilote ODBC Databricks.
Le pilote ODBC Databricks fournit les paramètres de capacité de pilote spéciaux et avancés suivants.
- Définir le schéma initial dans ODBC
- Balises de requête pour le suivi
- Prise en charge des requêtes ANSI SQL-92 dans ODBC
- Extraire les résultats de requête volumineux dans ODBC
- Sérialisation Arrow dans ODBC
- Cloud Fetch dans ODBC
- Activation de la journalisation
Définir le schéma initial dans ODBC
Le pilote ODBC vous permet de spécifier le schéma en définissant Schema=<schema-name> comme une configuration de connexion. Cela équivaut à exécuter USE <schema-name>.
Balises de requête pour le traçage
Important
Cette fonctionnalité est disponible en préversion privée . Pour demander l’accès, contactez l’équipe de votre compte.
Attachez des balises clé-valeur à vos requêtes SQL à des fins de suivi et d’analytique. Les balises de requête apparaissent dans la system.query.history table pour l’identification et l’analyse des requêtes.
Pour ajouter des balises de requête à votre connexion, incluez le ssp_query_tags paramètre dans votre configuration de connexion ODBC :
Définissez les balises de requête en tant que paires clé-valeur séparées par des virgules, où chaque clé et valeur est séparée par un signe deux-points. Par exemple : ssp_query_tags=team:engineering,env:prod.
Prise en charge des requêtes ANSI SQL-92 dans ODBC
Les pilotes ODBC Spark hérités acceptent les requêtes SQL dans le dialecte ANSI SQL-92 et les traduisent en Databricks SQL avant de les envoyer au serveur.
Si votre application génère Databricks SQL directement ou utilise une syntaxe SQL-92 non ANSI spécifique à Azure Databricks, définie UseNativeQuery=1 dans votre configuration de connexion. Ce paramètre transmet des requêtes SQL détaillées à Azure Databricks sans traduction.
Extraire les résultats de requête volumineux dans ODBC
Pour obtenir les meilleures performances lorsque vous extrayez des résultats de requête volumineux, utilisez la dernière version du pilote ODBC, qui inclut les optimisations suivantes.
Sérialisation Arrow dans ODBC
Les versions 2.6.15 et ultérieures du pilote ODBC prennent en charge un format de sérialisation des résultats de requête optimisé qui utilise Apache Arrow.
Cloud Fetch dans ODBC
Le pilote ODBC version 2.6.17 et ultérieure prend en charge Cloud Fetch, une fonctionnalité qui extrait les résultats des requêtes via le stockage cloud configuré dans votre déploiement Azure Databricks.
Lorsque vous exécutez une requête, Azure Databricks charge les résultats dans un emplacement de stockage DBFS interne en tant que fichiers sérialisés par flèche allant jusqu’à 20 Mo. Une fois la requête terminée, le pilote envoie des demandes de récupération et Azure Databricks retourne des signatures d’accès partagé aux fichiers chargés. Le pilote utilise ensuite ces URL pour télécharger les résultats directement à partir de DBFS.
Cloud Fetch s’applique uniquement aux résultats de requête supérieurs à 1 Mo. Le pilote récupère des résultats plus petits directement à partir d’Azure Databricks.
Azure Databricks collecte automatiquement les fichiers accumulés, les marquant pour suppression après 24 heures et les supprimant définitivement après 24 heures supplémentaires.
Pour en savoir plus sur l’architecture de Cloud Fetch, consultez How We Achieved High-bandwidth Connectivity With BI Tools.
Activation de la journalisation
Pour activer la journalisation dans le pilote ODBC, définissez la LogLevel propriété sur une valeur entre 1 (événements graves uniquement) et 6 (toutes les activités du pilote). Définissez la LogPath propriété sur le chemin complet du dossier dans lequel vous souhaitez enregistrer les fichiers journaux.
Pour plus d’informations, consultez Configuration des options de journalisation dans un ordinateur non-Windows dans le Guide du pilote ODBC Databricks.