Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Remarque
Cet article présente Databricks Connect pour Databricks Runtime 13.3 LTS et versions ultérieures.
Cet article explique comment installer Databricks Connect pour Python. Consultez Présentation de Databricks Partner Connect.
Spécifications
Avant d’installer Databricks Connect, vérifiez que votre espace de travail et votre environnement local répondent aux exigences. Consultez les exigences d’utilisation de Databricks Connect.
Activer un environnement virtuel Python
Databricks recommande vivement d’avoir un environnement virtuel Python activé pour chaque projet de code Python que vous utilisez avec Databricks Connect. Les environnements virtuels Python garantissent que vous utilisez les bonnes versions de Python et Databricks Connect ensemble. Pour plus d’informations sur ces outils et sur la façon de les activer, consultez venv ou Poetry.
Installer le client Databricks Connect
Cette section explique comment installer le client Databricks Connect avec venv ou Poetry.
Remarque
Si l’extension Databricks pour Visual Studio Code est déjà installée, vous pouvez installer Databricks Connect pour Databricks Runtime 13.3 LTS et versions ultérieures à l’aide de l’extension. Consultez Déboguer le code à l’aide de Databricks Connect pour l’extension Databricks pour Visual Studio Code.
Installer le client Databricks Connect avec venv
Une fois votre environnement virtuel activé, désinstallez PySpark, s’il est déjà installé, en exécutant la commande
uninstall. Cela est nécessaire car le packagedatabricks-connectest en conflit avec PySpark. Pour plus d’informations, consultez Installations PySpark en conflit. Pour vérifier si PySpark est déjà installé, exécutez la commandeshow.# Is PySpark already installed? pip3 show pyspark # Uninstall PySpark pip3 uninstall pysparkVotre environnement virtuel étant toujours activé, installez le client Databricks Connect en exécutant la commande
install. Utilisez l’option--upgradepour mettre à niveau toute installation de client existante vers la version spécifiée.pip3 install --upgrade "databricks-connect==16.4.*" # Or X.Y.* to match your cluster version.Remarque
Databricks vous recommande d’ajouter la notation « point-astérisque » pour spécifier
databricks-connect==X.Y.*au lieu dedatabricks-connect=X.Yet vous assurer que le package le plus récent est installé. Bien qu’il ne s’agit pas d’une exigence, cela vous permet de vous assurer que vous pouvez utiliser les dernières fonctionnalités prises en charge pour ce cluster.
Installer le client Databricks Connect avec Poetry
Une fois votre environnement virtuel activé, désinstallez PySpark, s’il est déjà installé, en exécutant la commande
remove. Cela est nécessaire car le packagedatabricks-connectest en conflit avec PySpark. Pour plus d’informations, consultez Installations PySpark en conflit. Pour vérifier si PySpark est déjà installé, exécutez la commandeshow.# Is PySpark already installed? poetry show pyspark # Uninstall PySpark poetry remove pysparkVotre environnement virtuel étant toujours activé, installez le client Databricks Connect en exécutant la commande
add.poetry add databricks-connect@~16.4 # Or X.Y to match your cluster version.Remarque
Databricks vous recommande d’utiliser la notation « arobase-tilde » pour spécifier
databricks-connect@~16.4à la place dedatabricks-connect==16.4, afin de vérifier que le package le plus récent est installé. Bien qu’il ne s’agit pas d’une exigence, cela vous permet de vous assurer que vous pouvez utiliser les dernières fonctionnalités prises en charge pour ce cluster.