Partager via


Environnement du système des applications Databricks

Le code suivant décrit l’environnement système dans lequel votre application Databricks s’exécute :

  • Système d’exploitation: Ubuntu 22.04 LTS

  • Environnement Python : Python 3.11, en cours d’exécution dans un environnement virtuel dédié. Toutes les dépendances sont isolées dans cet environnement, y compris les bibliothèques définies dans requirements.txt et préinstallées.

  • environnementNode.js : Node.js version 22.16. Gérer les dépendances à l’aide npm et package.json.

  • Ressources système : Par défaut, chaque application peut utiliser jusqu’à 2 processeurs virtuels (processeurs virtuels) et 6 Go de mémoire. Configurez la taille de calcul pour ajuster l’allocation de processeur et de mémoire en fonction des besoins de votre charge de travail. Consultez Configurer la taille de calcul d’une application Databricks.

    Important

    Le dimensionnement de calcul de l'application est en version bêta.

Afficher les détails de l’environnement

Pour afficher l’environnement d’une application spécifique, y compris les variables d’environnement et les packages installés, accédez à l’onglet Environnement de la page détails de l’application. Consultez Afficher les détails d’une application Databricks.

Variables d’environnement par défaut

Les variables d’environnement suivantes sont disponibles dans chaque application :

Variable Descriptif
DATABRICKS_APP_NAME Nom de l’application en cours d’exécution.
DATABRICKS_WORKSPACE_ID ID unique de l’espace de travail Databricks auquel appartient l’application.
DATABRICKS_HOST URL de l’espace de travail Databricks auquel appartient l’application.
DATABRICKS_APP_PORT Le port réseau sur lequel l’application doit écouter.
DATABRICKS_CLIENT_ID ID client du principal de service Databricks affecté à l’application.
DATABRICKS_CLIENT_SECRET Le secret OAuth pour le principal de service Databricks affecté à l’application.

Variables d’environnement par défaut pour Streamlit

Si vous utilisez l’infrastructure Streamlit, l’environnement Databricks Apps préconfigure plusieurs variables d’environnement spécifiques à Streamlit :

Variable Descriptif
STREAMLIT_SERVER_ADDRESS Adresse du serveur à utiliser par Streamlit. Cette valeur est définie sur 0.0.0.0 et ne doit pas être remplacée.
STREAMLIT_SERVER_PORT Port à utiliser par Streamlit. Cette valeur est définie sur DATABRICKS_APP_PORT et ne doit pas être remplacée.
STREAMLIT_SERVER_ENABLE_XSRF_PROTECTION Étant donné que le proxy inverse Databricks Apps protège contre la falsification de requête intersites (XSRF), il est défini sur false.
STREAMLIT_SERVER_ENABLE_CORS Étant donné que le proxy inverse Databricks Apps protège contre le partage de ressources Cross-Origin (CORS), il est configuré à false.
STREAMLIT_SERVER_HEADLESS Cela est défini pour true que Streamlit s’exécute sans ouvrir une fenêtre de navigateur lors du démarrage.
STREAMLIT_BROWSER_GATHER_USAGE_STATS Ceci est réglé sur false pour empêcher l'envoi de statistiques utilisateur à Streamlit.

Bibliothèques Python préinstallées

Les bibliothèques Python suivantes sont préinstallées dans l’environnement Databricks Apps. Vous n’avez pas besoin de les inclure dans votre application, sauf si vous avez besoin d’une autre version.

Bibliothèque Version
databricks-sql-connector 3.4.0
Kit de développement logiciel Databricks (SDK) 0.33.0
mlflow-skinny 2.16.2
gradio 4.44.0
streamlit 1.38.0
brillant 1.1.0
tiret 2.18.1
flask 3.0.3
fastapi 0.115.0
uvicorn[standard] 0.30.6
gunicorn 23.0.0
huggingface-hub 0.35.3
dash-ag-grid 31.2.0
dash-mantine-components 0.14.4
dash-bootstrap-components 1.6.0
plotly 5.24.1
plotly-resampler 0.10.0

Aucune bibliothèque Node.js n’est préinstallée dans l’environnement Databricks Apps. Pour Node.js applications, vous devez répertorier explicitement toutes les dépendances de votre package.json fichier pour vous assurer qu’elles sont installées au moment de l’exécution.