Partager via


Configurer l’exécution de l’application Databricks avec app.yaml

Le app.yaml fichier d’une application Databricks définit la façon dont votre application s’exécute. Si votre application nécessite une autre configuration spécifique au point d’entrée ou à l’environnement, vous pouvez inclure ce fichier facultatif dans votre projet pour remplacer le comportement par défaut.

Vous pouvez utiliser l’extension de fichier .yaml ou .yml. Ce fichier doit se trouver à la racine de votre répertoire de projet.

Paramètres pris en charge

Le app.yaml fichier prend en charge les paramètres suivants.

Réglage Type Descriptif
command sequence Utilisez ce paramètre lorsque vous avez besoin d’une commande personnalisée pour exécuter votre application. Par défaut, Azure Databricks exécute des applications Python à l’aide de la commande python <my-app.py>, où <my-app.py> est le premier .py fichier de la structure de fichiers de votre application. Si votre application inclut Node.js, la commande par défaut est npm run start. Consultez la logique de déploiement.
Étant donné qu’Azure Databricks n’exécute pas la commande dans un interpréteur de commandes, les variables d’environnement définies en dehors de la configuration de l’application ne sont pas disponibles pour votre application. Si votre application nécessite des paramètres supplémentaires à exécuter, utilisez la env structure.
Ce paramètre est facultatif.
env list Azure Databricks définit automatiquement plusieurs variables d’environnement par défaut dans l’environnement d’exécution de l’application. Cette clé de niveau supérieur définit une liste facultative de variables d’environnement supplémentaires à transmettre à votre application. Chaque variable peut utiliser une valeur codée en dur ou référencer une source externe, telle qu’une entrée de secret ou de base de données.
Les éléments valides de la liste sont les suivants :

Ce paramètre est facultatif.

Exemple app.yaml d’application Streamlit

Le fichier suivant app.yaml montre comment configurer une application Streamlit. Il utilise une commande personnalisée pour démarrer l’application avec streamlit run, et définit des variables d’environnement pour l’ID de l’entrepôt SQL et un indicateur de suivi de l’utilisation.

command: ['streamlit', 'run', 'app.py']
env:
  - name: 'DATABRICKS_WAREHOUSE_ID'
    value: 'quoz2bvjy8bl7skl'
  - name: 'STREAMLIT_GATHER_USAGE_STATS'
    value: 'false'

Utilisez une configuration telle que celle-ci si votre application dépend d’une ressource de calcul spécifique, telle qu’un entrepôt SQL, ou nécessite certaines variables d’environnement pour contrôler le comportement du runtime.

Exemple app.yaml d’application Flask

Cet exemple montre comment configurer une application Flask à l’aide du serveur Gunicorn. Le command paramètre spécifie les paramètres de démarrage Gunicorn et la env section définit le chemin d’accès à un volume de catalogue Unity en tant que variable d’environnement.

command:
  - gunicorn
  - app:app
  - -w
  - 4
env:
  - name: 'VOLUME_URI'
    value: '/Volumes/catalog-name/schema-name/dir-name'

Utilisez cette approche lorsque votre application a besoin d’un serveur WSGI prêt pour la production comme Gunicorn et quand elle dépend des données stockées dans un volume de catalogue Unity ou un autre chemin spécifique à l’environnement.

Étapes suivantes