DatabricksCluster Classe
Définit les informations de cluster Databricks à utiliser dans un DatabricksSection.
Initialiser.
Constructeur
DatabricksCluster(existing_cluster_id=None, spark_version=None, node_type=None, instance_pool_id=None, num_workers=None, min_workers=None, max_workers=None, spark_env_variables=None, spark_conf=None, init_scripts=None, cluster_log_dbfs_path=None, permit_cluster_restart=None)
Paramètres
| Nom | Description |
|---|---|
|
existing_cluster_id
|
ID de cluster d’un cluster interactif existant sur l’espace de travail Databricks. Si ce paramètre est spécifié, aucun des autres paramètres ne doit être spécifié. Valeur par défaut: None
|
|
spark_version
|
La version de Spark pour databricks exécute le cluster. Exemple : « 10.4.x-scala2.12 ». Valeur par défaut: None
|
|
node_type
|
Les types de nœuds de machine virtuelle Azure pour le cluster d’exécution Databricks. Exemple : « Standard_D3_v2 ». Valeur par défaut: None
|
|
instance_pool_id
|
ID du pool d’instances auquel le cluster doit être attaché. Valeur par défaut: None
|
|
num_workers
|
Nombre de workers pour un cluster d’exécution Databricks. Si ce paramètre est spécifié, les Valeur par défaut: None
|
|
min_workers
|
Nombre minimal de workers pour un cluster Databricks automatiquement mis à l’échelle. Valeur par défaut: None
|
|
max_workers
|
Nombre de workers pour un cluster Databricks exécuté automatiquement. Valeur par défaut: None
|
|
spark_env_variables
|
dict(<xref:{str:str}>)
Les variables d’environnement Spark pour databricks exécutent le cluster. Valeur par défaut: None
|
|
spark_conf
|
dict(<xref:{str:str}>)
Configuration Spark pour le cluster d’exécution Databricks. Valeur par défaut: None
|
|
init_scripts
|
Obsolète. Databricks a annoncé que le script init stocké dans DBFS cessera de fonctionner après le 1erc 2023. Pour atténuer le problème, utilisez des scripts d’init globaux dans databricks suivant https://learn.microsoft.com/azure/databricks/init-scripts/global 2) commentez la ligne de init_scripts dans votre étape AzureML databricks. Valeur par défaut: None
|
|
cluster_log_dbfs_path
|
Chemin DBFS vers l’emplacement où les journaux des clusters doivent être remis. Valeur par défaut: None
|
|
permit_cluster_restart
|
si existing_cluster_id est spécifié, ce paramètre indique si le cluster peut être redémarré pour le compte de l’utilisateur. Valeur par défaut: None
|
Méthodes
| validate |
Validez les détails du cluster Databricks spécifiés. Valider vérifie les types de paramètres fournis, ainsi que si la combinaison correcte de paramètres est fournie. Par exemple, vous devez spécifier ou |
validate
Validez les détails du cluster Databricks spécifiés.
Valider vérifie les types de paramètres fournis, ainsi que si la combinaison correcte de paramètres est fournie. Par exemple, vous devez spécifier ou existing_cluster_id spécifier le reste des paramètres de cluster. Pour plus d’informations, consultez les définitions de paramètres du constructeur.
validate()
Exceptions
| Type | Description |
|---|---|
|
class:azureml.exceptions.UserErrorException
|