SKLearn Classe
Crée un estimateur pour la formation dans les expériences Scikit-learn.
OBSOLESCENT. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement organisé AzureML-Tutorial. Pour une introduction à la configuration des exécutions d’expériences SKLearn avec ScriptRunConfig, consultez Entraîner des modèles scikit-learn à grande échelle avec Azure Machine Learning.
Cet estimateur prend uniquement en charge l’entraînement du processeur à nœud unique.
Versions prises en charge : 0.20.3
Initialisez un estimateur Scikit-learn.
Constructeur
SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)
Paramètres
| Nom | Description |
|---|---|
|
source_directory
Obligatoire
|
Répertoire local contenant des fichiers de configuration d’expérience. |
|
compute_target
Obligatoire
|
Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ». |
|
vm_size
Obligatoire
|
Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure. |
|
vm_priority
Obligatoire
|
Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé. Valeurs prises en charge : « dédié » et « lowpriority ». Cela prend effet uniquement lorsque l’élément |
|
entry_script
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement. |
|
script_params
Obligatoire
|
Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans |
|
custom_docker_image
Obligatoire
|
Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base. |
|
image_registry_details
Obligatoire
|
Détails du registre d’images Docker. |
|
user_managed
Obligatoire
|
Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda. |
|
conda_packages
Obligatoire
|
Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience. |
|
pip_packages
Obligatoire
|
Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience. |
|
conda_dependencies_file_path
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda.
S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure.
Cela peut être fourni en combinaison avec le |
|
pip_requirements_file_path
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip.
Cela peut être fourni en combinaison avec le |
|
conda_dependencies_file
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda.
S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure.
Cela peut être fourni en combinaison avec le |
|
pip_requirements_file
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip.
Cela peut être fourni en combinaison avec le |
|
environment_variables
Obligatoire
|
Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution. |
|
environment_definition
Obligatoire
|
La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du |
|
inputs
Obligatoire
|
Liste d’objets DataReference à DatasetConsumptionConfig utiliser comme entrée. |
|
shm_size
Obligatoire
|
Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée. |
|
resume_from
Obligatoire
|
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience. |
|
max_run_duration_seconds
Obligatoire
|
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur. |
|
framework_version
Obligatoire
|
Version scikit-learn à utiliser pour l’exécution du code d’entraînement.
|
|
source_directory
Obligatoire
|
Répertoire local contenant des fichiers de configuration d’expérience. |
|
compute_target
Obligatoire
|
Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ». |
|
vm_size
Obligatoire
|
Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure. |
|
vm_priority
Obligatoire
|
Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé. Valeurs prises en charge : « dédié » et « lowpriority ». Cela prend effet uniquement lorsque l’élément |
|
entry_script
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement. |
|
script_params
Obligatoire
|
Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans |
|
use_docker
Obligatoire
|
Valeur bool indiquant si l’environnement à exécuter l’expérience doit être basé sur Docker. |
|
custom_docker_image
Obligatoire
|
Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base. |
|
image_registry_details
Obligatoire
|
Détails du registre d’images Docker. |
|
user_managed
Obligatoire
|
Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda. |
|
conda_packages
Obligatoire
|
Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience. |
|
pip_packages
Obligatoire
|
Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience. |
|
conda_dependencies_file_path
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure.
Cela peut être fourni en combinaison avec le |
|
pip_requirements_file_path
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip.
Cela peut être fourni en combinaison avec le |
|
conda_dependencies_file
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure.
Cela peut être fourni en combinaison avec le |
|
pip_requirements_file
Obligatoire
|
Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip.
Cela peut être fourni en combinaison avec le |
|
environment_variables
Obligatoire
|
Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution. |
|
environment_definition
Obligatoire
|
La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du |
|
inputs
Obligatoire
|
Liste de azureml.data.data_reference. Objets DataReference à utiliser comme entrée. |
|
shm_size
Obligatoire
|
Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée. |
|
resume_from
Obligatoire
|
Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience. |
|
max_run_duration_seconds
Obligatoire
|
Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur. |
|
framework_version
Obligatoire
|
Version scikit-learn à utiliser pour l’exécution du code d’entraînement.
|
|
_enable_optimized_mode
Obligatoire
|
Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfini est basée sur des images de base processeur/GPU Azure ML avec des dépendances d’infrastructure préinstallées. |
|
_disable_validation
Obligatoire
|
Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True. |
|
_show_lint_warnings
Obligatoire
|
Afficher les avertissements de linting de script. La valeur par défaut est False. |
|
_show_package_warnings
Obligatoire
|
Afficher les avertissements de validation de package. La valeur par défaut est False. |
Remarques
Lors de l’envoi d’un travail d’entraînement, Azure ML exécute votre script dans un environnement conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.
Dépendances | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Dernière | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |
Les images Docker étendent Ubuntu 16.04.
Si vous avez besoin d’installer des dépendances supplémentaires, vous pouvez utiliser le ou pip_packages les conda_packages paramètres, ou vous pouvez fournir votre pip_requirements_file ou conda_dependencies_file fichier. Vous pouvez également générer votre propre image et passer le custom_docker_image paramètre au constructeur d’estimateur.
Attributs
DEFAULT_VERSION
DEFAULT_VERSION = '0.20.3'
FRAMEWORK_NAME
FRAMEWORK_NAME = 'SKLearn'