Partager via


SKLearn Classe

Crée un estimateur pour la formation dans les expériences Scikit-learn.

OBSOLESCENT. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement organisé AzureML-Tutorial. Pour une introduction à la configuration des exécutions d’expériences SKLearn avec ScriptRunConfig, consultez Entraîner des modèles scikit-learn à grande échelle avec Azure Machine Learning.

Cet estimateur prend uniquement en charge l’entraînement du processeur à nœud unique.

Versions prises en charge : 0.20.3

Initialisez un estimateur Scikit-learn.

Constructeur

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Paramètres

Nom Description
source_directory
Obligatoire
str

Répertoire local contenant des fichiers de configuration d’expérience.

compute_target
Obligatoire

Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ».

vm_size
Obligatoire
str

Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement.

Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure.

vm_priority
Obligatoire
str

Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé.

Valeurs prises en charge : « dédié » et « lowpriority ».

Cela prend effet uniquement lorsque l’élément vm_size param est spécifié dans l’entrée.

entry_script
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement.

script_params
Obligatoire

Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans entry_script.

custom_docker_image
Obligatoire
str

Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base.

image_registry_details
Obligatoire

Détails du registre d’images Docker.

user_managed
Obligatoire

Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda.

conda_packages
Obligatoire

Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience.

pip_packages
Obligatoire

Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience.

conda_dependencies_file_path
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le conda_packages paramètre. OBSOLESCENT. Utilise le paramètre conda_dependencies_file.

pip_requirements_file_path
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le pip_packages paramètre. OBSOLESCENT. Utilise le paramètre pip_requirements_file.

conda_dependencies_file
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le conda_packages paramètre.

pip_requirements_file
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le pip_packages paramètre.

environment_variables
Obligatoire

Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.

environment_definition
Obligatoire

La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du environment_definition paramètre. Si ce paramètre est spécifié, il est prioritaire sur d’autres paramètres liés à l’environnement tels que use_gpu, , custom_docker_imageconda_packagesou pip_packages. Les erreurs sont signalées avec des combinaisons non valides.

inputs
Obligatoire

Liste d’objets DataReference à DatasetConsumptionConfig utiliser comme entrée.

shm_size
Obligatoire
str

Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.

resume_from
Obligatoire

Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.

max_run_duration_seconds
Obligatoire
int

Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur.

framework_version
Obligatoire
str

Version scikit-learn à utiliser pour l’exécution du code d’entraînement. SKLearn.get_supported_versions() retourne une liste des versions prises en charge par le Kit de développement logiciel (SDK) actuel.

source_directory
Obligatoire
str

Répertoire local contenant des fichiers de configuration d’expérience.

compute_target
Obligatoire

Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ».

vm_size
Obligatoire
str

Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure.

vm_priority
Obligatoire
str

Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé.

Valeurs prises en charge : « dédié » et « lowpriority ».

Cela prend effet uniquement lorsque l’élément vm_size param est spécifié dans l’entrée.

entry_script
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement.

script_params
Obligatoire

Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans entry_script.

use_docker
Obligatoire

Valeur bool indiquant si l’environnement à exécuter l’expérience doit être basé sur Docker.

custom_docker_image
Obligatoire
str

Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base.

image_registry_details
Obligatoire

Détails du registre d’images Docker.

user_managed
Obligatoire

Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda.

conda_packages
Obligatoire

Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience.

pip_packages
Obligatoire

Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience.

conda_dependencies_file_path
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le conda_packages paramètre. OBSOLESCENT. Utilise le paramètre conda_dependencies_file.

pip_requirements_file_path
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le pip_packages paramètre. OBSOLESCENT. Utilise le paramètre pip_requirements_file.

conda_dependencies_file
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le conda_packages paramètre.

pip_requirements_file
Obligatoire
str

Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le pip_packages paramètre.

environment_variables
Obligatoire

Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.

environment_definition
Obligatoire

La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du environment_definition paramètre. Si ce paramètre est spécifié, il est prioritaire sur d’autres paramètres liés à l’environnement tels que use_gpu, , custom_docker_imageconda_packagesou pip_packages. Les erreurs sont signalées avec des combinaisons non valides.

inputs
Obligatoire

Liste de azureml.data.data_reference. Objets DataReference à utiliser comme entrée.

shm_size
Obligatoire
str

Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.

resume_from
Obligatoire

Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.

max_run_duration_seconds
Obligatoire
int

Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur.

framework_version
Obligatoire
str

Version scikit-learn à utiliser pour l’exécution du code d’entraînement. SKLearn.get_supported_versions() retourne une liste des versions prises en charge par le Kit de développement logiciel (SDK) actuel.

_enable_optimized_mode
Obligatoire

Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfini est basée sur des images de base processeur/GPU Azure ML avec des dépendances d’infrastructure préinstallées.

_disable_validation
Obligatoire

Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True.

_show_lint_warnings
Obligatoire

Afficher les avertissements de linting de script. La valeur par défaut est False.

_show_package_warnings
Obligatoire

Afficher les avertissements de validation de package. La valeur par défaut est False.

Remarques

Lors de l’envoi d’un travail d’entraînement, Azure ML exécute votre script dans un environnement conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.

Dépendances | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Dernière | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Les images Docker étendent Ubuntu 16.04.

Si vous avez besoin d’installer des dépendances supplémentaires, vous pouvez utiliser le ou pip_packages les conda_packages paramètres, ou vous pouvez fournir votre pip_requirements_file ou conda_dependencies_file fichier. Vous pouvez également générer votre propre image et passer le custom_docker_image paramètre au constructeur d’estimateur.

Attributs

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'