SKLearn Classe

Crée un estimateur pour la formation dans les expériences Scikit-learn.

OBSOLESCENT. Utilisez l’objet ScriptRunConfig avec votre propre environnement défini ou l’environnement organisé AzureML-Tutorial. Pour une introduction à la configuration des exécutions d’expériences SKLearn avec ScriptRunConfig, consultez Entraîner des modèles scikit-learn à grande échelle avec Azure Machine Learning.

Cet estimateur prend uniquement en charge l’entraînement du processeur à nœud unique.

Versions prises en charge : 0.20.3

Initialisez un estimateur Scikit-learn.

Constructeur

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Paramètres

Nom	Description
source_directory Obligatoire	str Répertoire local contenant des fichiers de configuration d’expérience.
compute_target Obligatoire	AbstractComputeTarget ou str Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ».
vm_size Obligatoire	str Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure.
vm_priority Obligatoire	str Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé. Valeurs prises en charge : « dédié » et « lowpriority ». Cela prend effet uniquement lorsque l’élément `vm_size param` est spécifié dans l’entrée.
entry_script Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement.
script_params Obligatoire	dict Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans `entry_script`.
custom_docker_image Obligatoire	str Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base.
image_registry_details Obligatoire	ContainerRegistry Détails du registre d’images Docker.
user_managed Obligatoire	bool Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda.
conda_packages Obligatoire	list Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience.
pip_packages Obligatoire	list Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience.
conda_dependencies_file_path Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le `conda_packages` paramètre. OBSOLESCENT. Utilise le paramètre `conda_dependencies_file`.
pip_requirements_file_path Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le `pip_packages` paramètre. OBSOLESCENT. Utilise le paramètre `pip_requirements_file`.
conda_dependencies_file Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le `conda_packages` paramètre.
pip_requirements_file Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le `pip_packages` paramètre.
environment_variables Obligatoire	dict Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.
environment_definition Obligatoire	Environment La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du `environment_definition` paramètre. Si ce paramètre est spécifié, il est prioritaire sur d’autres paramètres liés à l’environnement tels que `use_gpu`, , `custom_docker_imageconda_packages`ou `pip_packages`. Les erreurs sont signalées avec des combinaisons non valides.
inputs Obligatoire	list Liste d’objets DataReference à DatasetConsumptionConfig utiliser comme entrée.
shm_size Obligatoire	str Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.
resume_from Obligatoire	DataPath Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.
max_run_duration_seconds Obligatoire	int Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur.
framework_version Obligatoire	str Version scikit-learn à utiliser pour l’exécution du code d’entraînement. `SKLearn.get_supported_versions()` retourne une liste des versions prises en charge par le Kit de développement logiciel (SDK) actuel.
source_directory Obligatoire	str Répertoire local contenant des fichiers de configuration d’expérience.
compute_target Obligatoire	AbstractComputeTarget ou str Cible de calcul où l’entraînement se produira. Il peut s’agir d’un objet ou de la chaîne « local ».
vm_size Obligatoire	str Taille de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. Valeurs prises en charge : n’importe quelle taille de machine virtuelle Azure.
vm_priority Obligatoire	str Priorité de machine virtuelle de la cible de calcul qui sera créée pour l’entraînement. S’il n’est pas spécifié, « dédié » est utilisé. Valeurs prises en charge : « dédié » et « lowpriority ». Cela prend effet uniquement lorsque l’élément `vm_size param` est spécifié dans l’entrée.
entry_script Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier utilisé pour démarrer l’entraînement.
script_params Obligatoire	dict Dictionnaire d’arguments de ligne de commande à passer à votre script d’entraînement spécifié dans `entry_script`.
use_docker Obligatoire	bool Valeur bool indiquant si l’environnement à exécuter l’expérience doit être basé sur Docker.
custom_docker_image Obligatoire	str Nom de l’image Docker à partir de laquelle l’image à utiliser pour l’entraînement sera générée. Si elle n’est pas définie, une image basée sur le processeur par défaut est utilisée comme image de base.
image_registry_details Obligatoire	ContainerRegistry Détails du registre d’images Docker.
user_managed Obligatoire	bool Spécifie si Azure ML réutilise un environnement Python existant. False signifie qu’AzureML crée un environnement Python en fonction de la spécification des dépendances conda.
conda_packages Obligatoire	list Liste de chaînes représentant des packages conda à ajouter à l’environnement Python pour l’expérience.
pip_packages Obligatoire	list Liste de chaînes représentant des packages pip à ajouter à l’environnement Python pour l’expérience.
conda_dependencies_file_path Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le `conda_packages` paramètre. OBSOLESCENT. Utilise le paramètre `conda_dependencies_file`.
pip_requirements_file_path Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le `pip_packages` paramètre. OBSOLESCENT. Utilise le paramètre `pip_requirements_file`.
conda_dependencies_file Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier yaml des dépendances conda. S’il est spécifié, Azure ML n’installe aucun package lié à l’infrastructure. Cela peut être fourni en combinaison avec le `conda_packages` paramètre.
pip_requirements_file Obligatoire	str Chaîne représentant le chemin d’accès relatif au fichier texte de configuration requise pip. Cela peut être fourni en combinaison avec le `pip_packages` paramètre.
environment_variables Obligatoire	dict Dictionnaire de noms et de valeurs des variables d’environnement. Ces variables d’environnement sont définies sur le processus où le script utilisateur est en cours d’exécution.
environment_definition Obligatoire	Environment La définition d’environnement d’une expérience inclut PythonSection, DockerSection et les variables d’environnement. Toute option d’environnement non directement exposée via d’autres paramètres à la construction de l’estimateur peut être définie à l’aide du `environment_definition` paramètre. Si ce paramètre est spécifié, il est prioritaire sur d’autres paramètres liés à l’environnement tels que `use_gpu`, , `custom_docker_imageconda_packages`ou `pip_packages`. Les erreurs sont signalées avec des combinaisons non valides.
inputs Obligatoire	list Liste de azureml.data.data_reference. Objets DataReference à utiliser comme entrée.
shm_size Obligatoire	str Taille du bloc de mémoire partagée du conteneur Docker. S’il n’est pas défini, la azureml.core.environment._DEFAULT_SHM_SIZE par défaut est utilisée.
resume_from Obligatoire	DataPath Chemin d’accès aux données contenant les fichiers de point de contrôle ou de modèle à partir desquels reprendre l’expérience.
max_run_duration_seconds Obligatoire	int Durée maximale autorisée pour l’exécution. Azure ML tente d’annuler automatiquement l’exécution s’il prend plus de temps que cette valeur.
framework_version Obligatoire	str Version scikit-learn à utiliser pour l’exécution du code d’entraînement. `SKLearn.get_supported_versions()` retourne une liste des versions prises en charge par le Kit de développement logiciel (SDK) actuel.
_enable_optimized_mode Obligatoire	bool Activez la génération d’environnement incrémentielle avec des images d’infrastructure prédéfinies pour accélérer la préparation de l’environnement. Une image d’infrastructure prédéfini est basée sur des images de base processeur/GPU Azure ML avec des dépendances d’infrastructure préinstallées.
_disable_validation Obligatoire	bool Désactivez la validation du script avant l’exécution de la soumission. La valeur par défaut est True.
_show_lint_warnings Obligatoire	bool Afficher les avertissements de linting de script. La valeur par défaut est False.
_show_package_warnings Obligatoire	bool Afficher les avertissements de validation de package. La valeur par défaut est False.

Remarques

Lors de l’envoi d’un travail d’entraînement, Azure ML exécute votre script dans un environnement conda au sein d’un conteneur Docker. Les conteneurs SKLearn ont les dépendances suivantes installées.

Dépendances | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Dernière | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Les images Docker étendent Ubuntu 16.04.

Si vous avez besoin d’installer des dépendances supplémentaires, vous pouvez utiliser le ou pip_packages les conda_packages paramètres, ou vous pouvez fournir votre pip_requirements_file ou conda_dependencies_file fichier. Vous pouvez également générer votre propre image et passer le custom_docker_image paramètre au constructeur d’estimateur.

Attributs

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'

Commentaires

Cette page a-t-elle été utile ?