Delen via


SKLearn Klas

Hiermee maakt u een estimator voor training in Scikit-learn-experimenten.

VEROUDERD. Gebruik het ScriptRunConfig object met uw eigen gedefinieerde omgeving of de AzureML-Tutorial gecureerde omgeving. Zie Scikit-learn-modellen op schaal trainen met Azure Machine Learning voor een inleiding tot het configureren van SKLearn-experimentuitvoeringen met ScriptRunConfig.

Deze estimator biedt alleen ondersteuning voor CPU-training met één knooppunt.

Ondersteunde versies: 0.20.3

Initialiseer een Scikit-learn-estimator.

Constructor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameters

Name Description
source_directory
Vereist
str

Een lokale map met experimentconfiguratiebestanden.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object zijn of de tekenreeks 'lokaal'.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat wordt gemaakt voor de training.

Ondersteunde waarden: elke Azure-VM-grootte.

vm_priority
Vereist
str

De vm-prioriteit van het rekendoel dat wordt gemaakt voor de training. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size param invoer is opgegeven.

entry_script
Vereist
str

Een tekenreeks die het relatieve pad naar het bestand aangeeft dat is gebruikt om te beginnen met trainen.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan uw trainingsscript dat is opgegeven in entry_script.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd. Als deze niet is ingesteld, wordt een standaard-CPU-installatiekopieën gebruikt als basisinstallatiekopieën.

image_registry_details
Vereist

De details van het Docker-installatiekopieënregister.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de conda-afhankelijkhedenspecificatie.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden aangeeft. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter. VEROUDERD. Gebruik de conda_dependencies_file parameter.

pip_requirements_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten aangeeft. Dit kan worden opgegeven in combinatie met de pip_packages parameter. VEROUDERD. Gebruik de pip_requirements_file parameter.

conda_dependencies_file
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden aangeeft. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter.

pip_requirements_file
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten aangeeft. Dit kan worden opgegeven in combinatie met de pip_packages parameter.

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor een experiment bevat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt blootgesteld, kan worden ingesteld met behulp van environment_definition de parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden ongeldige combinaties gerapporteerd.

inputs
Vereist

Een lijst met DataReference objecten die DatasetConsumptionConfig als invoer moeten worden gebruikt.

shm_size
Vereist
str

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard-azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.

resume_from
Vereist

Het gegevenspad met het controlepunt of modelbestanden waaruit het experiment moet worden hervat.

max_run_duration_seconds
Vereist
int

De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als het langer duurt dan deze waarde.

framework_version
Vereist
str

De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode. SKLearn.get_supported_versions() retourneert een lijst met de versies die worden ondersteund door de huidige SDK.

source_directory
Vereist
str

Een lokale map met experimentconfiguratiebestanden.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object zijn of de tekenreeks 'lokaal'.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat wordt gemaakt voor de training. Ondersteunde waarden: elke Azure-VM-grootte.

vm_priority
Vereist
str

De vm-prioriteit van het rekendoel dat wordt gemaakt voor de training. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size param invoer is opgegeven.

entry_script
Vereist
str

Een tekenreeks die het relatieve pad naar het bestand aangeeft dat is gebruikt om te beginnen met trainen.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan uw trainingsscript dat is opgegeven in entry_script.

use_docker
Vereist

Een boolwaarde die aangeeft of de omgeving waarop het experiment moet worden uitgevoerd, docker moet zijn.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd. Als deze niet is ingesteld, wordt een standaardinstallatiekopieën op basis van CPU gebruikt als basisinstallatiekopieën.

image_registry_details
Vereist

De details van het Docker-installatiekopieënregister.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. False betekent dat AzureML een Python-omgeving maakt op basis van de conda-afhankelijkhedenspecificatie.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden aangeeft. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter. VEROUDERD. Gebruik de conda_dependencies_file parameter.

pip_requirements_file_path
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten aangeeft. Dit kan worden opgegeven in combinatie met de pip_packages parameter. VEROUDERD. Gebruik de pip_requirements_file parameter.

conda_dependencies_file
Vereist
str

Een tekenreeks die het relatieve pad naar het yaml-bestand conda-afhankelijkheden aangeeft. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten. Dit kan worden opgegeven in combinatie met de conda_packages parameter.

pip_requirements_file
Vereist
str

Een tekenreeks die het relatieve pad naar het tekstbestand pip-vereisten aangeeft. Dit kan worden opgegeven in combinatie met de pip_packages parameter.

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor een experiment bevat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt blootgesteld, kan worden ingesteld met behulp van environment_definition de parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden ongeldige combinaties gerapporteerd.

inputs
Vereist

Een lijst met azureml.data.data_reference. DataReference-objecten die moeten worden gebruikt als invoer.

shm_size
Vereist
str

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard-azureml.core.environment._DEFAULT_SHM_SIZE gebruikt.

resume_from
Vereist

Het gegevenspad met het controlepunt of modelbestanden waaruit het experiment moet worden hervat.

max_run_duration_seconds
Vereist
int

De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als het langer duurt dan deze waarde.

framework_version
Vereist
str

De Scikit-learn-versie die moet worden gebruikt voor het uitvoeren van trainingscode. SKLearn.get_supported_versions() retourneert een lijst met de versies die worden ondersteund door de huidige SDK.

_enable_optimized_mode
Vereist

Schakel incrementele omgevingsbuild in met vooraf gebouwde frameworkinstallatiekopieën voor snellere voorbereiding van de omgeving. Een vooraf gebouwde frameworkinstallatiekopie is gebouwd op basis van azure ML-standaard-CPU/GPU-basisinstallatiekopieën met vooraf geïnstalleerde frameworkafhankelijkheden.

_disable_validation
Vereist

Schakel scriptvalidatie uit voordat het verzenden wordt uitgevoerd. De standaardwaarde is Waar.

_show_lint_warnings
Vereist

Waarschuwingen voor het linten van scripts weergeven. De standaardwaarde is Onwaar.

_show_package_warnings
Vereist

Pakketvalidatiewaarschuwingen weergeven. De standaardwaarde is Onwaar.

Opmerkingen

Wanneer u een trainingstaak verzendt, voert Azure ML uw script uit in een Conda-omgeving in een Docker-container. SKLearn-containers hebben de volgende afhankelijkheden geïnstalleerd.

Afhankelijkheden | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Meest recente | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

De Docker-installatiekopieën breiden Ubuntu 16.04 uit.

Als u aanvullende afhankelijkheden wilt installeren, kunt u de pip_packages of conda_packages parameters gebruiken, of u kunt uw pip_requirements_file of conda_dependencies_file bestand opgeven. U kunt ook uw eigen installatiekopieën bouwen en de custom_docker_image parameter doorgeven aan de estimatorconstructor.

Kenmerken

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'