Delen via


Estimator Klas

Vertegenwoordigt een algemene estimator voor het trainen van gegevens met behulp van een geleverd framework.

VEROUDERD. Gebruik het ScriptRunConfig object met uw eigen gedefinieerde omgeving of een door Azure ML samengestelde omgeving. Zie Trainingsuitvoeringen configureren en verzenden voor een inleiding tot het configureren van experimentuitvoeringen met ScriptRunConfig.

Deze klasse is ontworpen voor gebruik met machine learning-frameworks die nog geen vooraf geconfigureerde Azure Machine Learning-estimator hebben. Vooraf geconfigureerde schattingen bestaan voor Chainer, PyTorchen TensorFlowSKLearn. Zie Modellen trainen met Azure Machine Learning met behulp van estimator om een estimator te maken die niet vooraf is geconfigureerd.

De Estimator-klasse verpakt configuratiegegevens om de taken van het opgeven van hoe een script wordt uitgevoerd te vereenvoudigen. Het biedt ondersteuning voor uitvoering van één knooppunt en uitvoering van meerdere knooppunten. Als u de estimator uitvoert, wordt een model geproduceerd in de uitvoermap die is opgegeven in uw trainingsscript.

Initialiseer de estimator.

azureml.core.environment._DEFAULT_SHM_SIZE wordt gebruikt. Zie Docker run referentie voor meer informatie. :type shm_size: str :p aram resume_from: het gegevenspad met de controlepunt- of modelbestanden waaruit het experiment moet worden hervat. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: De maximale toegestane tijd voor de uitvoering. Azure ML probeert automatisch

annuleer de uitvoering als het langer duurt dan deze waarde.

Constructor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameters

Name Description
source_directory
Vereist
str

Een lokale map met experimentconfiguratie- en codebestanden die nodig zijn voor een trainingstaak.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object zijn of de tekenreeks 'lokaal'.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat wordt gemaakt voor de training. Ondersteunde waarden: elke Azure-VM-grootte.

vm_priority
Vereist
str

De vm-prioriteit van het rekendoel dat wordt gemaakt voor de training. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size parameter is opgegeven in de invoer.

entry_script
Vereist
str

Het relatieve pad naar het bestand dat is gebruikt om de training te starten.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script.

node_count
Vereist
int

Het aantal knooppunten in het rekendoel dat wordt gebruikt voor training. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd.

process_count_per_node
Vereist
int

Het aantal processen (of 'workers') dat op elk knooppunt moet worden uitgevoerd. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.

distributed_backend
Vereist
str

De communicatieback-end voor gedistribueerde training.

VEROUDERD. Gebruik de distributed_training parameter.

Ondersteunde waarden: 'mpi'. 'mpi' vertegenwoordigt MPI/Horovod.

Deze parameter is vereist wanneer node_count of process_count_per_node> 1.

Wanneer node_count == 1 en process_count_per_node == 1, wordt er geen back-end gebruikt, tenzij de back-end expliciet is ingesteld. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde training.

distributed_training
Vereist
Mpi

Parameters voor het uitvoeren van een gedistribueerde trainingstaak.

Gebruik het object om op te geven Mpivoor het uitvoeren van een gedistribueerde taak met MPI-back-endprocess_count_per_node.

use_gpu
Vereist

Hiermee wordt aangegeven of de omgeving voor het uitvoeren van het experiment GPU's moet ondersteunen. Indien waar, wordt een op GPU gebaseerde standaard Docker-installatiekopieën gebruikt in de omgeving. Als dit onwaar is, wordt een op CPU gebaseerde installatiekopieën gebruikt. Standaard-Docker-installatiekopieën (CPU of GPU) worden alleen gebruikt als de custom_docker_image parameter niet is ingesteld. Deze instelling wordt alleen gebruikt in rekendoelen waarvoor Docker is ingeschakeld.

use_docker
Vereist

Hiermee geeft u op of de omgeving voor het uitvoeren van het experiment Docker moet zijn.

custom_docker_base_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd.

VEROUDERD. Gebruik de custom_docker_image parameter.

Als deze niet is ingesteld, wordt een standaardinstallatiekopieën op basis van CPU gebruikt als basisinstallatiekopieën.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd. Als deze niet is ingesteld, wordt een standaardinstallatiekopieën op basis van CPU gebruikt als basisinstallatiekopieën. Geef alleen installatiekopieën op die beschikbaar zijn in openbare Docker-opslagplaatsen (Docker Hub). Als u een installatiekopieën uit een privé-Docker-opslagplaats wilt gebruiken, gebruikt u in plaats daarvan de parameter van environment_definition de constructor.

image_registry_details
Vereist

De details van het Docker-installatiekopieënregister.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. Als dit onwaar is, wordt er een Python-omgeving gemaakt op basis van de conda-afhankelijkhedenspecificatie.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist
str

Het relatieve pad naar het yaml-bestand van conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten.

VEROUDERD. Gebruik de conda_dependencies_file paramenter.

Geef een conda_dependencies_file_path van beide op of conda_dependencies_file. Als beide zijn opgegeven, conda_dependencies_file wordt gebruikt.

pip_requirements_file_path
Vereist
str

Het relatieve pad naar het tekstbestand met pip-vereisten.

VEROUDERD. Gebruik de pip_requirements_file parameter.

Deze parameter kan worden opgegeven in combinatie met de pip_packages parameter. Geef een pip_requirements_file_path van beide op of pip_requirements_file. Als beide zijn opgegeven, pip_requirements_file wordt gebruikt.

conda_dependencies_file
Vereist
str

Het relatieve pad naar het yaml-bestand van conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten.

pip_requirements_file
Vereist
str

Het relatieve pad naar het tekstbestand met pip-vereisten. Deze parameter kan worden opgegeven in combinatie met de pip_packages parameter.

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor het experiment. Dit omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt blootgesteld, kan worden ingesteld met behulp van deze parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden gerapporteerd over ongeldige combinaties.

inputs
Vereist

Een lijst met DataReference objecten die DatasetConsumptionConfig als invoer moeten worden gebruikt.

source_directory_data_store
Vereist

Het back-upgegevensarchief voor de projectshare.

shm_size
Vereist
str

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, wordt de standaard-azureml.core.environment._DEFAULT_SHM_SIZE gebruikt. Zie Docker run referentie voor meer informatie.

resume_from
Vereist

Het gegevenspad met het controlepunt of modelbestanden waaruit het experiment moet worden hervat.

max_run_duration_seconds
Vereist
int

De maximaal toegestane tijd voor de uitvoering. Azure ML probeert de uitvoering automatisch te annuleren als het langer duurt dan deze waarde.

source_directory
Vereist
str

Een lokale map met experimentconfiguratie- en codebestanden die nodig zijn voor een trainingstaak.

compute_target
Vereist

Het rekendoel waar de training plaatsvindt. Dit kan een object zijn of de tekenreeks 'lokaal'.

vm_size
Vereist
str

De VM-grootte van het rekendoel dat wordt gemaakt voor de training. Ondersteunde waarden: elke Azure-VM-grootte.

vm_priority
Vereist
str

De vm-prioriteit van het rekendoel dat wordt gemaakt voor de training. Als dit niet is opgegeven, wordt 'dedicated' gebruikt.

Ondersteunde waarden: 'dedicated' en 'lowpriority'.

Dit wordt alleen van kracht wanneer de vm_size parameter is opgegeven in de invoer.

entry_script
Vereist
str

Het relatieve pad naar het bestand dat is gebruikt om de training te starten.

script_params
Vereist

Een woordenlijst met opdrachtregelargumenten die moeten worden doorgegeven aan het trainingsscript dat is opgegeven in entry_script.

node_count
Vereist
int

Het aantal knooppunten in het rekendoel dat wordt gebruikt voor training. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.

process_count_per_node
Vereist
int

Het aantal processen per knooppunt. Als deze groter is dan 1, wordt een gedistribueerde MPI-taak uitgevoerd. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde taken.

distributed_backend
Vereist
str

De communicatieback-end voor gedistribueerde training.

VEROUDERD. Gebruik de distributed_training parameter.

Ondersteunde waarden: 'mpi'. 'mpi' vertegenwoordigt MPI/Horovod.

Deze parameter is vereist wanneer node_count of process_count_per_node> 1.

Wanneer node_count == 1 en process_count_per_node == 1, wordt er geen back-end gebruikt, tenzij de back-end expliciet is ingesteld. Alleen het AmlCompute doel wordt ondersteund voor gedistribueerde training.

distributed_training
Vereist
Mpi

Parameters voor het uitvoeren van een gedistribueerde trainingstaak.

Gebruik het object om op te geven Mpivoor het uitvoeren van een gedistribueerde taak met MPI-back-endprocess_count_per_node.

use_gpu
Vereist

Hiermee geeft u op of de omgeving voor het uitvoeren van het experiment GPU's moet ondersteunen. Indien waar, wordt een op GPU gebaseerde standaard Docker-installatiekopieën gebruikt in de omgeving. Als dit onwaar is, wordt een op CPU gebaseerde installatiekopieën gebruikt. Standaard-Docker-installatiekopieën (CPU of GPU) worden alleen gebruikt als de custom_docker_image parameter niet is ingesteld. Deze instelling wordt alleen gebruikt in rekendoelen waarvoor Docker is ingeschakeld.

use_docker
Vereist

Hiermee geeft u op of de omgeving voor het uitvoeren van het experiment Docker moet zijn.

custom_docker_base_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd.

VEROUDERD. Gebruik de custom_docker_image parameter.

Als deze niet is ingesteld, wordt een standaardinstallatiekopieën op basis van CPU gebruikt als basisinstallatiekopieën.

custom_docker_image
Vereist
str

De naam van de Docker-installatiekopie waaruit de installatiekopie voor training moet worden gebouwd. Als deze niet is ingesteld, wordt een standaardinstallatiekopieën op basis van CPU gebruikt als basisinstallatiekopieën. Geef alleen installatiekopieën op die beschikbaar zijn in openbare Docker-opslagplaatsen (Docker Hub). Als u een installatiekopieën uit een privé-Docker-opslagplaats wilt gebruiken, gebruikt u in plaats daarvan de parameter van environment_definition de constructor.

image_registry_details
Vereist

De details van het Docker-installatiekopieënregister.

user_managed
Vereist

Hiermee geeft u op of Azure ML een bestaande Python-omgeving opnieuw gebruikt. Als dit onwaar is, wordt er een Python-omgeving gemaakt op basis van de conda-afhankelijkhedenspecificatie.

conda_packages
Vereist

Een lijst met tekenreeksen die conda-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

pip_packages
Vereist

Een lijst met tekenreeksen die pip-pakketten vertegenwoordigen die moeten worden toegevoegd aan de Python-omgeving voor het experiment.

conda_dependencies_file_path
Vereist

Het relatieve pad naar het yaml-bestand van conda-afhankelijkheden. Indien opgegeven, installeert Azure ML geen frameworkgerelateerde pakketten.

VEROUDERD. Gebruik de conda_dependencies_file paramenter.

Geef een conda_dependencies_file_path van beide op of conda_dependencies_file. Als beide zijn opgegeven, conda_dependencies_file wordt gebruikt.

pip_requirements_file_path
Vereist

Het relatieve pad naar het tekstbestand met pip-vereisten.

VEROUDERD. Gebruik de pip_requirements_file parameter.

Dit kan worden opgegeven in combinatie met de pip_packages parameter. Geef een pip_requirements_file_path van beide op of pip_requirements_file. Als beide zijn opgegeven, pip_requirements_file wordt gebruikt.

pip_requirements_file
Vereist
str

Het relatieve pad naar het tekstbestand met pip-vereisten. Dit kan worden opgegeven in combinatie met de pip_packages parameter.

environment_variables
Vereist

Een woordenlijst met namen en waarden van omgevingsvariabelen. Deze omgevingsvariabelen worden ingesteld voor het proces waarin het gebruikersscript wordt uitgevoerd.

environment_definition
Vereist

De omgevingsdefinitie voor het experiment. Dit omvat PythonSection, DockerSection en omgevingsvariabelen. Elke omgevingsoptie die niet rechtstreeks via andere parameters aan de Estimator-constructie wordt blootgesteld, kan worden ingesteld met behulp van deze parameter. Als deze parameter is opgegeven, heeft deze voorrang op andere omgevingsgerelateerde parameters, zoals use_gpu, custom_docker_image, conda_packagesof pip_packages. Fouten worden gerapporteerd over ongeldige combinaties.

inputs
Vereist

Een lijst met DataReference objecten die DatasetConsumptionConfig als invoer moeten worden gebruikt.

source_directory_data_store
Vereist

Het back-upgegevensarchief voor de projectshare.

shm_size
Vereist

De grootte van het gedeelde geheugenblok van de Docker-container. Als dit niet is ingesteld, is de standaardwaarde

_disable_validation
Vereist

Schakel scriptvalidatie uit voordat het verzenden wordt uitgevoerd. De standaardwaarde is Waar.

_show_lint_warnings
Vereist

Waarschuwingen voor het linten van scripts weergeven. De standaardwaarde is Onwaar.

_show_package_warnings
Vereist

Pakketvalidatiewaarschuwingen weergeven. De standaardwaarde is Onwaar.