Compartilhar via


Estimator Classe

Representa um avaliador genérico para treinar dados usando qualquer estrutura fornecida.

DEPRECADO. Use o ScriptRunConfig objeto com seu próprio ambiente definido ou um ambiente com curadoria do Azure ML. Para obter uma introdução à configuração de execuções de experimento com ScriptRunConfig, consulte Configurar e enviar execuções de treinamento.

Essa classe foi projetada para uso com estruturas de machine learning que ainda não têm um avaliador pré-configurado do Azure Machine Learning. Estimadores pré-configurados existem para Chainer, PyTorche TensorFlowSKLearn. Para criar um Avaliador que não esteja pré-configurado, consulte Treinar modelos com o Azure Machine Learning usando o avaliador.

A classe Estimador encapsula as informações de configuração de execução para ajudar a simplificar as tarefas de especificar como um script é executado. Ele dá suporte à execução de nó único, bem como a execução de vários nós. Executar o avaliador produz um modelo no diretório de saída especificado em seu script de treinamento.

Inicialize o avaliador.

azureml.core.environment._DEFAULT_SHM_SIZE é usado. Para obter mais informações, confira Referência sobre docker run. :type shm_size: str :p aram resume_from: o caminho de dados que contém os arquivos de ponto de verificação ou modelo dos quais retomar o experimento. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: o tempo máximo permitido para a execução. O Azure ML tentará automaticamente

cancele a execução se demorar mais do que esse valor.

Construtor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parâmetros

Nome Description
source_directory
Obrigatório
str

Um diretório local que contém a configuração do experimento e os arquivos de código necessários para um trabalho de treinamento.

compute_target
Obrigatório

O destino de computação em que o treinamento ocorrerá. Isso pode ser um objeto ou a cadeia de caracteres "local".

vm_size
Obrigatório
str

O tamanho da VM do destino de computação que será criado para o treinamento. Valores com suporte: qualquer tamanho de VM do Azure.

vm_priority
Obrigatório
str

A prioridade da VM do destino de computação que será criado para o treinamento. Se não for especificado, 'dedicado' será usado.

Valores com suporte: 'dedicado' e 'lowpriority'.

Isso só entra em vigor quando o vm_size parâmetro é especificado na entrada.

entry_script
Obrigatório
str

O caminho relativo para o arquivo usado para iniciar o treinamento.

script_params
Obrigatório

Um dicionário de argumentos de linha de comando a serem passados para o script de treinamento especificado em entry_script.

node_count
Obrigatório
int

O número de nós no destino de computação usado para treinamento. Se for maior que 1, um trabalho distribuído de MPI será executado.

process_count_per_node
Obrigatório
int

O número de processos (ou "trabalhos") a serem executados em cada nó. Se for maior que 1, um trabalho distribuído de MPI será executado. Somente o AmlCompute destino tem suporte para trabalhos distribuídos.

distributed_backend
Obrigatório
str

O back-end de comunicação para treinamento distribuído.

DEPRECADO. Use o parâmetro distributed_training.

Valores com suporte: 'mpi'. 'mpi' representa MPI/Horovod.

Esse parâmetro é necessário quando node_count ou process_count_per_node> 1.

Quando node_count == 1 e process_count_per_node == 1, nenhum back-end será usado, a menos que o back-end seja definido explicitamente. Somente o AmlCompute destino tem suporte para treinamento distribuído.

distributed_training
Obrigatório
Mpi

Parâmetros para executar um trabalho de treinamento distribuído.

Para executar um trabalho distribuído com back-end de MPI, use Mpi o objeto para especificar process_count_per_node.

use_gpu
Obrigatório

Indica se o ambiente para executar o experimento deve dar suporte a GPUs. Se for true, uma imagem do Docker padrão baseada em GPU será usada no ambiente. Se for falso, uma imagem baseada em CPU será usada. As imagens padrão do Docker (CPU ou GPU) serão usadas somente se o custom_docker_image parâmetro não estiver definido. Essa configuração é usada somente em destinos de computação habilitados para Docker.

use_docker
Obrigatório

Especifica se o ambiente para executar o experimento deve ser baseado no Docker.

custom_docker_base_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada.

DEPRECADO. Use o parâmetro custom_docker_image.

Se não for definido, uma imagem baseada em CPU padrão será usada como a imagem base.

custom_docker_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada. Se não for definido, uma imagem baseada em CPU padrão será usada como a imagem base. Especifique apenas as imagens disponíveis nos repositórios públicos do Docker (Hub do Docker). Para usar uma imagem de um repositório do Docker privado, use o parâmetro do environment_definition construtor.

image_registry_details
Obrigatório

Os detalhes do registro de imagem do Docker.

user_managed
Obrigatório

Especifica se o Azure ML reutiliza um ambiente python existente. Se for falso, um ambiente python será criado com base na especificação de dependências do Conda.

conda_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.

pip_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.

conda_dependencies_file_path
Obrigatório
str

O caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura.

DEPRECADO. Use o conda_dependencies_file paramenter.

Especifique conda_dependencies_file_path ou conda_dependencies_file. Se ambos forem especificados, conda_dependencies_file será usado.

pip_requirements_file_path
Obrigatório
str

O caminho relativo para o arquivo de texto de requisitos pip.

DEPRECADO. Use o parâmetro pip_requirements_file.

Esse parâmetro pode ser especificado em combinação com o pip_packages parâmetro. Especifique pip_requirements_file_path ou pip_requirements_file. Se ambos forem especificados, pip_requirements_file será usado.

conda_dependencies_file
Obrigatório
str

O caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura.

pip_requirements_file
Obrigatório
str

O caminho relativo para o arquivo de texto de requisitos pip. Esse parâmetro pode ser especificado em combinação com o pip_packages parâmetro.

environment_variables
Obrigatório

Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.

environment_definition
Obrigatório

A definição de ambiente para o experimento. Ele inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente por meio de outros parâmetros para a construção do Avaliador pode ser definida usando esse parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, comouse_gpu, , custom_docker_imageconda_packagesou pip_packages. Erros serão relatados em combinações inválidas.

inputs
Obrigatório

Uma lista de DataReference objetos ou DatasetConsumptionConfig objetos a serem usados como entrada.

source_directory_data_store
Obrigatório

O repositório de dados de backup para o compartilhamento de projeto.

shm_size
Obrigatório
str

O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, o azureml.core.environment._DEFAULT_SHM_SIZE padrão será usado. Para obter mais informações, confira Referência sobre docker run.

resume_from
Obrigatório

O caminho de dados que contém o ponto de verificação ou os arquivos de modelo dos quais retomar o experimento.

max_run_duration_seconds
Obrigatório
int

O tempo máximo permitido para a execução. O Azure ML tentará cancelar automaticamente a execução se demorar mais do que esse valor.

source_directory
Obrigatório
str

Um diretório local que contém a configuração do experimento e os arquivos de código necessários para um trabalho de treinamento.

compute_target
Obrigatório

O destino de computação em que o treinamento ocorrerá. Isso pode ser um objeto ou a cadeia de caracteres "local".

vm_size
Obrigatório
str

O tamanho da VM do destino de computação que será criado para o treinamento. Valores com suporte: qualquer tamanho de VM do Azure.

vm_priority
Obrigatório
str

A prioridade da VM do destino de computação que será criado para o treinamento. Se não for especificado, 'dedicado' será usado.

Valores com suporte: 'dedicado' e 'lowpriority'.

Isso só entra em vigor quando o vm_size parâmetro é especificado na entrada.

entry_script
Obrigatório
str

O caminho relativo para o arquivo usado para iniciar o treinamento.

script_params
Obrigatório

Um dicionário de argumentos de linha de comando a serem passados para o script de treinamento especificado em entry_script.

node_count
Obrigatório
int

O número de nós no destino de computação usado para treinamento. Se for maior que 1, um trabalho distribuído de MPI será executado. Somente o AmlCompute destino tem suporte para trabalhos distribuídos.

process_count_per_node
Obrigatório
int

O número de processos por nó. Se for maior que 1, um trabalho distribuído de MPI será executado. Somente o AmlCompute destino tem suporte para trabalhos distribuídos.

distributed_backend
Obrigatório
str

O back-end de comunicação para treinamento distribuído.

DEPRECADO. Use o parâmetro distributed_training.

Valores com suporte: 'mpi'. 'mpi' representa MPI/Horovod.

Esse parâmetro é necessário quando node_count ou process_count_per_node> 1.

Quando node_count == 1 e process_count_per_node == 1, nenhum back-end será usado, a menos que o back-end seja definido explicitamente. Somente o AmlCompute destino tem suporte para treinamento distribuído.

distributed_training
Obrigatório
Mpi

Parâmetros para executar um trabalho de treinamento distribuído.

Para executar um trabalho distribuído com back-end de MPI, use Mpi o objeto para especificar process_count_per_node.

use_gpu
Obrigatório

Especifica se o ambiente para executar o experimento deve dar suporte a GPUs. Se for true, uma imagem do Docker padrão baseada em GPU será usada no ambiente. Se for falso, uma imagem baseada em CPU será usada. As imagens padrão do Docker (CPU ou GPU) serão usadas somente se o custom_docker_image parâmetro não estiver definido. Essa configuração é usada somente em destinos de computação habilitados para Docker.

use_docker
Obrigatório

Especifica se o ambiente para executar o experimento deve ser baseado no Docker.

custom_docker_base_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada.

DEPRECADO. Use o parâmetro custom_docker_image.

Se não for definido, uma imagem baseada em CPU padrão será usada como a imagem base.

custom_docker_image
Obrigatório
str

O nome da imagem do Docker da qual a imagem a ser usada para treinamento será criada. Se não for definido, uma imagem baseada em CPU padrão será usada como a imagem base. Especifique apenas as imagens disponíveis nos repositórios públicos do Docker (Hub do Docker). Para usar uma imagem de um repositório do Docker privado, use o parâmetro do environment_definition construtor.

image_registry_details
Obrigatório

Os detalhes do registro de imagem do Docker.

user_managed
Obrigatório

Especifica se o Azure ML reutiliza um ambiente python existente. Se for falso, um ambiente python será criado com base na especificação de dependências do Conda.

conda_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes conda a serem adicionados ao ambiente Python para o experimento.

pip_packages
Obrigatório

Uma lista de cadeias de caracteres que representam pacotes pip a serem adicionados ao ambiente Python para o experimento.

conda_dependencies_file_path
Obrigatório

O caminho relativo para o arquivo yaml de dependências conda. Se especificado, o Azure ML não instalará nenhum pacote relacionado à estrutura.

DEPRECADO. Use o conda_dependencies_file paramenter.

Especifique conda_dependencies_file_path ou conda_dependencies_file. Se ambos forem especificados, conda_dependencies_file será usado.

pip_requirements_file_path
Obrigatório

O caminho relativo para o arquivo de texto de requisitos pip.

DEPRECADO. Use o parâmetro pip_requirements_file.

Isso pode ser fornecido em combinação com o pip_packages parâmetro. Especifique pip_requirements_file_path ou pip_requirements_file. Se ambos forem especificados, pip_requirements_file será usado.

pip_requirements_file
Obrigatório
str

O caminho relativo para o arquivo de texto de requisitos pip. Isso pode ser fornecido em combinação com o pip_packages parâmetro.

environment_variables
Obrigatório

Um dicionário de valores e nomes de variáveis de ambiente. Essas variáveis de ambiente são definidas no processo em que o script do usuário está sendo executado.

environment_definition
Obrigatório

A definição de ambiente para o experimento. Ele inclui PythonSection, DockerSection e variáveis de ambiente. Qualquer opção de ambiente não exposta diretamente por meio de outros parâmetros para a construção do Avaliador pode ser definida usando esse parâmetro. Se esse parâmetro for especificado, ele terá precedência sobre outros parâmetros relacionados ao ambiente, comouse_gpu, , custom_docker_imageconda_packagesou pip_packages. Erros serão relatados em combinações inválidas.

inputs
Obrigatório

Uma lista de DataReference objetos ou DatasetConsumptionConfig objetos a serem usados como entrada.

source_directory_data_store
Obrigatório

O repositório de dados de backup para o compartilhamento de projeto.

shm_size
Obrigatório

O tamanho do bloco de memória compartilhada do contêiner do Docker. Se não for definido, o padrão

_disable_validation
Obrigatório

Desabilite a validação de script antes de executar o envio. O padrão é True.

_show_lint_warnings
Obrigatório

Mostrar avisos de linting de script. O padrão é False.

_show_package_warnings
Obrigatório

Mostrar avisos de validação de pacote. O padrão é False.