Compartilhar via


AutoMLStep Classe

Cria uma etapa do Pipeline do Azure ML que encapsula uma execução automatizada de ML.

Para obter um exemplo de como usar AutoMLStep, consulte o bloco de anotações https://aka.ms/pl-automl.

Inicializar um AutoMLStep.

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

Nome Description
name
Obrigatório
str

O nome da etapa.

automl_config
Obrigatório

Um objeto AutoMLConfig que define a configuração para esta execução do AutoML.

inputs

Uma lista de associações de porta de entrada.

Valor padrão: None
outputs

Uma lista de associações de porta de saída.

Valor padrão: None
script_repl_params

Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

Valor padrão: None
allow_reuse

Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações.

A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.

Valor padrão: True
version
str

Uma versão a ser atribuída à etapa.

Valor padrão: None
hash_paths

DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline.

Por padrão, todos os arquivos sob o path parâmetro em AutoMLConfig são hash, exceto arquivos listados em .amlignore ou .gitignore em path. Se não houver nenhuma alteração detectada, o pipeline reutilizará o conteúdo da etapa de uma execução anterior.

Valor padrão: None
enable_default_model_output

Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como False.

Valor padrão: True
enable_default_metrics_output

Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como False.

Valor padrão: True
name
Obrigatório
str

O nome da etapa.

automl_config
Obrigatório

Um AutoMLConfig que define a configuração para esta execução de AutoML.

inputs
Obrigatório

Uma lista de associações de porta de entrada.

outputs
Obrigatório

Uma lista de associações de porta de saída.

script_repl_params
Obrigatório

Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Obrigatório

Parâmetros opcionais a serem substituídos em um script.

allow_reuse
Obrigatório

Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações.

A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.

version
Obrigatório
str

Uma versão a ser atribuída à etapa.

hash_paths
Obrigatório

DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline.

Por padrão, todos os arquivos sob o path parâmetro em AutoMLConfig são hash, exceto arquivos listados em .amlignore ou .gitignore em path. Se não houver nenhuma alteração detectada, o pipeline reutilizará o conteúdo da etapa de uma execução anterior.

enable_default_model_output
Obrigatório

Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como False.

enable_default_metrics_output
Obrigatório

Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como False.

Comentários

Com a classe AutoMLStep, você pode executar seu fluxo de trabalho de ML automatizado em um pipeline do Azure Machine Learning. Os pipelines oferecem benefícios como repetibilidade, execuções autônomas, controle de versão e acompanhamento e modularidade para seu fluxo de trabalho de ML automatizado. Para obter mais informações, consulte o que são pipelines do Azure Machine Learning?.

Quando o fluxo de trabalho de ML automatizado estiver em um pipeline, você poderá agendar o pipeline para ser executado em um agendamento baseado em tempo ou em um agendamento baseado em alterações. Agendas baseadas em tempo são úteis para tarefas rotineiras, como monitoramento de descompasso de dados, enquanto agendamentos baseados em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, sua agenda pode sondar um repositório de blobs em que os dados estão sendo carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registrar uma nova versão do modelo depois que a execução for concluída. Para obter mais informações, consulte Agendar pipelines de machine learning e disparar uma execução de um pipeline do Machine Learning de um Aplicativo Lógico.

O exemplo a seguir mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

O exemplo completo está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo a seguir mostra como usar o objeto AutoMLStep em um Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo completo está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo acima mostra uma etapa no pipeline. No entanto, ao usar o AutoMLStep em um fluxo de trabalho de ML automatizado do mundo real, você terá pelo menos uma etapa de pipeline que executa a preparação de dados antes do AutoMLStep e outra etapa de pipeline depois disso registra o modelo. Por exemplo, desse tipo de fluxo de trabalho, consulte o bloco de anotações https://aka.ms/automl-retrain-pipeline.

Para gerenciar, verificar o status e obter detalhes de execução da execução do pipeline, use a AutoMLStepRun classe.

Para obter mais informações sobre o machine learning automatizado no Azure, consulte o artigo O que é machine learning automatizado?. Para obter mais informações sobre como configurar um experimento de ML automatizado sem usar um pipeline, consulte o artigo Configurar o experimento de ML automatizado no Python.

Métodos

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado.

Esse método não se destina a ser usado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um grafo de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado.

Esse método não se destina a ser usado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um grafo de pipeline que representa o fluxo de trabalho.

create_node(graph, default_datastore, context)

Parâmetros

Nome Description
graph
Obrigatório

O objeto de grafo ao qual adicionar o nó.

default_datastore
Obrigatório

O armazenamento de dados padrão.

context
Obrigatório
<xref:azureml.pipeline.core._GraphContext>

O contexto do grafo.

Retornos

Tipo Description

O nó criado.

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'