AutoMLStep Classe
Cria uma etapa do Pipeline do Azure ML que encapsula uma execução automatizada de ML.
Para obter um exemplo de como usar AutoMLStep, consulte o bloco de anotações https://aka.ms/pl-automl.
Inicializar um AutoMLStep.
Construtor
AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)
Parâmetros
| Nome | Description |
|---|---|
|
name
Obrigatório
|
O nome da etapa. |
|
automl_config
Obrigatório
|
Um objeto AutoMLConfig que define a configuração para esta execução do AutoML. |
|
inputs
|
Uma lista de associações de porta de entrada. Valor padrão: None
|
|
outputs
|
Uma lista de associações de porta de saída. Valor padrão: None
|
|
script_repl_params
|
Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}. Valor padrão: None
|
|
allow_reuse
|
Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações. A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados. Valor padrão: True
|
|
version
|
Uma versão a ser atribuída à etapa. Valor padrão: None
|
|
hash_paths
|
DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o Valor padrão: None
|
|
enable_default_model_output
|
Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe.
Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como Valor padrão: True
|
|
enable_default_metrics_output
|
Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe.
Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como Valor padrão: True
|
|
name
Obrigatório
|
O nome da etapa. |
|
automl_config
Obrigatório
|
Um AutoMLConfig que define a configuração para esta execução de AutoML. |
|
inputs
Obrigatório
|
Uma lista de associações de porta de entrada. |
|
outputs
Obrigatório
|
Uma lista de associações de porta de saída. |
|
script_repl_params
Obrigatório
|
Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}. |
|
script_repl_params
Obrigatório
|
Parâmetros opcionais a serem substituídos em um script. |
|
allow_reuse
Obrigatório
|
Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações. A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados. |
|
version
Obrigatório
|
Uma versão a ser atribuída à etapa. |
|
hash_paths
Obrigatório
|
DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o |
|
enable_default_model_output
Obrigatório
|
Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe.
Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como |
|
enable_default_metrics_output
Obrigatório
|
Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe.
Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como |
Comentários
Com a classe AutoMLStep, você pode executar seu fluxo de trabalho de ML automatizado em um pipeline do Azure Machine Learning. Os pipelines oferecem benefícios como repetibilidade, execuções autônomas, controle de versão e acompanhamento e modularidade para seu fluxo de trabalho de ML automatizado. Para obter mais informações, consulte o que são pipelines do Azure Machine Learning?.
Quando o fluxo de trabalho de ML automatizado estiver em um pipeline, você poderá agendar o pipeline para ser executado em um agendamento baseado em tempo ou em um agendamento baseado em alterações. Agendas baseadas em tempo são úteis para tarefas rotineiras, como monitoramento de descompasso de dados, enquanto agendamentos baseados em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, sua agenda pode sondar um repositório de blobs em que os dados estão sendo carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registrar uma nova versão do modelo depois que a execução for concluída. Para obter mais informações, consulte Agendar pipelines de machine learning e disparar uma execução de um pipeline do Machine Learning de um Aplicativo Lógico.
O exemplo a seguir mostra como criar um AutoMLStep.
automl_step = AutoMLStep(
name='automl_module',
automl_config=automl_config,
outputs=[metrics_data, model_data],
allow_reuse=True)
O exemplo completo está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
O exemplo a seguir mostra como usar o objeto AutoMLStep em um Pipeline.
from azureml.pipeline.core import Pipeline
pipeline = Pipeline(
description="pipeline_with_automlstep",
workspace=ws,
steps=[automl_step])
O exemplo completo está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
O exemplo acima mostra uma etapa no pipeline. No entanto, ao usar o AutoMLStep em um fluxo de trabalho de ML automatizado do mundo real, você terá pelo menos uma etapa de pipeline que executa a preparação de dados antes do AutoMLStep e outra etapa de pipeline depois disso registra o modelo. Por exemplo, desse tipo de fluxo de trabalho, consulte o bloco de anotações https://aka.ms/automl-retrain-pipeline.
Para gerenciar, verificar o status e obter detalhes de execução da execução do pipeline, use a AutoMLStepRun classe.
Para obter mais informações sobre o machine learning automatizado no Azure, consulte o artigo O que é machine learning automatizado?. Para obter mais informações sobre como configurar um experimento de ML automatizado sem usar um pipeline, consulte o artigo Configurar o experimento de ML automatizado no Python.
Métodos
| create_node |
Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado. Esse método não se destina a ser usado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um grafo de pipeline que representa o fluxo de trabalho. |
create_node
Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado.
Esse método não se destina a ser usado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um grafo de pipeline que representa o fluxo de trabalho.
create_node(graph, default_datastore, context)
Parâmetros
| Nome | Description |
|---|---|
|
graph
Obrigatório
|
O objeto de grafo ao qual adicionar o nó. |
|
default_datastore
Obrigatório
|
O armazenamento de dados padrão. |
|
context
Obrigatório
|
<xref:azureml.pipeline.core._GraphContext>
O contexto do grafo. |
Retornos
| Tipo | Description |
|---|---|
|
O nó criado. |
Atributos
AUTOML_CONFIG_PARAM_NAME
AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'
DEFAULT_METRIC_PREFIX
DEFAULT_METRIC_PREFIX = 'default_metrics_'
DEFAULT_MODEL_PREFIX
DEFAULT_MODEL_PREFIX = 'default_model_'