Partilhar via


AutoMLStep Classe

Cria uma etapa do Pipeline do Azure ML que encapsula uma execução automatizada de ML.

Para obter um exemplo de utilização do AutoMLStep, consulte o bloco de notas https://aka.ms/pl-automl.

Inicialize um AutoMLStep.

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

Name Description
name
Necessário
str

O nome da etapa.

automl_config
Necessário

Um objeto AutoMLConfig que define a configuração para esta execução AutoML.

inputs

Uma lista de ligações de porta de entrada.

Default value: None
outputs

Uma lista de ligações de porta de saída.

Default value: None
script_repl_params

Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

Default value: None
allow_reuse

Indica se a etapa deve reutilizar os resultados anteriores ao ser executada novamente com as mesmas configurações.

A reutilização está ativada por predefinição. Se o conteúdo da etapa (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizada. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Aprendizado de Máquina do Azure como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.

Default value: True
version
str

Uma versão para atribuir à etapa.

Default value: None
hash_paths

PRETERIDO. Uma lista de caminhos para hash ao verificar alterações no conteúdo da etapa do pipeline.

Por padrão, todos os arquivos sob o path parâmetro in AutoMLConfig são colocados em hash, exceto os arquivos listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo da etapa de uma execução anterior.

Default value: None
enable_default_model_output

Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como False.

Default value: True
enable_default_metrics_output

Indica se todas as métricas de execução filho serão ou não adicionadas como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como False.

Default value: True
name
Necessário
str

O nome da etapa.

automl_config
Necessário

Um AutoMLConfig que define a configuração para esta execução AutoML.

inputs
Necessário

Uma lista de ligações de porta de entrada.

outputs
Necessário

Uma lista de ligações de porta de saída.

script_repl_params
Necessário

Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Necessário

Parâmetros opcionais a serem substituídos em um script.

allow_reuse
Necessário

Indica se a etapa deve reutilizar os resultados anteriores ao ser executada novamente com as mesmas configurações.

A reutilização está ativada por predefinição. Se o conteúdo da etapa (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizada. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Aprendizado de Máquina do Azure como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.

version
Necessário
str

Uma versão para atribuir à etapa.

hash_paths
Necessário

PRETERIDO. Uma lista de caminhos para hash ao verificar alterações no conteúdo da etapa do pipeline.

Por padrão, todos os arquivos sob o path parâmetro in AutoMLConfig são colocados em hash, exceto os arquivos listados em .amlignore ou .gitignore em path. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo da etapa de uma execução anterior.

enable_default_model_output
Necessário

Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como False.

enable_default_metrics_output
Necessário

Indica se todas as métricas de execução filho serão ou não adicionadas como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como False.

Observações

Com a classe AutoMLStep, você pode executar seu fluxo de trabalho de ML automatizado em um pipeline do Azure Machine Learning. Os pipelines oferecem benefícios como repetibilidade, execuções autônomas, controle de versão e rastreamento e modularidade para seu fluxo de trabalho de ML automatizado. Para obter mais informações, consulte O que são pipelines do Azure Machine Learning?.

Quando seu fluxo de trabalho de ML automatizado está em um pipeline, você pode programar o pipeline para ser executado em uma programação baseada em tempo ou em uma agenda baseada em alterações. As agendas baseadas em tempo são úteis para tarefas de rotina, como monitorar desvios de dados, enquanto as agendas baseadas em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, sua agenda pode sondar um repositório de blob onde os dados estão sendo carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registrar uma nova versão do modelo quando a execução for concluída. Para obter mais informações, consulte Agendar pipelines de aprendizado de máquina e Acionar uma execução de um pipeline de aprendizado de máquina a partir de um aplicativo lógico.

O exemplo a seguir mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

A amostra completa está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo a seguir mostra como usar o objeto AutoMLStep em um Pipelinearquivo .


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

A amostra completa está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo acima mostra uma etapa no pipeline. No entanto, ao usar o AutoMLStep em um fluxo de trabalho de ML automatizado do mundo real, você terá pelo menos uma etapa de pipeline que executa a preparação de dados antes do AutoMLStep e outra etapa de pipeline depois que registra o modelo. Para obter exemplo desse tipo de fluxo de trabalho, consulte o bloco de anotações https://aka.ms/automl-retrain-pipeline.

Para gerenciar, verificar o status e obter detalhes da execução do pipeline, use a AutoMLStepRun classe.

Para obter mais informações sobre o aprendizado de máquina automatizado no Azure, consulte o artigo O que é o aprendizado de máquina automatizado?. Para obter mais informações sobre como configurar um experimento de ML automatizado sem usar um pipeline, consulte o artigo Configurar experimento de ML automatizado em Python.

Métodos

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao gráfico fornecido.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um gráfico de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao gráfico fornecido.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um gráfico de pipeline que representa o fluxo de trabalho.

create_node(graph, default_datastore, context)

Parâmetros

Name Description
graph
Necessário

O objeto gráfico ao qual adicionar o nó.

default_datastore
Necessário

O armazenamento de dados padrão.

context
Necessário
<xref:azureml.pipeline.core._GraphContext>

O contexto do gráfico.

Devoluções

Tipo Description

O nó criado.

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'