AutoMLStep Classe

Cria uma etapa do Pipeline do Azure ML que encapsula uma execução automatizada de ML.

Para obter um exemplo de como usar AutoMLStep, consulte o bloco de anotações https://aka.ms/pl-automl.

Inicializar um AutoMLStep.

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

Nome	Description
name Obrigatório	str O nome da etapa.
automl_config Obrigatório	AutoMLConfig Um objeto AutoMLConfig que define a configuração para esta execução do AutoML.
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Uma lista de associações de porta de entrada. Valor padrão: None
outputs	list[Union[PipelineData, OutputPortBinding]] Uma lista de associações de porta de saída. Valor padrão: None
script_repl_params	dict Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}. Valor padrão: None
allow_reuse	bool Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações. A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados. Valor padrão: True
version	str Uma versão a ser atribuída à etapa. Valor padrão: None
hash_paths	list DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o `path` parâmetro em AutoMLConfig são hash, exceto arquivos listados em .amlignore ou .gitignore em `path`. Se não houver nenhuma alteração detectada, o pipeline reutilizará o conteúdo da etapa de uma execução anterior. Valor padrão: None
enable_default_model_output	bool Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como `False`. Valor padrão: True
enable_default_metrics_output	bool Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como `False`. Valor padrão: True
name Obrigatório	str O nome da etapa.
automl_config Obrigatório	AutoMLConfig Um AutoMLConfig que define a configuração para esta execução de AutoML.
inputs Obrigatório	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Uma lista de associações de porta de entrada.
outputs Obrigatório	list[Union[PipelineData, OutputPortBinding]] Uma lista de associações de porta de saída.
script_repl_params Obrigatório	dict Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.
script_repl_params Obrigatório	Parâmetros opcionais a serem substituídos em um script.
allow_reuse Obrigatório	bool Indica se a etapa deve reutilizar os resultados anteriores ao executar novamente com as mesmas configurações. A reutilização é habilitada por padrão. Se o conteúdo da etapa (scripts/dependências), bem como entradas e parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizado. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Azure Machine Learning como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.
version Obrigatório	str Uma versão a ser atribuída à etapa.
hash_paths Obrigatório	list DEPRECADO. Uma lista de caminhos para o hash ao verificar se há alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o `path` parâmetro em AutoMLConfig são hash, exceto arquivos listados em .amlignore ou .gitignore em `path`. Se não houver nenhuma alteração detectada, o pipeline reutilizará o conteúdo da etapa de uma execução anterior.
enable_default_model_output Obrigatório	bool Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como `False`.
enable_default_metrics_output Obrigatório	bool Indica se todas as métricas de execução filho serão adicionadas ou não como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como `False`.

Comentários

Com a classe AutoMLStep, você pode executar seu fluxo de trabalho de ML automatizado em um pipeline do Azure Machine Learning. Os pipelines oferecem benefícios como repetibilidade, execuções autônomas, controle de versão e acompanhamento e modularidade para seu fluxo de trabalho de ML automatizado. Para obter mais informações, consulte o que são pipelines do Azure Machine Learning?.

Quando o fluxo de trabalho de ML automatizado estiver em um pipeline, você poderá agendar o pipeline para ser executado em um agendamento baseado em tempo ou em um agendamento baseado em alterações. Agendas baseadas em tempo são úteis para tarefas rotineiras, como monitoramento de descompasso de dados, enquanto agendamentos baseados em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, sua agenda pode sondar um repositório de blobs em que os dados estão sendo carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registrar uma nova versão do modelo depois que a execução for concluída. Para obter mais informações, consulte Agendar pipelines de machine learning e disparar uma execução de um pipeline do Machine Learning de um Aplicativo Lógico.

O exemplo a seguir mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

O exemplo completo está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo a seguir mostra como usar o objeto AutoMLStep em um Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo acima mostra uma etapa no pipeline. No entanto, ao usar o AutoMLStep em um fluxo de trabalho de ML automatizado do mundo real, você terá pelo menos uma etapa de pipeline que executa a preparação de dados antes do AutoMLStep e outra etapa de pipeline depois disso registra o modelo. Por exemplo, desse tipo de fluxo de trabalho, consulte o bloco de anotações https://aka.ms/automl-retrain-pipeline.

Para gerenciar, verificar o status e obter detalhes de execução da execução do pipeline, use a AutoMLStepRun classe.

Para obter mais informações sobre o machine learning automatizado no Azure, consulte o artigo O que é machine learning automatizado?. Para obter mais informações sobre como configurar um experimento de ML automatizado sem usar um pipeline, consulte o artigo Configurar o experimento de ML automatizado no Python.

Métodos

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado.

Esse método não se destina a ser usado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um grafo de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao grafo especificado.

create_node(graph, default_datastore, context)

Parâmetros

Nome	Description
graph Obrigatório	Graph O objeto de grafo ao qual adicionar o nó.
default_datastore Obrigatório	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] O armazenamento de dados padrão.
context Obrigatório	<xref:azureml.pipeline.core._GraphContext> O contexto do grafo.

Retornos

Tipo	Description
Node	O nó criado.

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'

Comentários

Esta página foi útil?

Compartilhar via

AutoMLStep Classe

Construtor

Parâmetros

Comentários

Métodos

create_node

Parâmetros

Retornos

Atributos

AUTOML_CONFIG_PARAM_NAME

DEFAULT_METRIC_PREFIX

DEFAULT_MODEL_PREFIX

Comentários