AutoMLStep Classe

Cria uma etapa do Pipeline do Azure ML que encapsula uma execução automatizada de ML.

Para obter um exemplo de utilização do AutoMLStep, consulte o bloco de notas https://aka.ms/pl-automl.

Inicialize um AutoMLStep.

Construtor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parâmetros

Name	Description
name Necessário	str O nome da etapa.
automl_config Necessário	AutoMLConfig Um objeto AutoMLConfig que define a configuração para esta execução AutoML.
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Uma lista de ligações de porta de entrada. Default value: None
outputs	list[Union[PipelineData, OutputPortBinding]] Uma lista de ligações de porta de saída. Default value: None
script_repl_params	dict Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}. Default value: None
allow_reuse	bool Indica se a etapa deve reutilizar os resultados anteriores ao ser executada novamente com as mesmas configurações. A reutilização está ativada por predefinição. Se o conteúdo da etapa (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizada. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Aprendizado de Máquina do Azure como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados. Default value: True
version	str Uma versão para atribuir à etapa. Default value: None
hash_paths	list PRETERIDO. Uma lista de caminhos para hash ao verificar alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o `path` parâmetro in AutoMLConfig são colocados em hash, exceto os arquivos listados em .amlignore ou .gitignore em `path`. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo da etapa de uma execução anterior. Default value: None
enable_default_model_output	bool Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como `False`. Default value: True
enable_default_metrics_output	bool Indica se todas as métricas de execução filho serão ou não adicionadas como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como `False`. Default value: True
name Necessário	str O nome da etapa.
automl_config Necessário	AutoMLConfig Um AutoMLConfig que define a configuração para esta execução AutoML.
inputs Necessário	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Uma lista de ligações de porta de entrada.
outputs Necessário	list[Union[PipelineData, OutputPortBinding]] Uma lista de ligações de porta de saída.
script_repl_params Necessário	dict Parâmetros opcionais a serem substituídos em um script, por exemplo {'param1': 'value1', 'param2': 'value2'}.
script_repl_params Necessário	Parâmetros opcionais a serem substituídos em um script.
allow_reuse Necessário	bool Indica se a etapa deve reutilizar os resultados anteriores ao ser executada novamente com as mesmas configurações. A reutilização está ativada por predefinição. Se o conteúdo da etapa (scripts/dependências), bem como as entradas e os parâmetros permanecerem inalterados, a saída da execução anterior desta etapa será reutilizada. Ao reutilizar a etapa, em vez de enviar o trabalho para computação, os resultados da execução anterior são imediatamente disponibilizados para quaisquer etapas subsequentes. Se você usar conjuntos de dados do Aprendizado de Máquina do Azure como entradas, a reutilização será determinada se a definição do conjunto de dados foi alterada, não se os dados subjacentes foram alterados.
version Necessário	str Uma versão para atribuir à etapa.
hash_paths Necessário	list PRETERIDO. Uma lista de caminhos para hash ao verificar alterações no conteúdo da etapa do pipeline. Por padrão, todos os arquivos sob o `path` parâmetro in AutoMLConfig são colocados em hash, exceto os arquivos listados em .amlignore ou .gitignore em `path`. Se não forem detetadas alterações, o pipeline reutiliza o conteúdo da etapa de uma execução anterior.
enable_default_model_output Necessário	bool Indica se o melhor modelo será ou não adicionado como uma saída padrão. Isso pode ser usado para recuperar o melhor modelo após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída do modelo padrão não for necessária, é recomendável definir esse parâmetro como `False`.
enable_default_metrics_output Necessário	bool Indica se todas as métricas de execução filho serão ou não adicionadas como uma saída padrão. Isso pode ser usado para recuperar as métricas de execução filho após a conclusão da execução usando a AutoMLStepRun classe. Observe que, se a saída de métricas padrão não for necessária, é recomendável definir esse parâmetro como `False`.

Observações

Com a classe AutoMLStep, você pode executar seu fluxo de trabalho de ML automatizado em um pipeline do Azure Machine Learning. Os pipelines oferecem benefícios como repetibilidade, execuções autônomas, controle de versão e rastreamento e modularidade para seu fluxo de trabalho de ML automatizado. Para obter mais informações, consulte O que são pipelines do Azure Machine Learning?.

Quando seu fluxo de trabalho de ML automatizado está em um pipeline, você pode programar o pipeline para ser executado em uma programação baseada em tempo ou em uma agenda baseada em alterações. As agendas baseadas em tempo são úteis para tarefas de rotina, como monitorar desvios de dados, enquanto as agendas baseadas em alterações são úteis para alterações irregulares ou imprevisíveis, como quando os dados são alterados. Por exemplo, sua agenda pode sondar um repositório de blob onde os dados estão sendo carregados e, em seguida, executar o pipeline novamente se os dados forem alterados e, em seguida, registrar uma nova versão do modelo quando a execução for concluída. Para obter mais informações, consulte Agendar pipelines de aprendizado de máquina e Acionar uma execução de um pipeline de aprendizado de máquina a partir de um aplicativo lógico.

O exemplo a seguir mostra como criar um AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

A amostra completa está disponível em https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

O exemplo a seguir mostra como usar o objeto AutoMLStep em um Pipelinearquivo .


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

O exemplo acima mostra uma etapa no pipeline. No entanto, ao usar o AutoMLStep em um fluxo de trabalho de ML automatizado do mundo real, você terá pelo menos uma etapa de pipeline que executa a preparação de dados antes do AutoMLStep e outra etapa de pipeline depois que registra o modelo. Para obter exemplo desse tipo de fluxo de trabalho, consulte o bloco de anotações https://aka.ms/automl-retrain-pipeline.

Para gerenciar, verificar o status e obter detalhes da execução do pipeline, use a AutoMLStepRun classe.

Para obter mais informações sobre o aprendizado de máquina automatizado no Azure, consulte o artigo O que é o aprendizado de máquina automatizado?. Para obter mais informações sobre como configurar um experimento de ML automatizado sem usar um pipeline, consulte o artigo Configurar experimento de ML automatizado em Python.

Métodos

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao gráfico fornecido.

Este método não se destina a ser utilizado diretamente. Quando um pipeline é instanciado com essa etapa, o Azure ML passa automaticamente os parâmetros necessários por meio desse método para que essa etapa possa ser adicionada a um gráfico de pipeline que representa o fluxo de trabalho.

create_node

Crie um nó a partir desta etapa do AutoML e adicione ao gráfico fornecido.

create_node(graph, default_datastore, context)

Parâmetros

Name	Description
graph Necessário	Graph O objeto gráfico ao qual adicionar o nó.
default_datastore Necessário	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] O armazenamento de dados padrão.
context Necessário	<xref:azureml.pipeline.core._GraphContext> O contexto do gráfico.

Devoluções

Tipo	Description
Node	O nó criado.

Atributos

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'

Feedback

Esta página foi útil?

Partilhar via

AutoMLStep Classe

Construtor

Parâmetros

Observações

Métodos

create_node

Parâmetros

Devoluções

Atributos

AUTOML_CONFIG_PARAM_NAME

DEFAULT_METRIC_PREFIX

DEFAULT_MODEL_PREFIX

Feedback