OutputPortBinding Classe
Define uma saída nomeada de uma etapa de pipeline.
OutputPortBinding pode ser usado para especificar o tipo de dados que serão produzidos por uma etapa e como os dados serão produzidos. Ele pode ser usado InputPortBinding para especificar que a saída da etapa é uma entrada necessária de outra etapa.
Inicializar OutputPortBinding.
Construtor
OutputPortBinding(name, datastore=None, output_name=None, bind_mode='mount', path_on_compute=None, is_directory=None, overwrite=None, data_type=None, pipeline_output_name=None, training_output=None, dataset_registration=None, dataset_output=None)
Parâmetros
| Nome | Description |
|---|---|
|
name
Obrigatório
|
Nome do objeto OutputPortBinding, que pode conter apenas letras, dígitos e sublinhados. |
|
datastore
|
Armazenamento de dados no qual o PipelineData residirá. Valor padrão: None
|
|
output_name
|
Nome da saída, se nenhum nome for usado. Pode conter apenas letras, dígitos e sublinhados. Valor padrão: None
|
|
bind_mode
|
Especifica se a etapa de produção usará o método "upload" ou "mount" ou "hdfs" para acessar os dados. Valor padrão: mount
|
|
path_on_compute
|
Para o modo "upload", o caminho no qual o módulo grava a saída. Valor padrão: None
|
|
is_directory
|
Se a saída é um diretório ou um único arquivo. Valor padrão: None
|
|
overwrite
|
Para o modo "upload", se deseja substituir os dados existentes. Valor padrão: None
|
|
data_type
|
Opcional. O tipo de dados pode ser usado para especificar o tipo esperado da saída e para detalhar como as etapas de consumo devem usar os dados. Pode ser qualquer cadeia de caracteres definida pelo usuário. Valor padrão: None
|
|
pipeline_output_name
|
Se fornecida, essa saída estará disponível usando PipelineRun.get_pipeline_output(). Os nomes de saída do pipeline devem ser exclusivos no pipeline. Valor padrão: None
|
|
training_output
|
Define a saída para o resultado do treinamento. Isso é necessário apenas para treinamentos específicos que resultam em diferentes tipos de saídas, como Métricas e Modelo. Por exemplo, AutoMLStep resulta em métricas e modelos. Você também pode definir uma iteração ou métrica de treinamento específica usada para obter o melhor modelo. Para HyperDriveStep, você também pode definir os arquivos de modelo específicos a serem incluídos na saída. Valor padrão: None
|
|
dataset_registration
|
Opcional. Esse é um parâmetro interno. Em vez disso, você deve usar PipelineData.as_dataset. Valor padrão: None
|
|
dataset_output
|
Opcional. Esse é um parâmetro interno. Você deve estar usando OutputFileDatasetConfig intead. Valor padrão: None
|
|
name
Obrigatório
|
Nome do objeto OutputPortBinding, que pode conter apenas letras, dígitos e sublinhados. |
|
datastore
Obrigatório
|
Armazenamento de dados no qual o PipelineData residirá. |
|
output_name
Obrigatório
|
Nome da saída, se nenhum nome for usado. Só pode conter letras, dígitos e sublinhados. |
|
bind_mode
Obrigatório
|
Especifica se a etapa de produção usará o método "upload" ou "mount" ou "hdfs" para acessar os dados. |
|
path_on_compute
Obrigatório
|
Para o modo "upload", o caminho no qual o módulo grava a saída. |
|
is_directory
Obrigatório
|
se a saída for um diretório |
|
overwrite
Obrigatório
|
Para o modo "upload", se deseja substituir os dados existentes. |
|
data_type
Obrigatório
|
Opcional. O tipo de dados pode ser usado para especificar o tipo esperado da saída e para detalhar como as etapas de consumo devem usar os dados. Pode ser qualquer cadeia de caracteres definida pelo usuário. |
|
pipeline_output_name
Obrigatório
|
Se fornecida, essa saída estará disponível usando PipelineRun.get_pipeline_output(). Os nomes de saída do pipeline devem ser exclusivos no pipeline. |
|
training_output
Obrigatório
|
Define a saída para o resultado do treinamento. Isso é necessário apenas para treinamentos específicos que resultam em diferentes tipos de saídas, como Métricas e Modelo. Por exemplo, AutoMLStep resulta em métricas e modelos. Você também pode definir uma iteração ou métrica de treinamento específica usada para obter o melhor modelo. Para HyperDriveStep, você também pode definir os arquivos de modelo específicos a serem incluídos na saída. |
|
dataset_registration
Obrigatório
|
Opcional. Esse é um parâmetro interno. Em vez disso, você deve usar PipelineData.as_dataset. |
|
dataset_output
Obrigatório
|
Opcional. Esse é um parâmetro interno. Você deve estar usando OutputFileDatasetConfig intead. |
Comentários
OutputPortBinding pode ser usado de maneira PipelineData semelhante à criação de um Pipeline para especificar entradas e saídas de etapa. A diferença é que OutputPortBinding precisa ser usado InputPortBinding para ser consumido como uma entrada para outra etapa.
Um exemplo para construir um Pipeline com OutputPortBinding é o seguinte:
from azureml.pipeline.core import OutputPortBinding, InputPortBinding, Pipeline
from azureml.pipeline.steps import PythonScriptStep
step_1_output = OutputPortBinding("output", datastore=datastore)
step_1 = PythonScriptStep(
name='process data',
script_name="process_data.py",
compute_target=compute,
arguments=["--output", step_1_output],
outputs=[step_1_output]
)
step_2_input = InputPortBinding("input", bind_object=step_1_output)
step_2 = PythonScriptStep(
name='train',
script_name="train.py",
compute_target=compute,
arguments=["--input", step_2_input],
inputs=[step_2_input]
)
pipeline = Pipeline(workspace=workspace, steps=[step_1, step_2])
Isso criará um Pipeline com duas etapas. A etapa do processo será executada primeiro e, depois de concluída, a etapa de trem será executada. O Azure ML fornecerá a saída produzida pela etapa de processo, conforme descrito pelo objeto OutputPortBinding, para a etapa de treinamento.
Atributos
bind_mode
Obtenha o modo ("upload" ou "mount" ou "hdfs") que a etapa de produção usará para criar os dados.
Retornos
| Tipo | Description |
|---|---|
|
O modo de associação. |
data_type
Obtenha o tipo de dados que serão produzidos.
Retornos
| Tipo | Description |
|---|---|
|
O nome do tipo de dados. |
dataset_registration
Obtenha as informações de registro do conjunto de dados.
Retornos
| Tipo | Description |
|---|---|
|
As informações de registro do conjunto de dados. |
datastore
Armazenamento de dados no qual o PipelineData residirá.
Retornos
| Tipo | Description |
|---|---|
|
O objeto Datastore. |
is_directory
name
overwrite
Para o modo "upload", indique se os dados existentes devem ser substituídos.
Retornos
| Tipo | Description |
|---|---|
|
_sobrescrever |
path_on_compute
Para o modo "upload", o caminho no qual o módulo grava a saída.
Retornos
| Tipo | Description |
|---|---|
|
path_on_compute |
pipeline_output_name
Obtenha o nome da saída do pipeline correspondente a este OutputPortBinding.
Retornos
| Tipo | Description |
|---|---|
|
O nome da saída do pipeline. |