core Pacote
Contém a funcionalidade principal para pipelines do Azure Machine Learning, que são fluxos de trabalho configuráveis de machine learning.
Os pipelines do Azure Machine Learning permitem criar fluxos de trabalho reutilizáveis de machine learning que podem ser usados como um modelo para seus cenários de machine learning. Esse pacote contém a funcionalidade principal para trabalhar com pipelines do Azure ML e normalmente é usado junto com as classes no steps pacote.
Um pipeline de machine learning é representado por uma coleção de PipelineStep objetos que podem ser sequenciados e paralelizados ou criados com dependências explícitas entre as etapas. As etapas de pipeline são usadas para definir um Pipeline objeto que representa o fluxo de trabalho a ser executado. Você pode criar e trabalhar com pipelines em um Jupyter Notebook ou qualquer outro IDE com o SDK do Azure ML instalado.
Os pipelines do Azure ML permitem que você se concentre no aprendizado de máquina em vez de na infraestrutura. Para começar a criar um pipeline, consulte https://aka.ms/pl-first-pipeline.
Para obter mais informações sobre os benefícios do Pipeline do Machine Learning e como ele está relacionado a outros pipelines oferecidos pelo Azure, consulte O que são pipelines de ML no serviço do Azure Machine Learning?
Módulos
| builder |
Define classes para criar um pipeline do Azure Machine Learning. Um grafo de pipeline é composto por etapas de pipeline (PipelineStep), dados opcionais de pipeline (PipelineData) produzidos ou consumidos em cada etapa e uma sequência de execução de etapa opcional (StepSequence). |
| graph |
Define classes para construir grafos de pipeline do Azure Machine Learning. Os grafos de pipeline do Azure ML são criados para Pipeline objetos, quando você usa PipelineStep (e classes derivadas) PipelineDatae PipelineData objetos. Em casos de uso típicos, você não precisará usar diretamente as classes neste módulo. Um grafo de execução de pipeline consiste em nós de módulo que representam unidades básicas, como uma fonte de dados ou uma etapa. Nós podem ter portas de entrada e portas de saída e parâmetros associados. As bordas definem relações entre duas portas de nó em um grafo. |
| module |
Contém classes para criar e gerenciar unidades computacionais reutilizáveis de um pipeline do Azure Machine Learning. Os módulos permitem que você crie unidades computacionais em uma Pipeline, que pode ter entradas, saídas e contar com parâmetros e uma configuração de ambiente para operar. Um módulo pode ser versão e usado em pipelines diferentes do Azure Machine Learning, ao contrário PipelineStep (e classes derivadas) que são usados em um pipeline. Os módulos foram projetados para serem reutilizados em vários pipelines e podem evoluir para adaptar uma lógica de computação específica para diferentes casos de uso. Uma etapa em um pipeline pode ser usada em iterações rápidas para melhorar um algoritmo e, depois que a meta é alcançada, o algoritmo geralmente é publicado como um módulo para habilitar a reutilização. |
| module_step_base |
Contém a funcionalidade para adicionar uma etapa a um pipeline usando uma versão de um Module. |
| pipeline |
Define a classe para criar fluxos de trabalho reutilizáveis do Azure Machine Learning. |
| pipeline_draft |
Define classes para gerenciar pipelines mutáveis. |
| pipeline_endpoint |
Define classes para gerenciar pipelines, incluindo controle de versão e pontos de extremidade. |
| pipeline_output_dataset |
Contém a funcionalidade para promover uma saída intermediária para um Conjunto de Dados do Azure Machine Learning. Dados intermediários (saída) em um pipeline por padrão não se tornarão um Conjunto de Dados do Azure Machine Learning. Para promover dados intermediários para um conjunto de dados do Azure Machine Learning, chame o as_dataset método na classe PipelineData para retornar um PipelineOutputFileDataset objeto. Em um objeto PipelineOutputFileDataset, você pode criar um PipelineOutputTabularDataset objeto. |
| run |
Define classes para pipelines enviados, incluindo classes para verificar o status e recuperar detalhes de execução. |
| schedule |
Define classes para agendar envios de Pipelines do Azure Machine Learning. |
Classes
| InputPortBinding |
Define uma associação de uma origem para uma entrada de uma etapa de pipeline. Um InputPortBinding pode ser usado como uma entrada para uma etapa. A origem pode ser umPipelineData, PortDataReference, , DataReferencePipelineDatasetou OutputPortBinding. InputPortBinding é útil para especificar o nome da entrada da etapa, se ele deve ser diferente do nome do objeto bind (ou seja, para evitar nomes de entrada/saída duplicados ou porque o script de etapa precisa de uma entrada para ter um determinado nome). Ele também pode ser usado para especificar o bind_mode para PythonScriptStep entradas. Inicializar InputPortBinding. |
| Module |
Representa uma unidade de computação usada em um pipeline do Azure Machine Learning. Um módulo é uma coleção de arquivos que será executado em um destino de computação e uma descrição de uma interface. A coleção de arquivos pode ser script, binários ou quaisquer outros arquivos necessários para serem executados no destino de computação. A interface do módulo descreve entradas, saídas e definições de parâmetro. Ele não os associa a valores ou dados específicos. Um módulo tem um instantâneo associado a ele, que captura a coleção de arquivos definidos para o módulo. Inicializar Módulo. |
| ModuleVersion |
Representa a unidade de computação real dentro de um Module. Você não deve usar essa classe diretamente. Em vez disso, use um dos métodos de publicação da Module classe. Inicializar ModuleVersion. |
| ModuleVersionDescriptor |
Define a versão e a ID de um ModuleVersion. Inicializar ModuleVersionDescriptor. |
| OutputPortBinding |
Define uma saída nomeada de uma etapa de pipeline. OutputPortBinding pode ser usado para especificar o tipo de dados que serão produzidos por uma etapa e como os dados serão produzidos. Ele pode ser usado InputPortBinding para especificar que a saída da etapa é uma entrada necessária de outra etapa. Inicializar OutputPortBinding. |
| Pipeline |
Representa uma coleção de etapas que podem ser executadas como um fluxo de trabalho reutilizável do Azure Machine Learning. Use um Pipeline para criar e gerenciar fluxos de trabalho que unem várias fases de aprendizado de máquina. Cada fase de aprendizado de máquina, como preparação de dados e treinamento de modelo, pode consistir em uma ou mais etapas em um Pipeline. Para obter uma visão geral de por que e quando usar Pipelines, consulte https://aka.ms/pl-concept. Para obter uma visão geral sobre como construir um Pipeline, consulte https://aka.ms/pl-first-pipeline. Inicializar o Pipeline. |
| PipelineData |
Representa dados intermediários em um pipeline do Azure Machine Learning. Os dados usados no pipeline podem ser produzidos por uma etapa e consumidos em outra etapa, fornecendo um objeto PipelineData como uma saída de uma etapa e uma entrada de uma ou mais etapas subsequentes. Observe que se você estiver usando os dados do pipeline, verifique se o diretório usado existe. Um exemplo do Python para garantir que o diretório exista, suponha que você tenha uma porta de saída chamada output_folder em uma etapa de pipeline, você deseja gravar alguns dados no caminho relativo nesta pasta.
PipelineData use DataReference subjacente, que não é mais a abordagem recomendada para acesso e entrega de dados, use OutputFileDatasetConfig em vez disso, você pode encontrar um exemplo aqui: Pipeline usando OutputFileDatasetConfig. Inicializar PipelineData. |
| PipelineDataset |
Atua como um adaptador para Conjunto de Dados e Pipeline. Observação Essa classe foi preterida. Saiba como usar o conjunto de dados com o pipeline, confira https://aka.ms/pipeline-with-dataset. Essa é uma classe interna. Você não deve criar essa classe diretamente, mas sim chamar os métodos de instância as_* no conjunto de dados ou nas classes OutputDatasetConfig. Atuar como um adaptador para Conjunto de Dados e Pipeline. Essa é uma classe interna. Você não deve criar essa classe diretamente, mas sim chamar os métodos de instância as_* no conjunto de dados ou nas classes OutputDatasetConfig. |
| PipelineDraft |
Representa um pipeline mutável que pode ser usado para enviar execuções e criar Pipelines Publicados. Use PipelineDrafts para iterar em Pipelines. PipelineDrafts podem ser criados do zero, outro PipelineDraft ou pipelines existentes: Pipeline, PublishedPipelineou PipelineRun. Inicializar PipelineDraft. |
| PipelineEndpoint |
Representa um Pipeline fluxo de trabalho que pode ser disparado de uma URL de ponto de extremidade exclusiva. PipelineEndpoints pode ser usado para criar novas versões de um PublishedPipeline enquanto mantém o mesmo ponto de extremidade. PipelineEndpoints são nomeados exclusivamente em um workspace. Usando o atributo de ponto de extremidade de um objeto PipelineEndpoint, você pode disparar novas execuções de pipeline de aplicativos externos com chamadas REST. Para obter informações sobre como autenticar ao chamar pontos de extremidade REST, consulte https://aka.ms/pl-restep-auth. Para obter mais informações sobre como criar e executar pipelines de machine learning, consulte https://aka.ms/pl-first-pipeline. Inicializar PipelineEndpoint. |
| PipelineParameter |
Define um parâmetro em uma execução de pipeline. Use PipelineParameters para construir Pipelines versáteis que podem ser reenviado posteriormente com valores de parâmetros variados. Inicializar parâmetros de pipeline. |
| PipelineRun |
Representa uma execução de um Pipeline. Essa classe pode ser usada para gerenciar, verificar o status e recuperar detalhes de execução depois que uma execução de pipeline é enviada. Use get_steps para recuperar os StepRun objetos criados pela execução do pipeline. Outros usos incluem recuperar o Graph objeto associado à execução do pipeline, buscar o status da execução do pipeline e aguardar a conclusão da execução. Inicializar uma execução de Pipeline. |
| PipelineStep |
Representa uma etapa de execução em um pipeline do Azure Machine Learning. Os pipelines são construídos a partir de várias etapas de pipeline, que são unidades computacionais distintas no pipeline. Cada etapa pode ser executada de forma independente e usar recursos de computação isolados. Cada etapa normalmente tem suas próprias entradas nomeadas, saídas e parâmetros. A classe PipelineStep é a classe base da qual outras classes de etapas internas projetadas para cenários comuns herdam, como PythonScriptStep, DataTransferStepe HyperDriveStep. Para obter uma visão geral de como pipelines e PipelineSteps se relacionam, consulte o que são pipelines de ML. Inicializar PipelineStep. |
| PortDataReference |
Modela dados associados a uma saída de um StepRun concluído. Um objeto PortDataReference pode ser usado para baixar os dados de saída que foram produzidos por um StepRun. Ele também pode ser usado como uma entrada de etapa em um pipeline futuro. Inicializar PortDataReference. |
| PublishedPipeline |
Representa um Pipeline a ser enviado sem o código Python que o construiu. Além disso, um PublishedPipeline pode ser usado para reenviar um Pipeline com valores e entradas diferentes PipelineParameter . Inicializar PublishedPipeline. :p o ponto de extremidade REST A URL do ponto de extremidade REST para enviar execuções de pipeline para esse pipeline. :type endpoint: str :p aram total_run_steps: o número de etapas neste pipeline :type total_run_steps: int :p aram workspace: o workspace do pipeline publicado. :type workspace: azureml.core.Workspace :p aram continue_on_step_failure: Se deve continuar a execução de outras etapas no PipelineRun se uma etapa falhar, o padrão será false. |
| Schedule |
Define um agendamento no qual enviar um pipeline. Depois que um Pipeline é publicado, um Agendamento pode ser usado para enviar o Pipeline em um intervalo especificado ou quando são detectadas alterações em um local de armazenamento de Blobs. Inicializar Agendamento. |
| ScheduleRecurrence |
Define a frequência, o intervalo e a hora de início de um pipeline Schedule. ScheduleRecurrence também permite que você especifique o fuso horário e as horas ou minutos ou dias da semana para a recorrência. Inicializar uma recorrência de agendamento. Ele também permite especificar o fuso horário e as horas ou minutos ou dias semanais para a recorrência. |
| StepRun |
Uma execução de uma etapa em um Pipeline. Essa classe pode ser usada para gerenciar, verificar o status e recuperar detalhes de execução depois que a execução do pipeline pai for enviada e o pipeline tiver enviado a execução da etapa. Inicializar um StepRun. |
| StepRunOutput |
Representa uma saída criada por um StepRun em um Pipeline. StepRunOutput pode ser usado para acessar o PortDataReference criado pela etapa. Inicializar StepRunOutput. |
| StepSequence |
Representa uma lista de etapas em uma Pipeline e a ordem na qual executá-las. Use um StepSequence ao inicializar um pipeline para criar um fluxo de trabalho que contenha etapas a serem executadas em uma ordem específica. Inicializar StepSequence. |
| TrainingOutput |
Define uma saída especializada de determinados PipelineSteps para uso em um pipeline. O TrainingOutput permite que um modelo ou métrica de machine learning automatizado seja disponibilizado como uma saída de etapa a ser consumida por outra etapa em um Pipeline do Azure Machine Learning. Pode ser usado com AutoMLStep ou HyperDriveStep. Inicializar TrainingOutput. param model_file: o arquivo de modelo específico a ser incluído na saída. Apenas para HyperDriveStep . |
Enumerações
| TimeZone |
Enumera os fusos horários válidos para uma recorrência Schedule. |