Partilhar via


Treinar modelos com o Azure Machine Learning (v1)

APLICA-SE A:SDK do Azure Machine Learning v1 para Python

Important

Este artigo fornece informações sobre como usar o SDK do Azure Machine Learning v1. O SDK v1 foi preterido a partir de 31 de março de 2025. O apoio terminará em 30 de junho de 2026. Você pode instalar e usar o SDK v1 até essa data. Seus fluxos de trabalho existentes usando o SDK v1 continuarão a operar após a data de fim do suporte. No entanto, eles podem estar expostos a riscos de segurança ou alterações disruptivas no caso de alterações arquitetônicas no produto.

Recomendamos a transição para o SDK v2 antes de 30 de junho de 2026. Para obter mais informações sobre o SDK v2, consulte O que é a CLI do Azure Machine Learning e o SDK do Python v2? e a referência do SDK v2.

O Azure Machine Learning oferece várias formas de treinar modelos, incluindo soluções code-first com o SDK e opções de baixo código, como machine learning automatizado e o designer visual. Use a lista a seguir para determinar qual método de treinamento atende às suas necessidades:

  • SDK do Azure Machine Learning para Python: o SDK do Python fornece várias maneiras de treinar modelos, cada uma com recursos diferentes.

    Método de treino Description
    Executar configuração Uma maneira comum de treinar modelos é usar um script de treinamento e configuração de trabalho. A configuração do trabalho define o ambiente de treinamento, incluindo seu script, destino de computação e ambiente do Azure Machine Learning. Você pode executar um trabalho de treinamento especificando esses detalhes.
    Aprendizagem automática de máquina O aprendizado de máquina automatizado permite treinar modelos sem ciência de dados profunda ou experiência em programação. Para usuários experientes, ele economiza tempo automatizando a seleção de algoritmos e o ajuste de hiperparâmetros. A configuração do trabalho não é necessária ao usar o aprendizado de máquina automatizado.
    Pipeline de aprendizado de máquina Os pipelines não são um método de treinamento separado, mas uma maneira de definir fluxos de trabalho usando etapas modulares e reutilizáveis que podem incluir treinamento. Os pipelines suportam aprendizado de máquina automatizado e configuração de execução. Use um pipeline quando quiser:
    * Agende processos autônomos , como trabalhos de treinamento de longa duração ou preparação de dados.
    * Coordenar várias etapas em diferentes recursos de computação e locais de armazenamento.
    * Crie um modelo reutilizável para cenários como retreinamento ou pontuação em lote.
    * Rastreie e versione fontes de dados, entradas e saídas para seu fluxo de trabalho.
    * Permitir que diferentes equipes trabalhem em etapas específicas de forma independente e combiná-las em um pipeline.
  • Designer: o designer do Azure Machine Learning é um ponto de entrada fácil para criar provas de conceitos ou para usuários com experiência limitada em codificação. Treine modelos usando uma interface web de arrastar e largar. Você pode incluir código Python ou treinar modelos sem escrever nenhum código.

  • CLI do Azure: A CLI de aprendizado de máquina oferece comandos para tarefas comuns do Azure Machine Learning e é frequentemente usada para scripts e automação. Por exemplo, depois de criar um script ou pipeline de treinamento, você pode usar a CLI para iniciar um trabalho de treinamento em um cronograma ou quando os dados de treinamento forem atualizados. A CLI pode enviar tarefas usando configurações de execução ou pipelines.

Cada método de treinamento pode usar diferentes tipos de recursos de computação, chamados alvos de computação. Um destino de computação pode ser uma máquina local ou um recurso de nuvem, como o Azure Machine Learning Compute, o Azure HDInsight ou uma máquina virtual remota.

Python SDK

O SDK do Azure Machine Learning para Python permite criar e executar fluxos de trabalho de aprendizado de máquina. Você pode interagir com o serviço a partir de uma sessão interativa do Python, Jupyter Notebooks, Visual Studio Code ou outro IDE.

Executar configuração

Um trabalho de treinamento típico no Azure Machine Learning é definido usando ScriptRunConfig. A configuração de execução de script, juntamente com o(s) seu(s) script(s) de treinamento, é usada para treinar um modelo em um destino de computação.

Você pode começar com uma configuração de execução para seu computador local e alternar para um destino de computação baseado em nuvem, conforme necessário. Para alterar o destino de computação, atualize a configuração de execução. Cada execução registra informações sobre o trabalho de treinamento, incluindo entradas, saídas e logs.

Machine Learning Automatizado

Defina iterações, configurações de hiperparâmetros, featurização e outras opções. Durante o treinamento, o Aprendizado de Máquina do Azure testa diferentes algoritmos e parâmetros em paralelo. O treinamento é interrompido quando atende aos critérios de saída definidos.

Tip

Você também pode usar o ML automatizado por meio do estúdio Azure Machine Learning, além do SDK do Python.

Pipeline de aprendizado de máquina

Os pipelines de aprendizado de máquina podem usar os métodos de treinamento descritos acima. Os pipelines se concentram na criação de fluxos de trabalho, portanto, abrangem mais do que apenas o treinamento de modelos. Em um pipeline, você pode treinar um modelo usando aprendizado de máquina automatizado ou executar configurações.

Compreender o que acontece quando submete um trabalho de formação

O ciclo de vida de treinamento do Azure inclui:

  1. Compactar os arquivos na pasta do projeto, ignorando os especificados em .amlignore ou .gitignore
  2. Ampliando seu cluster de computação
  3. Criando ou baixando a imagem do Docker para o nó de computação
    1. O sistema calcula um hash de:
    2. O sistema usa esse hash para procurar o espaço de trabalho Azure Container Registry (ACR)
    3. Se não for encontrado, verifica o ACR global
    4. Se ainda não for encontrado, o sistema cria uma nova imagem (que é armazenada em cache e registrada no ACR do espaço de trabalho)
  4. Baixando seu arquivo de projeto compactado para armazenamento temporário no nó de computação
  5. Descompactando o arquivo de projeto
  6. O nó de computação executa python <entry script> <arguments>
  7. Salvar logs, arquivos de modelo e outros arquivos gravados na ./outputs conta de armazenamento associada ao espaço de trabalho
  8. Redução da computação, incluindo a remoção de armazenamento temporário

Se você treinar em sua máquina local ("configurar como execução local"), o Docker não será necessário. Você pode usar o Docker localmente, se preferir (consulte Configurar pipeline de ML para obter um exemplo).

Estruturador do Azure Machine Learning

O designer permite treinar modelos usando uma interface de arrastar e soltar em seu navegador da Web.

Azure CLI

A CLI de aprendizado de máquina é uma extensão para a CLI do Azure. Ele fornece comandos entre plataformas para trabalhar com o Azure Machine Learning. Normalmente, você usa a CLI para automatizar tarefas, como treinar um modelo de aprendizado de máquina.

Próximos passos

Saiba como configurar uma execução de treinamento.