Compartilhar via


Treinar modelos com Azure Machine Learning (v1)

APLICA-SE A:Azure Machine Learning SDK v1 para Python

Importante

Este artigo fornece informações sobre como usar o SDK do Azure Machine Learning v1. O SDK v1 foi preterido a partir de 31 de março de 2025. O suporte para ele terminará em 30 de junho de 2026. Você pode instalar e usar o SDK v1 até essa data. Seus fluxos de trabalho existentes usando o SDK v1 continuarão a operar após a data de fim do suporte. No entanto, eles podem ficar expostos a riscos de segurança ou a alterações interruptivas em caso de mudanças na arquitetura do produto.

Recomendamos que você faça a transição para o SDK v2 antes de 30 de junho de 2026. Para obter mais informações sobre o SDK v2, consulte o que é a CLI do Azure Machine Learning e o SDK do Python v2? e a referência do SDK v2.

O Azure Machine Learning oferece várias maneiras de treinar modelos, incluindo soluções de primeiro código com o SDK e opções de baixo código, como machine learning automatizado e o designer visual. Use a lista a seguir para determinar qual método de treinamento atende às suas necessidades:

  • SDK do Azure Machine Learning para Python: o SDK do Python fornece várias maneiras de treinar modelos, cada um com recursos diferentes.

    Método de treinamento Descrição
    Configuração de execução Uma maneira comum de treinar modelos é usar um script de treinamento e uma configuração de trabalho. A configuração do trabalho define o ambiente de treinamento, incluindo o script, o destino de computação e o ambiente do Azure Machine Learning. Você pode executar um trabalho de treinamento especificando esses detalhes.
    Machine learning automatizado O aprendizado de máquina automatizado permite treinar modelos sem conhecimentos profundos em ciência de dados ou programação. Para usuários experientes, ele economiza tempo automatizando a seleção de algoritmos e o ajuste do hiperparâmetro. A configuração do trabalho não é necessária ao usar aprendizado de máquina automatizado.
    Pipeline de machine learning Pipelines não são um método de treinamento separado, mas uma maneira de definir fluxos de trabalho usando etapas modulares reutilizáveis que podem incluir treinamento. Os pipelines oferecem suporte tanto ao aprendizado de máquina automatizado quanto à configuração de execução. Use um pipeline quando quiser:
    * Agende processos não supervisionados como tarefas de treinamento de execução prolongada ou preparação de dados.
    * Coordene várias etapas entre diferentes recursos de computação e locais de armazenamento.
    * Crie um modelo reutilizável para cenários como retreinamento ou pontuação em lote.
    * Fontes de dados de acompanhamento e versão, entradas e saídas para seu fluxo de trabalho.
    * Habilite equipes diferentes para trabalhar em etapas específicas de forma independente e combiná-las em um pipeline.
  • Designer: o designer do Azure Machine Learning é um ponto de entrada fácil para criar uma prova de conceitos ou para usuários com experiência limitada de codificação. Treine modelos usando uma interface gráfica da Web de arrastar e soltar. Você pode incluir o código python ou treinar modelos sem escrever nenhum código.

  • CLI do Azure: A CLI de machine learning oferece comandos para tarefas comuns do Azure Machine Learning e geralmente é usada para scripts e automação. Por exemplo, depois de criar um script de treinamento ou pipeline, você pode usar a CLI para iniciar um trabalho de treinamento em um agendamento ou quando os dados de treinamento são atualizados. A Interface de Linha de Comando (CLI) pode enviar tarefas usando configurações de execução ou pipelines.

Cada método de treinamento pode usar diferentes tipos de recursos de computação, chamados de destinos de computação. Um destino de computação pode ser um computador local ou um recurso de nuvem, como a Computação do Azure Machine Learning, o Azure HDInsight ou uma máquina virtual remota.

SDK do Python

O SDK do Azure Machine Learning para Python permite criar e executar fluxos de trabalho de machine learning. Você pode interagir com o serviço em uma sessão interativa do Python, Jupyter Notebooks, Visual Studio Code ou outro IDE.

Configuração de execução

Um trabalho de treinamento típico no Azure Machine Learning é definido usando ScriptRunConfig. A configuração de execução de script, juntamente com seus scripts de treinamento, é usada para treinar um modelo em um destino de computação.

Você pode começar com uma configuração de execução para seu computador local e alternar para um destino de computação baseado em nuvem, conforme necessário. Para alterar o destino de computação, atualize a configuração de execução. Cada execução registra informações sobre o trabalho de treinamento, incluindo entradas, saídas e logs.

Machine Learning automatizado

Defina iterações, configurações de hiperparâmetros, featurização (ou extração de características) e outras opções. Durante o treinamento, o Azure Machine Learning testa algoritmos e parâmetros diferentes em paralelo. O treinamento é interrompido quando atende aos critérios de saída definidos.

Dica

Você também pode usar o ML automatizado por meio do estúdio do Azure Machine Learning, além do SDK do Python.

Pipeline de machine learning

Os pipelines de machine learning podem usar os métodos de treinamento descritos acima. Os pipelines se concentram na criação de fluxos de trabalho, assim eles abrangem mais do que apenas o treinamento de modelos. Em um pipeline, você pode treinar um modelo usando o machine learning automatizado ou as configurações de execução.

Saber o que acontece quando você envia um trabalho de treinamento

O ciclo de vida de treinamento do Azure inclui:

  1. Compactar os arquivos na pasta do projeto, ignorando aqueles especificados em .amlignore ou .gitignore
  2. Colocar em escala seu cluster de cálculo
  3. Compilando ou baixando a imagem do Docker no nó de computação
    1. O sistema calcula um hash:
    2. O sistema usa esse hash para pesquisar o ACR (Registro de Contêiner do Azure) do workspace
    3. Se não for encontrado, ele verificará o ACR global
    4. Se ainda não for encontrado, o sistema criará uma nova imagem (que é armazenada em cache e registrada com o ACR do workspace)
  4. Fazer download do arquivo compactado do projeto em um armazenamento temporário no nó de computação
  5. Descompactar o arquivo do projeto
  6. O nó de computação executa python <entry script> <arguments>
  7. Salvar os logs, os arquivos de modelo e outros arquivos gravados em ./outputs na conta de armazenamento associada ao workspace
  8. Colocar em escala a computação, incluindo a remoção do armazenamento temporário

Se você treinar em seu computador local ("configurar como execução local"), o Docker não será necessário. Você pode usar o Docker localmente se preferir (consulte Configurar o pipeline de ML para obter um exemplo).

Designer do Azure Machine Learning

O designer permite que você treine modelos usando uma interface de arrastar e soltar no navegador da Web.

CLI do Azure

A CLI de machine learning é uma extensão para a CLI do Azure. Ele fornece comandos multiplataforma para trabalhar com o Azure Machine Learning. Normalmente, você usa a CLI para automatizar tarefas, como treinar um modelo de machine learning.

Próximas etapas

Saiba como configurar uma execução de treinamento.