Usar o estúdio do Azure Machine Learning

Concluído

Você pode usar o Azure Machine Learning Studio, um portal baseado em navegador para gerenciar seus recursos e trabalhos de machine learning, para acessar muitos tipos de recursos de machine learning.

No estúdio do Azure Machine Learning, você pode (entre outras coisas):

  • Importar e explorar dados.
  • Criar e usar recursos de computação.
  • Executar o código em notebooks.
  • Usar ferramentas visuais para criar trabalhos e pipelines.
  • Use o aprendizado de máquina automatizado para treinar modelos.
  • Veja detalhes de modelos treinados, incluindo métricas de avaliação, informações de IA responsáveis e parâmetros de treinamento.
  • Implante modelos treinados para inferência sob demanda e em lote.
  • Importar e gerenciar modelos de um catálogo de modelos abrangente.

Captura de tela do espaço de trabalho do Azure Machine Learning.

Provisionando recursos do Azure Machine Learning

O principal recurso necessário para o Azure Machine Learning é um workspace do Azure Machine Learning, que você pode provisionar em uma assinatura do Azure. Outros recursos de suporte, incluindo contas de armazenamento, registros de contêiner, máquinas virtuais e outros, são criados automaticamente conforme necessário. Você pode criar um workspace do Azure Machine Learning no portal do Azure.

Decidir entre opções de computação

Ao usar o Azure Machine Learning para treinar um modelo, você precisa selecionar computação. A computação refere-se aos recursos computacionais necessários para executar o processo de treinamento. Sempre que treinar um modelo, você deve monitorar quanto tempo leva para treinar o modelo e a quantidade de computação usada para executar o código. Ao monitorar o uso da computação, você saberá se deve aumentar ou diminuir a escala da computação.

Quando você escolhe trabalhar com o Azure em vez de treinar um modelo em um dispositivo local, você tem acesso a uma computação escalonável e econômica.

Opções de computação Considerações
CPU (Unidade de Processamento Central) ou UMA GPU (Unidade de Processamento Gráfico) Para conjuntos de dados tabulares menores, uma CPU é suficiente e econômica. Para dados não estruturados, como imagens ou texto, as GPUs são mais potentes e eficientes. As GPUs também podem ser usadas para conjuntos de dados tabulares maiores, se a computação da CPU estiver se mostrando insuficiente.
Uso geral ou otimizado para uso de memória Use o uso geral para ter uma proporção equilibrada de CPU e memória, ideal para teste e desenvolvimento com conjuntos de dados menores. Use otimizado para memória para ter uma alta proporção de memória para CPU. Ótimo para análise in-memory, que é ideal para quando você tem conjuntos de dados maiores ou está trabalhando em notebooks.

Quais opções de computação atendem melhor às suas necessidades geralmente é uma questão de tentativa e erro. Ao executar o código, monitore as utilização da computação para entender quantos recursos de computação você está usando. Se o treinamento do modelo demorar muito, mesmo com o maior tamanho de computação, você poderá usar GPUs em vez de CPUs. Como alternativa, você pode optar por distribuir o treinamento do modelo usando computação Spark, o que exige reescrever seus scripts de treinamento.

Aprendizado de Máquina Automático do Azure

Ao usar os recursos de machine learning automatizado do Azure Machine Learning, você receberá automaticamente a computação atribuída. O machine learning automatizado do Azure automatiza as tarefas iterativas e demoradas do desenvolvimento de modelos de machine learning.

No Azure Machine Learning Studio, você pode usar o machine learning automatizado para projetar e executar seus experimentos de treinamento com as mesmas etapas descritas neste módulo, sem a necessidade de escrever código. O machine learning automatizado do Azure fornece um assistente passo a passo que ajuda você a executar trabalhos de treinamento de machine learning. O treinamento automatizado pode ser usado para muitas tarefas de aprendizado de máquina, incluindo regressão, previsão de série temporal, classificação, pesquisa visual computacional e tarefas de processamento de linguagem natural. No AutoML, você tem acesso aos seus próprios conjuntos de dados. Seus modelos de machine learning treinados podem ser implantados como serviços.

Em seguida, vamos examinar as opções de implantação de modelo.