Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este artigo descreve um componente no designer do Azure Machine Learning.
Use este componente para treinar um modelo de classificação ou regressão. O treinamento ocorre depois de definir um modelo e seus parâmetros, e requer dados marcados. Você também pode usar Train Model para treinar novamente um modelo existente com novos dados.
Como funciona o processo de formação
No Azure Machine Learning, criar e usar um modelo de aprendizado de máquina normalmente é um processo de três etapas.
Você configura um modelo, escolhendo um tipo específico de algoritmo e definindo seus parâmetros ou hiperparâmetros. Escolha qualquer um dos seguintes tipos de modelo:
- Modelos de classificação , baseados em redes neurais, árvores de decisão, florestas de decisão e outros algoritmos.
- Modelos de regressão , que podem incluir regressão linear padrão, ou que usam outros algoritmos, incluindo redes neurais e regressão bayesiana.
Forneça um conjunto de dados rotulado e com dados compatíveis com o algoritmo. Conecte os dados e o modelo ao Train Model.
O que a formação produz é um formato binário específico, o iLearner, que encapsula os padrões estatísticos aprendidos a partir dos dados. Não é possível modificar ou ler diretamente este formato; no entanto, outros componentes podem usar esse modelo treinado.
Você também pode exibir as propriedades do modelo. Para obter mais informações, consulte a seção Resultados.
Após a conclusão do treinamento, use o modelo treinado com um dos componentes de pontuação, para fazer previsões sobre novos dados.
Como usar o modelo de trem
Adicione o componente Modelo de trem ao pipeline. Você pode encontrar esse componente na categoria Aprendizado de Máquina. Expanda Trem e arraste o componente Modelo de trem para o pipeline.
Na entrada esquerda, anexe o modelo não treinado. Anexe o conjunto de dados de treinamento à entrada à direita do Modelo de Trem.
O conjunto de dados de treinamento deve conter uma coluna de rótulo. Todas as linhas sem rótulos são ignoradas.
Para a coluna Rótulo, clique em Editar coluna no painel direito do componente e escolha uma única coluna que contenha os resultados que o modelo pode usar para treinamento.
Para problemas de classificação, a coluna do rótulo deve conter valores categóricos ou valores discretos . Alguns exemplos podem ser uma classificação sim/não, um código ou nome de classificação de doença ou um grupo de rendimentos. Se você escolher uma coluna não categórica, o componente retornará um erro durante o treinamento.
Para problemas de regressão, a coluna de rótulo deve conter dados numéricos que representam a variável de resposta. Idealmente, os dados numéricos representam uma escala contínua.
Exemplos podem ser uma pontuação de risco de crédito, o tempo projetado para falha para um disco rígido ou o número previsto de chamadas para um call center em um determinado dia ou horário. Se você não escolher uma coluna numérica, poderá receber um erro.
- Se você não especificar qual coluna de rótulo usar, o Aprendizado de Máquina do Azure tentará inferir qual é a coluna de rótulo apropriada, usando os metadados do conjunto de dados. Se ele escolher a coluna errada, use o seletor de coluna para corrigi-la.
Gorjeta
Se você tiver problemas para usar o Seletor de Colunas, consulte o artigo Selecionar Colunas no Conjunto de Dados para obter dicas. Ele descreve alguns cenários comuns e dicas para usar as opções WITH RULES e BY NAME .
Envie o pipeline. Se você tiver muitos dados, pode demorar um pouco.
Importante
Se você tiver uma coluna ID que é a ID de cada linha, ou uma coluna de texto, que contém muitos valores exclusivos, Train Model pode atingir um erro como "Número de valores exclusivos na coluna: "{column_name}" é maior do que o permitido.
Isso ocorre porque a coluna atingiu o limite de valores exclusivos e pode causar falta de memória. Você pode usar Editar metadados para marcar essa coluna como recurso Limpar e ela não será usada no treinamento ou Extrair recursos de N-Gram do componente Texto para pré-processar a coluna de texto. Consulte Código de erro do Designer para obter mais detalhes do erro.
Interpretabilidade do modelo
A interpretabilidade do modelo oferece a possibilidade de compreender o modelo de ML e apresentar a base subjacente para a tomada de decisão de uma forma que seja compreensível para os seres humanos.
Atualmente, o componente Train Model suporta o uso do pacote de interpretabilidade para explicar modelos de ML. Os seguintes algoritmos incorporados são suportados:
- Regressão Linear
- Regressão da Rede Neural
- Regressão da Árvore de Decisões Elevada
- Regressão da Floresta de Decisão
- Regressão de Poisson
- Regressão Logística de Duas Classes
- Máquina de Vetores de Suporte de Duas Classes
- Árvore de Decisões Elevada de Duas Classes
- Floresta de Decisão de Duas Classes
- Floresta de Decisão Multiclasse
- Regressão Logística Multiclasse
- Rede Neural Multiclasse
Para gerar explicações do modelo, você pode selecionar True na lista suspensa de Explicação do modelo no componente Train Model. Por padrão, ele é definido como False no componente Train Model . Por favor, note que a geração de explicação requer um custo de computação extra.
Após a conclusão da execução do pipeline, você pode visitar a guia Explicações no painel direito do componente Train Model e explorar o desempenho do modelo, o conjunto de dados e a importância do recurso.
Para saber mais sobre como usar explicações de modelo no Aprendizado de Máquina do Azure, consulte o artigo de instruções sobre Interpretar modelos de ML.
Resultados
Após o modelo ser treinado:
Para usar o modelo em outros pipelines, selecione o componente e selecione o ícone Registrar conjunto de dados na guia Saídas no painel direito. Você pode acessar modelos salvos na paleta de componentes em Conjuntos de dados.
Para usar o modelo na previsão de novos valores, conecte-o ao componente Modelo de pontuação , juntamente com novos dados de entrada.
Próximos passos
Consulte o conjunto de componentes disponíveis para o Azure Machine Learning.