Introdução
No aprendizado de máquina, os modelos são treinados para prever rótulos desconhecidos para novos dados com base em correlações entre rótulos conhecidos e recursos encontrados nos dados de treinamento. Dependendo do algoritmo usado, talvez seja necessário especificar hiperparâmetros para configurar como o modelo é treinado.
Por exemplo, o algoritmo de regressão logística usa um hiperparâmetro de taxa de regularização para neutralizar o sobreajuste e as técnicas de aprendizado profundo para CNNs (redes neurais convolucionais) usam hiperparâmetros como a taxa de aprendizado para controlar a maneira como os pesos são ajustados durante o treinamento e o tamanho do lote para determinar quantos itens de dados serão incluídos em cada lote de treinamento.
Nota
Machine Learning é um campo acadêmico com sua própria terminologia específica. Os cientistas de dados referem-se aos valores determinados dos recursos de treinamento como parâmetros , portanto, um termo diferente é necessário para valores que são usados para configurar o comportamento de treinamento, mas que não são derivados dos dados de treinamento - daí o termo hiperparâmetro.
A escolha de valores de hiperparâmetro pode afetar significativamente o modelo resultante, tornando importante selecionar os melhores valores possíveis para seus dados específicos e metas de desempenho preditivas.
Ajustando hiperparâmetros
Ajuste de Hiperparâmetros é realizado treinando vários modelos, usando o mesmo algoritmo e dados de treino, mas valores de hiperparâmetros diferentes. O modelo resultante de cada execução de treinamento é avaliado para determinar a métrica de desempenho para a qual você deseja otimizar (por exemplo, precisão) e o modelo de melhor desempenho é selecionado.
No Azure Machine Learning, você pode ajustar hiperparâmetros enviando um script como um trabalho de varredura. Um trabalho de varredura executará uma avaliação para cada combinação de hiperparâmetro a ser testada. Cada avaliação usa um script de treinamento com valores de hiperparâmetro parametrizados para treinar um modelo e registra a métrica de desempenho de destino obtida pelo modelo treinado.
Objetivos de aprendizagem
Neste módulo, você aprenderá a:
- Defina um espaço de pesquisa de hiperparâmetro.
- Configurar a amostragem do hiperparâmetro.
- Selecione uma política de término antecipado.
- Executar um trabalho de varredura.