Introducción
En el aprendizaje automático, los modelos se entrenan para predecir etiquetas desconocidas para nuevos datos en función de las correlaciones entre etiquetas conocidas y características que se encuentran en los datos de entrenamiento. Según el algoritmo usado, es posible que tenga que especificar hiperparámetros para configurar cómo se entrena el modelo.
Por ejemplo, el algoritmo de regresión logística utiliza un hiperparámetro de tasa de regularización para contrarrestar el sobreajuste. Además, las técnicas de aprendizaje profundo de las redes neuronal convolucionales (CNN) usan hiperparámetros como la velocidad de aprendizaje a fin de controlar cómo se ajustan las ponderaciones durante el entrenamiento y el tamaño del lote para determinar el número de elementos de datos que se incluyen en cada lote de entrenamiento.
Nota
Machine Learning es un campo académico con su propia terminología concreta. Los científicos de datos hacen referencia a los valores que se determinan a partir de las características de entrenamiento como parámetros, por lo que se necesita otro término para los valores que se usan para configurar el comportamiento del entrenamiento y que no se derivan de los datos de entrenamiento. De ahí nace el término hiperparámetro.
La elección de valores de hiperparámetros puede afectar significativamente al modelo resultante, lo que hace que sea importante seleccionar los mejores valores posibles para los datos concretos y los objetivos de rendimiento predictivo.
Ajuste de hiperparámetros
El ajuste de los hiperparámetros se logra mediante el entrenamiento de varios modelos, con el mismo algoritmo y los mismos datos de entrenamiento, pero con distintos valores de hiperparámetros. A continuación, se evalúa el modelo resultante de cada ejecución de entrenamiento para determinar la métrica de rendimiento para la que desea optimizar (por ejemplo, precisión) y se selecciona el modelo de mejor rendimiento.
En Azure Machine Learning, puede ajustar los hiperparámetros enviando un script como un trabajo de barrido. Un trabajo de barrido ejecutará una prueba para cada combinación de hiperparámetros que se va a probar. Cada prueba usa un script de entrenamiento con valores de hiperparámetros para entrenar un modelo y registra la métrica de rendimiento objetivo lograda por el modelo entrenado.
Objetivos de aprendizaje
En este módulo, aprenderá a:
- Defina un espacio de búsqueda de hiperparámetros.
- Configure el muestreo de hiperparámetros.
- Selección de una directiva de terminación anticipada.
- Ejecute un trabajo de barrido.