Compartir a través de


Entrenamiento de modelos con Azure Machine Learning

SE APLICA A:SDK de Azure Machine Learning v1 para Python

Important

En este artículo se proporciona información sobre el uso del SDK de Azure Machine Learning v1. EL SDK v1 está en desuso a partir del 31 de marzo de 2025. El soporte técnico finalizará el 30 de junio de 2026. Puede instalar y usar SDK v1 hasta esa fecha. Los flujos de trabajo existentes que usan SDK v1 seguirán funcionando después de la fecha de finalización del soporte técnico. Sin embargo, podrían estar expuestos a riesgos de seguridad o cambios significativos si se producen cambios de arquitectura en el producto.

Se recomienda realizar la transición al SDK v2 antes del 30 de junio de 2026. Para más información sobre SDK v2, consulte ¿Qué es la CLI de Azure Machine Learning y el SDK de Python v2? y la referencia del SDK v2.

Azure Machine Learning ofrece varias maneras de entrenar modelos, incluidas las soluciones de código primero con el SDK y opciones de poco código, como el aprendizaje automático automatizado y el diseñador visual. Use la lista siguiente para determinar qué método de entrenamiento se ajusta a sus necesidades:

  • SDK de Azure Machine Learning para Python: el SDK de Python proporciona varias maneras de entrenar modelos, cada una con distintas funcionalidades.

    Método de entrenamiento Description
    Ejecución de la configuración Una manera común de entrenar modelos es usar un script de entrenamiento y una configuración de trabajo. La configuración del trabajo define el entorno de entrenamiento, incluido el script, el destino de proceso y el entorno de Azure Machine Learning. Puede ejecutar un trabajo de entrenamiento especificando estos detalles.
    Aprendizaje automático automatizado El aprendizaje automático automatizado le permite entrenar modelos sin conocimientos profundos sobre ciencia de datos o programación. Para los usuarios experimentados, ahorra tiempo automatizando la selección de algoritmos y el ajuste de hiperparámetros. La configuración del trabajo no es necesaria al usar el aprendizaje automático automatizado.
    Canalización de aprendizaje automático Las canalizaciones no son un método de entrenamiento independiente, sino una manera de definir flujos de trabajo mediante pasos modulares y reutilizables que pueden incluir el entrenamiento. Las canalizaciones admiten tanto el aprendizaje automático como la configuración de ejecución. Use una canalización cuando desee:
    * Programar procesos desatendidos, como trabajos de entrenamiento de larga duración o la preparación de los datos.
    * Coordinar varios pasos en diferentes recursos de proceso y ubicaciones de almacenamiento.
    * Cree una plantilla reutilizable para escenarios como el reentrenamiento o la puntuación por lotes.
    * Haga seguimiento y realice versiones de sus orígenes de datos, entradas y salidas del flujo de trabajo.
    * Permitir que diferentes equipos trabajen en pasos específicos de forma independiente y combinarlos en una canalización.
  • Diseñador: el diseñador de Azure Machine Learning es un punto de entrada sencillo para crear pruebas de conceptos o para usuarios con experiencia de codificación limitada. Entrenar modelos mediante una interfaz de usuario web de arrastrar y colocar. Puede incluir código de Python o entrenar modelos sin escribir ningún código.

  • CLI de Azure: la CLI de aprendizaje automático ofrece comandos para tareas comunes de Azure Machine Learning y a menudo se usa para la automatización y el scripting. Por ejemplo, después de crear un script de entrenamiento o una canalización, puede usar la CLI para iniciar un trabajo de entrenamiento según una programación o cuando se actualicen los datos de entrenamiento. La CLI puede enviar trabajos mediante configuraciones de ejecución o canalizaciones.

Cada método de entrenamiento puede usar diferentes tipos de recursos de proceso, denominados destinos de proceso. Un destino de proceso puede ser una máquina local o un recurso en la nube, como Proceso de Azure Machine Learning, Azure HDInsight o una máquina virtual remota.

SDK de Python

El SDK de Azure Machine Learning para Python le permite crear y ejecutar flujos de trabajo de aprendizaje automático. Puede interactuar con el servicio desde una sesión de Python interactiva, instancias de Jupyter Notebook, Visual Studio Code u otro IDE.

Ejecución de la configuración

Un trabajo de entrenamiento típico en Azure Machine Learning se define mediante ScriptRunConfig. La configuración de ejecución del script, junto con sus scripts de entrenamiento, se utiliza para entrenar un modelo en un objetivo de cálculo.

Puede empezar con una configuración de ejecución para el equipo local y cambiar a un destino de proceso basado en la nube según sea necesario. Para cambiar el destino de proceso, actualice la configuración de ejecución. Cada ejecución registra información sobre el trabajo de entrenamiento, incluidas las entradas, las salidas y los registros.

Aprendizaje Automático Automatizado

Defina iteraciones, configuración de hiperparámetros, caracterización y otras opciones. Durante el entrenamiento, Azure Machine Learning prueba distintos algoritmos y parámetros en paralelo. El entrenamiento se detiene cuando cumple los criterios de salida establecidos.

Tip

También puede usar Ml automatizado a través de Azure Machine Learning Studio, además del SDK de Python.

Canalización de aprendizaje automático

Las canalizaciones de aprendizaje automático pueden usar los métodos de entrenamiento descritos anteriormente. Las canalizaciones se centran en la creación de flujos de trabajo, por lo que cubren más que solo el entrenamiento del modelo. En una canalización, puede entrenar un modelo mediante el aprendizaje automático automatizado o las configuraciones de ejecución.

Descripción de lo que ocurre cuando se envía un trabajo de entrenamiento

El ciclo de vida de entrenamiento de Azure incluye:

  1. Comprimir los archivos de la carpeta del proyecto y omitir los especificados en .amlignore o .gitignore
  2. Escalar verticalmente el clúster de proceso
  3. Compilación o descarga de la imagen de Docker en el nodo de proceso
    1. El sistema calcula un valor de hash de:
    2. El sistema usa este hash para buscar el área de trabajo de Azure Container Registry (ACR)
    3. Si no se encuentra, comprueba el ACR global.
    4. Si aún no se encuentra, el sistema crea una nueva imagen (que se almacena en caché y se registra con el ACR del área de trabajo).
  4. Descargar el archivo de proyecto comprimido en el almacenamiento temporal del nodo de proceso.
  5. Descomprimir el archivo de proyecto.
  6. El nodo de cálculo ejecuta python <entry script> <arguments>
  7. Guardar registros, archivos de modelo y otros archivos escritos en ./outputs en la cuenta de almacenamiento asociada con el área de trabajo.
  8. Reducir verticalmente el proceso, incluida la eliminación del almacenamiento temporal.

Si entrena en el equipo local ("configurar como ejecución local"), Docker no es necesario. Puede usar Docker localmente si lo prefiere (consulte Configuración de la canalización de ML para obtener un ejemplo).

Diseñador de Azure Machine Learning

El diseñador le permite entrenar modelos mediante una interfaz de arrastrar y colocar en el explorador web.

Azure CLI

La CLI de Machine Learning es una extensión para la CLI de Azure. Proporciona comandos multiplataforma para trabajar con Azure Machine Learning. Por lo general, se usa la CLI para automatizar las tareas, como entrenar un modelo de aprendizaje automático.

Pasos siguientes

Aprenda a configurar una ejecución de entrenamiento.