Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Importante
Esta característica se encuentra en versión preliminar pública en las siguientes regiones: centralus, eastus, eastus2, northcentralus y westus.
En este artículo se describe cómo crear y configurar una ejecución de entrenamiento mediante la interfaz de usuario de optimización de modelos de Foundation Model (ahora parte de Mosaic AI Model Training). También puede crear una ejecución mediante la API. Para obtener instrucciones, consulte Creación de una ejecución de entrenamiento mediante foundation Model Fine-tuning API.
Requisitos
Vea Requisitos.
Creación de una ejecución de entrenamiento mediante la interfaz de usuario
Siga estos pasos para crear una ejecución de entrenamiento mediante la interfaz de usuario.
En la barra lateral izquierda, haga clic en Experimentos.
En la tarjeta Foundation Model Fine-tuning ,haga clic en Create Mosaic AI Model Experiment (Crear experimento de modelo de IA de mosaico).
Se abre el formulario De ajuste fino de Foundation Model. Todos los elementos marcados con un asterisco son obligatorios. Realice sus selecciones y, después, haga clic en Iniciar entrenamiento.
Tipo: seleccione la tarea que quiera que se realice.
Tarea Descripción Ajuste de instrucciones Continúe entrenando un modelo fundacional mediante la entrada de solicitudes y respuestas para optimizar el modelo para una tarea específica. Entrenamiento previo continuo Continúe entrenando un modelo fundacional para proporcionarle conocimientos específicos de un dominio. Finalización del chat Continúe entrenando un modelo fundacional con registros de chat para optimizarlo para aplicaciones de preguntas y respuestas o de conversaciones. Seleccione el modelo de Foundation: seleccione el modelo que se va a ajustar o entrenar. Para obtener una lista de los modelos admitidos, consulte Modelos admitidos.
Datos de entrenamiento: haga clic en Examinar para seleccionar una tabla en Unity Catalog o escriba la dirección URL completa de un conjunto de datos de Hugging Face. Para obtener recomendaciones de tamaño de datos, consulte Tamaño de datos recomendado para entrenamiento de modelos.
Si selecciona una tabla en Unity Catalog, también debe seleccionar el proceso que se usará para leerla.
Registrar en una ubicación: seleccione el catálogo y el esquema de Unity Catalog en los menús desplegables. El modelo entrenado se guarda en esta ubicación.
Nombre del modelo: el modelo se guarda con este nombre en el catálogo y el esquema especificados. En ese campo aparece un nombre predeterminado, que puede cambiar si lo prefiere.
Opciones avanzadas: para una mayor personalización, puede configurar valores opcionales para la evaluación, el ajuste de hiperparámetros o el entrenamiento a partir de un modelo existente de su propiedad.
Configuración Descripción Duración del entrenamiento La duración de la ejecución de entrenamiento, especificada en épocas (por ejemplo, 10ep) o tokens (por ejemplo,1000000tok). El valor predeterminado es1ep.Velocidad de aprendizaje La velocidad de aprendizaje para el entrenamiento del modelo. Todos los modelos se entrenan mediante el optimizador AdamW, con calentamiento del ritmo de aprendizaje. La velocidad de aprendizaje predeterminada puede variar por modelo. Se recomienda ejecutar un barrido de hiperparámetros probando diferentes velocidades de aprendizaje y duraciones de entrenamiento para obtener los modelos de mayor calidad. Longitud del contexto La longitud máxima de secuencia de un ejemplo de datos. Los datos más largos que esta configuración se truncan. La longitud predeterminada depende del modelo seleccionado. Datos de evaluación Haga clic en Examinar para seleccionar una tabla en Unity Catalog o escriba la dirección URL completa de un conjunto de datos de Hugging Face. Si deja este campo en blanco, no se realiza ninguna evaluación. Instrucciones de evaluación del modelo Escriba instrucciones opcionales que se usarán para evaluar el modelo. Nombre del experimento De forma predeterminada, se asigna un nuevo nombre generado automáticamente para cada ejecución. Opcionalmente, puede escribir un nombre personalizado o seleccionar un experimento existente en la lista desplegable. Pesos personalizados De forma predeterminada, el entrenamiento comienza usando los pesos originales del modelo seleccionado. Para empezar con un punto de control generado por la API de ajuste preciso, escriba la ruta de acceso a la carpeta de artefactos de MLflow que contiene el punto de control.
NOTA: Si ha entrenado un modelo antes del 26/3/2025, ya no podrá seguir entrenando desde esos puntos de control. Las ejecuciones de entrenamiento completadas anteriormente todavía se pueden atender con el rendimiento aprovisionado sin inconveniente.
Pasos siguientes
Una vez completada la ejecución de entrenamiento, puede revisar las métricas en MLflow e implementar el modelo para la inferencia. Consulte los pasos del 5 al 7 del Tutorial: Creación e implementación de una ejecución de ajuste fino de Foundation Model.
Consulte el cuaderno de demostración Optimización de instrucciones: Reconocimiento de entidades con nombre para ver un ejemplo de optimización de instrucciones que recorre la preparación de los datos, la configuración de la ejecución del entrenamiento de optimización y la implementación.