Compartir a través de


Conceptos de ajuste preciso de modelos

La optimización le ayuda a adaptar los modelos de inteligencia artificial entrenados previamente para trabajar mejor con sus datos y casos de uso específicos. Esta técnica puede mejorar el rendimiento del modelo, al tiempo que requiere menos datos de entrenamiento que la creación de un modelo desde cero.

Este artículo cubre:

  • Qué es la optimización y cómo funciona
  • Cuándo usar el ajuste preciso frente a otros enfoques
  • Selección y preparación de modelos para el ajuste preciso
  • Procedimientos recomendados para iterar y mejorar los resultados

Prerrequisitos

Antes de empezar, debería asegurarse de tener:

  • Conocimientos básicos de los conceptos de aprendizaje automático
  • Familiaridad con tu caso de uso específico y los requisitos de datos
  • Acceso a datos de ejemplo para entrenamiento y validación

¿Qué es el ajuste preciso?

El ajuste preciso es una técnica de aprendizaje automático que adapta un modelo entrenado previamente para mejorar su tarea específica. En lugar de entrenar un modelo desde cero, comienza con un modelo que ya entiende patrones generales y lo ajusta para trabajar con los datos.

Este enfoque aprovecha el aprendizaje de transferencia, mediante el uso de conocimientos obtenidos de una tarea para mejorar el rendimiento de una tarea relacionada. El ajuste preciso es especialmente eficaz cuando tiene datos de entrenamiento limitados o quiere basarse en las funcionalidades del modelo existentes.

Cuándo hacer un ajuste preciso

El ajuste adecuado funciona bien cuando tiene una pequeña cantidad de datos y desea mejorar el rendimiento del modelo. A partir de un modelo entrenado previamente, puede usar el conocimiento que el modelo ya ha aprendido y ajustarlo para que se ajuste mejor a los datos. Este enfoque le ayuda a mejorar el rendimiento del modelo y reduce la cantidad de datos necesarios para el entrenamiento.

Cuando tiene una gran cantidad de datos, normalmente no es necesario ajustar el modelo. Puede entrenar su modelo desde cero y obtener buenos resultados sin realizar ajustes adicionales. Sin embargo, el ajuste preciso puede seguir siendo útil si desea aumentar el rendimiento del modelo. Es posible que también quiera ajustar el modelo si tiene una tarea específica diferente de la tarea en la que se entrenó originalmente el modelo previamente entrenado.

Es posible que evite un ajuste costoso mediante el uso de ingeniería de avisos o encadenamiento de mensajes. Estas técnicas le ayudan a generar texto de alta calidad sin ajuste fino.

Seleccione un modelo preentrenado

Elija un modelo entrenado previamente que se ajuste a los requisitos de la tarea. Muchos modelos entrenados previamente están disponibles, cada uno entrenado en diferentes tareas. Elija un modelo entrenado en una tarea similar a la suya. Esta opción le ayuda a usar el conocimiento que el modelo ya ha aprendido y ajustarlo para ajustarse a los datos.

Los modelos HuggingFace son un buen lugar para empezar a buscar modelos preentrenados. Los HuggingFace modelos se agrupan en categorías basadas en la tarea en la que se entrenaron, lo que facilita la búsqueda de un modelo que se adapte a la tarea.

Estas categorías incluyen:

  • Multimodal
  • Visión por ordenador
  • Procesamiento de lenguaje natural
  • Sonido
  • Tabular
  • Aprendizaje de refuerzo

Compruebe si el modelo funciona con el entorno y las herramientas. Por ejemplo, si usa Visual Studio Code (VS Code), puede usar la extensión Azure Machine Learning para ajustar su VS Code modelo.

Compruebe el estado y la licencia del modelo. Algunos modelos entrenados previamente están disponibles en una licencia de código abierto, mientras que otros requieren una licencia comercial o personal. Todos los modelos de HuggingFace incluyen información de licencia. Asegúrese de que tiene los permisos necesarios para usar el modelo antes de ajustarlo.

Preparación de los datos de muestra

La preparación de los datos de muestra implica la limpieza y el preprocesamiento de los datos para que sean adecuados para el entrenamiento. También debe dividir los datos en conjuntos de entrenamiento y validación para evaluar el rendimiento del modelo. El formato de los datos debe coincidir con el formato esperado por el modelo entrenado previamente que use. Puede encontrar esta información con los modelos en HuggingFace la sección Formato de instrucción de la tarjeta de modelo. La mayoría de las tarjetas de modelo incluyen una plantilla para crear un aviso para el modelo y un pseudocódigo para ayudarle a empezar.

Iteración en el modelo

Después de ajustar el modelo, evalúe su rendimiento en el conjunto de validación. Use métricas como precisión, precisión, recuperación y puntuación F1 para evaluar el rendimiento del modelo. Si el rendimiento del modelo no es satisfactorio, ajuste los hiperparámetros, cambie la arquitectura o ajuste el modelo en más datos. También puede examinar la calidad y la diversidad de los datos para ver si hay algún problema que sea necesario solucionar. Como regla general, un conjunto más pequeño de datos de alta calidad es más valioso que un conjunto mayor de datos de baja calidad.

Consulte también

Para obtener más información sobre el ajuste fino de los modelos de IA, consulte los siguientes recursos:

Al usar características de IA, revise: Desarrollo de características y aplicaciones de IA generativas responsables en Windows.