Compartilhar via


Conceitos de ajuste do modelo

O ajuste fino ajuda você a adaptar modelos de IA pré-treinados para funcionar melhor com seus dados específicos e casos de uso. Essa técnica pode melhorar o desempenho do modelo, exigindo menos dados de treinamento do que criar um modelo do zero.

Este artigo aborda:

  • O que é ajuste fino e como ele funciona
  • Quando usar ajuste fino versus outras abordagens
  • Como selecionar e preparar modelos para ajuste fino
  • Práticas recomendadas para iterar e melhorar seus resultados

Pré-requisitos

Antes de começar, você deve ter:

  • Compreensão básica dos conceitos de machine learning
  • Familiaridade com seus requisitos de dados e casos de uso específicos
  • Acesso a dados de exemplo para treinamento e validação

O que é ajuste fino?

O ajuste fino é uma técnica de aprendizado de máquina que adapta um modelo pré-treinado para ter um desempenho melhor em sua tarefa específica. Em vez de treinar um modelo do zero, você começa com um modelo que já entende padrões gerais e o ajusta para trabalhar com seus dados.

Essa abordagem aproveita o aprendizado de transferência usando o conhecimento obtido de uma tarefa para melhorar o desempenho em uma tarefa relacionada. O ajuste fino é particularmente eficaz quando você tem dados de treinamento limitados ou deseja aprimorar as capacidades existentes do modelo.

Quando ajustar

O ajuste fino funciona bem quando você tem uma pequena quantidade de dados e deseja melhorar o desempenho do modelo. Começando com um modelo pré-treinado, você pode usar o conhecimento que o modelo já aprendeu e ajustá-lo para melhor ajustar seus dados. Essa abordagem ajuda você a melhorar o desempenho do modelo e reduz a quantidade de dados necessários para treinamento.

Quando você tem uma grande quantidade de dados, geralmente não precisa ajustar seu modelo. Você pode treinar seu modelo do zero e obter bons resultados sem ajuste fino. No entanto, o ajuste fino ainda poderá ajudar se você quiser aumentar o desempenho do modelo. Talvez você também queira ajustar seu modelo se tiver uma tarefa específica diferente da tarefa em que o modelo pré-treinado foi treinado originalmente.

Você pode evitar ajustes finos caros usando engenharia de prompts ou encadeamento de prompts. Essas técnicas ajudam você a gerar texto de alta qualidade sem ajuste fino.

Selecionar um modelo pré-treinado

Escolha um modelo pré-treinado que atenda aos seus requisitos de tarefa. Muitos modelos pré-treinados estão disponíveis, cada um treinado em tarefas diferentes. Escolha um modelo treinado em uma tarefa semelhante à sua. Essa escolha ajuda você a usar o conhecimento que o modelo já aprendeu e ajustá-lo para ajustar seus dados.

Modelos HuggingFace são um bom ponto de partida ao procurar por modelos pré-treinados. Os HuggingFace modelos são agrupados em categorias com base na tarefa em que foram treinados, facilitando a localização de um modelo que se ajuste à sua tarefa.

Essas categorias incluem:

  • Multimodal
  • Visão computacional
  • Processamento de idioma natural
  • Áudio
  • Tabular
  • Aprendizado de reforço

Verifique se o modelo funciona com seu ambiente e ferramentas. Por exemplo, se você estiver usando Visual Studio Code (VS Code), poderá usar a extensão Azure Machine Learning para VS Code ajustar seu modelo.

Verifique o status e a licença do modelo. Alguns modelos pré-treinados estão disponíveis sob uma licença de software livre, enquanto outros exigem uma licença comercial ou pessoal. Todos os modelos no HuggingFace incluem informações de licença. Verifique se você tem as permissões necessárias para usar o modelo antes de ajustá-lo.

Preparar seus dados de exemplo

Preparar seus dados de exemplo envolve limpar e pré-processar seus dados para torná-los adequados para treinamento. Você também deve dividir seus dados em conjuntos de treinamento e validação para avaliar o desempenho do seu modelo. O formato dos dados deve corresponder ao formato esperado pelo modelo pré-treinado que você usa. Você pode encontrar essas informações nos modelos na HuggingFace seção do Formato de Instrução da cartão de modelo. A maioria dos cartões de modelo inclui um modelo para criar um prompt para o modelo e alguns pseudocódigos para ajudá-lo a começar.

Iterar no seu modelo

Depois de ajustar seu modelo, avalie seu desempenho no conjunto de validação. Use métricas como acurácia, precisão, recall e pontuação F1 para avaliar o desempenho do seu modelo. Se o desempenho do modelo não for satisfatório, ajuste os hiperparâmetros, altere a arquitetura ou ajuste o modelo em mais dados. Você também pode examinar a qualidade e a diversidade de seus dados para ver se há algum problema que precise ser resolvido. Como regra geral, um conjunto menor de dados de alta qualidade é mais valioso do que um conjunto maior de dados de baixa qualidade.

Confira também

Para saber mais sobre o ajuste de modelos de IA, confira os seguintes recursos:

Ao utilizar recursos de IA, examine: Desenvolvendo aplicativos e recursos de IA generativos responsáveis no Windows.