Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
O ajuste fino ajuda você a adaptar modelos de IA pré-treinados para trabalhar melhor com seus dados e casos de uso específicos. Essa técnica pode melhorar o desempenho do modelo enquanto requer menos dados de treinamento do que a criação de um modelo do zero.
Este artigo abrange:
- O que é ajuste fino e como funciona
- Quando usar o ajuste fino versus outras abordagens
- Como selecionar e preparar modelos para ajuste fino
- Práticas recomendadas para iterar e melhorar seus resultados
Pré-requisitos
Antes de começar, você deve ter:
- Compreensão básica dos conceitos de aprendizagem automática
- Familiaridade com o seu caso de uso específico e requisitos de dados
- Acesso a dados de amostra para treinamento e validação
O que é o ajuste fino?
O ajuste fino é uma técnica de aprendizado de máquina que adapta um modelo pré-treinado para um melhor desempenho em sua tarefa específica. Em vez de treinar um modelo do zero, você começa com um modelo que já entende padrões gerais e o ajusta para trabalhar com seus dados.
Essa abordagem aproveita a aprendizagem de transferência — usando o conhecimento adquirido em uma tarefa para melhorar o desempenho em uma tarefa relacionada. O ajuste fino é particularmente eficaz quando você tem dados de treinamento limitados ou deseja aproveitar os recursos de modelo existentes.
Quando afinar
O ajuste fino funciona bem quando você tem uma pequena quantidade de dados e deseja melhorar o desempenho do seu modelo. Começando com um modelo pré-treinado, você pode usar o conhecimento que o modelo já aprendeu e ajustá-lo para melhor se adequar aos seus dados. Essa abordagem ajuda a melhorar o desempenho do seu modelo e reduz a quantidade de dados necessários para o treinamento.
Quando você tem uma grande quantidade de dados, geralmente não precisa ajustar seu modelo. Pode treinar o seu modelo a partir do zero e obter bons resultados sem ajustes. No entanto, o ajuste fino ainda pode ajudar se você quiser aumentar o desempenho do seu modelo. Você também pode querer ajustar seu modelo se tiver uma tarefa específica diferente da tarefa na qual o modelo pré-treinado foi originalmente treinado.
Você pode evitar ajustes finos dispendiosos usando engenharia de prompt ou encadeamento de prompts. Essas técnicas ajudam a gerar texto de alta qualidade sem ajustes finos.
Selecione um modelo pré-treinado
Escolha um modelo pré-treinado que se adapte aos requisitos da sua tarefa. Muitos modelos pré-treinados estão disponíveis, cada um treinado em tarefas diferentes. Escolha um modelo treinado em uma tarefa semelhante à sua. Essa opção ajuda você a usar o conhecimento que o modelo já aprendeu e ajustá-lo para se adequar aos seus dados.
HuggingFace modelos são um bom ponto de partida quando se procura modelos pré-treinados. Os HuggingFace modelos são agrupados em categorias com base na tarefa em que foram treinados, tornando mais fácil encontrar um modelo que se adapte à sua tarefa.
Estas categorias incluem:
- Multimodal
- Visão computacional
- Processamento de linguagem natural
- Áudio
- Tabular
- Aprendizagem por reforço
Verifique se o modelo funciona com o seu ambiente e ferramentas. Por exemplo, se estiveres a usar Visual Studio Code (VS Code), poderás usar a extensão Azure Machine Learning para VS Code ajustar o teu modelo.
Verifique o estado e a licença do modelo. Alguns modelos pré-treinados estão disponíveis sob uma licença de código aberto, enquanto outros exigem uma licença comercial ou pessoal. Todos os modelos em HuggingFace incluem informações de licença. Verifique se você tem as permissões necessárias para usar o modelo antes de ajustá-lo.
Prepare os seus dados de exemplo
A preparação dos dados de amostra envolve a limpeza e o pré-processamento dos dados para torná-los adequados para treinamento. Você também deve dividir seus dados em conjuntos de treinamento e validação para avaliar o desempenho do seu modelo. O formato dos seus dados deve corresponder ao formato esperado pelo modelo pré-treinado que você usa. Você pode encontrar essas informações com os modelos na HuggingFace seção Formato de instruções do cartão modelo. A maioria dos modelos de cartão inclui um template para criar um prompt para o modelo e algum pseudocódigo para ajudá-lo a iniciar.
Itere no seu modelo
Depois de ajustar seu modelo, avalie seu desempenho no conjunto de validação. Use métricas como exatidão, precisão, recuperação e pontuação F1 para avaliar o desempenho do seu modelo. Se o desempenho do seu modelo não for satisfatório, ajuste os hiperparâmetros, altere a arquitetura ou ajuste o modelo em mais dados. Você também pode examinar a qualidade e a diversidade de seus dados para ver se há algum problema que precise ser resolvido. Como regra geral, um conjunto menor de dados de alta qualidade é mais valioso do que um conjunto maior de dados de baixa qualidade.
Ver também
Para saber mais sobre como ajustar modelos de IA, confira os seguintes recursos:
- Ajustar um modelo Llama 2 no portal Microsoft Foundry
- Ajuste um modelo pré-treinado em HuggingFace
- Ajuste fino de um modelo pré-treinado com TensorFlow
Ao utilizar recursos de IA, analise: Desenvolvendo aplicativos e recursos de IA generativa responsável no Windows.