Qual modelo usar

3 minutos

Existem muitos fatores, incluindo custo, disponibilidade, desempenho e funcionalidade, que devem ser considerados ao escolher o LLM a ser usado. Em geral, recomendamos os seguintes guias:

gpt-35-turbo: este modelo é econômico, tem um bom desempenho e, apesar do nome ChatGPT, pode ser usado para uma ampla variedade de tarefas além do chat e da conversa.
gpt-35-turbo-16k, gpt-4 ou gpt-4-32k: esses modelos são uma boa opção se você precisar gerar mais de 4.096 tokens ou precisar dar suporte a prompts maiores. Entretanto, esses modelos são mais dispendiosos, podem ser mais lentos e podem ter disponibilidade limitada.
Inserindo modelos: se suas tarefas incluem pesquisa, clustering, recomendações e detecção de anomalias, você deverá usar um modelo de inserção. É possível que os computadores utilizem facilmente um vetor de números que formam a inserção. A inserção é uma representação densa de informações do significado semântico de um texto. A distância entre duas inserções no espaço vetorial está correlacionada à similaridade semântica. Por exemplo, se dois textos forem semelhantes, então suas representações vetoriais também serão semelhantes.
DALL-E: esse modelo gera imagens de prompts de texto. O DALL-E difere de outros modelos de linguagem porque sua saída é uma imagem, não um texto.
Sussurro: esse modelo é treinado em um grande conjunto de dados de áudio e texto em inglês. O Whisper é otimizado para funcionalidades de conversão de fala em texto, como a transcrição de arquivos de áudio. Ele pode ser usado para transcrever arquivos de áudio que contêm fala em outros idiomas diferentes do inglês, mas a saída do modelo é um texto em inglês. Use o Whisper para transcrever rapidamente arquivos de áudio, um de cada vez, traduzir áudio de outros idiomas para o inglês ou fornecer seu prompt ao modelo para guiar a saída.

Comentários

Esta página foi útil?