Entender como fundamentar o seu modelo de linguagem
Os modelos de linguagem se destacam na geração de texto envolvente e são ideais como base para os agentes. Os agentes fornecem aos usuários um aplicativo intuitivo baseado em chat para receber assistência em seu trabalho. Ao projetar um agente para um caso de uso específico, você quer garantir que o modelo de linguagem seja fundamentado e utilize informações factuais relevantes para o que o usuário precisa.
Embora os modelos de linguagem sejam treinados em uma grande quantidade de dados, eles podem não ter acesso ao conhecimento que você deseja disponibilizar aos usuários. Para garantir que um agente seja baseado em dados específicos para fornecer respostas precisas e específicas do domínio, você pode usar a Geração Aumentada de Recuperação (RAG).
Noções básicas sobre o RAG
RAG é uma técnica que você pode usar para fundamentar um modelo de linguagem. Em outras palavras, é um processo para recuperar informações que são relevantes para o prompt inicial do usuário. Em termos gerais, o padrão RAG incorpora as seguintes etapas:
- Recuperar dados de aterramento com base no prompt inicial inserido pelo usuário.
- Aumentar o prompt com dados de aterramento.
- Use um modelo de linguagem para gerar uma resposta fundamentada.
Ao recuperar o contexto de uma fonte de dados especificada, você garante que o modelo de linguagem use informações relevantes ao responder, em vez de depender de seus dados de treinamento.
O uso da RAG é uma técnica poderosa e fácil de usar para muitos casos em que você deseja fundamentar seu modelo de linguagem e melhorar a precisão factual das respostas do seu aplicativo de IA generativa.
Adicionar dados de referência a um projeto de IA do Azure
Você pode usar o Microsoft Foundry para criar um agente personalizado que usa seus próprios dados para fundamentar prompts. O Microsoft Foundry dá suporte a uma variedade de conexões de dados que você pode usar para adicionar dados a um projeto, incluindo:
- Armazenamento de Blobs do Azure
- Azure Data Lake Storage Gen2
- Microsoft OneLake
Você também pode carregar arquivos ou pastas no armazenamento usado pelo projeto da Fábrica de IA.