Partilhar via


Padrões de pesquisa e recuperação

Os agentes modernos precisam de capacidades sofisticadas de pesquisa e recuperação para aceder e processar informação de fontes de dados diversas de forma eficaz. Este artigo analisa quatro padrões principais para implementar pesquisa e recuperação em arquiteturas de agentes: as capacidades de pesquisa incorporadas da Microsoft, consultas estruturadas à base de dados, indexação semântica personalizada e abordagens híbridas em múltiplos passos.

Cada padrão oferece vantagens e compensações distintas em termos de esforço do desenvolvedor, granularidade do controlo e características de desempenho. Compreender estes padrões ajuda os arquitetos de soluções a selecionar a abordagem ótima com base nos seus casos de uso específicos, infraestrutura existente e requisitos de desempenho.

Principais considerações abordadas:

As secções seguintes detalham a arquitetura de cada padrão, considerações de implementação e casos de uso ótimos para orientar as suas decisões estratégicas de pesquisa e recuperação.

Capacidades de pesquisa integradas

As capacidades de pesquisa integradas da Microsoft proporcionam a abordagem de menor esforço de desenvolvimento ao utilizar índices pré-construídos mantidos pela infraestrutura Microsoft 365. Estas capacidades incluem conectores Copilot, bases de conhecimento SharePoint e funcionalidades de pesquisa web.

Diagrama de arquitetura que mostra o fluxo de pesquisa incorporado da Microsoft através dos conectores Copilot, conhecimento do SharePoint e pesquisa web com configuração mínima por parte dos programadores.

Este modelo proporciona integração perfeita com os ecossistemas Microsoft 365, mas limita o controlo sobre propriedades indexadas, intervalos de indexação e tipos de ficheiros suportados às capacidades oferecidas pela plataforma. A sequência e a classificação das pesquisas permanecem fora do controlo dos programadores, tornando esta abordagem adequada para cenários de pesquisa de uso geral, mas potencialmente limitativa para requisitos especializados.

Observação

Os índices semânticos retornam excertos (excertos curtos) de dados, tornando-os pouco adequados para cenários que exigem uma análise completa de documentos ou tabelas abrangentes. Casos de uso que precisam de informação de várias páginas em documentos longos ou de várias tabelas em folhas de cálculo não são ideais para este tipo de pesquisa.

Consultas estruturadas à base de dados

As arquiteturas de consulta estruturadas utilizam a capacidade dos modelos de linguagem para gerar cadeias de linguagem de consulta para execução em sistemas de bases de dados existentes. Esta abordagem otimiza fluxos de trabalho que exigem valores calculados ou derivados já resolvidos dentro dos sistemas de armazenamento de bases de dados.

Diagrama que ilustra um fluxo estruturado de consultas onde modelos de linguagem extraem entidades a partir da entrada do utilizador e geram consultas SQL ou KQL para execução de bases de dados.

Este modelo destaca-se quando os agentes precisam de aceder a dados estruturados através de linguagens de consulta já estabelecidas, incluindo SQL, KQL e DAX (Data Analysis Expressions). Vistas otimizadas da base de dados podem melhorar ainda mais o desempenho ao pré-calcular padrões comuns de consulta e simplificar o acesso a dados para modelos de linguagem.

Observação

Os programadores devem fornecer documentação abrangente e descrições de campos para permitir que os modelos de linguagem criem consultas apropriadas. Embora os modelos de linguagem sejam fluentes em linguagens de consulta, requerem contexto detalhado sobre a estrutura dos dados e as relações para gerar consultas eficazes.

Indexação semântica personalizada

A indexação semântica personalizada exige que os programadores criem índices alojados externamente com configurações personalizadas de análise sintática, classificação, dicionário e tamanho de fragmentos. Esta abordagem proporciona um controlo detalhado sobre os resultados de pesquisa e permite uma otimização especializada para tipos de conteúdo e casos de uso específicos.

Diagrama de arquitetura mostrando implementação personalizada de índice semântico com alojamento externo, análise sintática personalizada e controlo detalhado de resultados de pesquisa.

Como índices semânticos personalizados apresentam-se como ferramentas externas aos agentes alojados pelo Microsoft 365, permitem ciclos de raciocínio iterativo e operações complexas de pesquisa em vários passos. Esta flexibilidade suporta cenários de pesquisa sofisticados que requerem otimização específica de domínio ou processamento especializado de conteúdos.

Abordagens híbridas de múltiplas curvas

Abordagens híbridas combinam pesquisa estruturada ou semântica para identificação inicial de ficheiros com fluxos de múltiplas voltas para uma análise abrangente de conteúdos. Este padrão proporciona raciocínio mais profundo sobre o conteúdo completo do ficheiro, ao mesmo tempo que gere as implicações de desempenho de uma análise abrangente.

Diagrama que mostra a abordagem de pesquisa híbrida usando pesquisa inicial para identificar ficheiros, seguida de fluxos de múltiplas voltas para extração e raciocínio completos de conteúdo.

Observação

Fluxos de múltiplas voltas requerem tempo extra de processamento devido a múltiplas chamadas de serviço necessárias para gerar respostas completas. Esta abordagem proporciona completude à custa dos tempos de resposta, tornando-a adequada para cenários onde a análise abrangente supera os requisitos de velocidade.

Próximo passo

Decida como o seu agente interage com sistemas externos e realiza ações para além da simples recuperação de informação.