Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Os agentes modernos precisam de capacidades sofisticadas de pesquisa e recuperação para aceder e processar informação de fontes de dados diversas de forma eficaz. Este artigo analisa quatro padrões principais para implementar pesquisa e recuperação em arquiteturas de agentes: as capacidades de pesquisa incorporadas da Microsoft, consultas estruturadas à base de dados, indexação semântica personalizada e abordagens híbridas em múltiplos passos.
Cada padrão oferece vantagens e compensações distintas em termos de esforço do desenvolvedor, granularidade do controlo e características de desempenho. Compreender estes padrões ajuda os arquitetos de soluções a selecionar a abordagem ótima com base nos seus casos de uso específicos, infraestrutura existente e requisitos de desempenho.
Principais considerações abordadas:
- Capacidades de pesquisa integradas da Microsoft: Esforço de desenvolvimento mínimo com limitações da plataforma
- Consultas estruturadas: Acesso direto à base de dados para valores calculados e derivados
- Indexação personalizada: controlo máximo com maior complexidade de implementação
- Abordagens híbridas: Análise abrangente com compromissos de desempenho
As secções seguintes detalham a arquitetura de cada padrão, considerações de implementação e casos de uso ótimos para orientar as suas decisões estratégicas de pesquisa e recuperação.
Capacidades de pesquisa integradas
As capacidades de pesquisa integradas da Microsoft proporcionam a abordagem de menor esforço de desenvolvimento ao utilizar índices pré-construídos mantidos pela infraestrutura Microsoft 365. Estas capacidades incluem conectores Copilot, bases de conhecimento SharePoint e funcionalidades de pesquisa web.
Este modelo proporciona integração perfeita com os ecossistemas Microsoft 365, mas limita o controlo sobre propriedades indexadas, intervalos de indexação e tipos de ficheiros suportados às capacidades oferecidas pela plataforma. A sequência e a classificação das pesquisas permanecem fora do controlo dos programadores, tornando esta abordagem adequada para cenários de pesquisa de uso geral, mas potencialmente limitativa para requisitos especializados.
Observação
Os índices semânticos retornam excertos (excertos curtos) de dados, tornando-os pouco adequados para cenários que exigem uma análise completa de documentos ou tabelas abrangentes. Casos de uso que precisam de informação de várias páginas em documentos longos ou de várias tabelas em folhas de cálculo não são ideais para este tipo de pesquisa.
Consultas estruturadas à base de dados
As arquiteturas de consulta estruturadas utilizam a capacidade dos modelos de linguagem para gerar cadeias de linguagem de consulta para execução em sistemas de bases de dados existentes. Esta abordagem otimiza fluxos de trabalho que exigem valores calculados ou derivados já resolvidos dentro dos sistemas de armazenamento de bases de dados.
Este modelo destaca-se quando os agentes precisam de aceder a dados estruturados através de linguagens de consulta já estabelecidas, incluindo SQL, KQL e DAX (Data Analysis Expressions). Vistas otimizadas da base de dados podem melhorar ainda mais o desempenho ao pré-calcular padrões comuns de consulta e simplificar o acesso a dados para modelos de linguagem.
Observação
Os programadores devem fornecer documentação abrangente e descrições de campos para permitir que os modelos de linguagem criem consultas apropriadas. Embora os modelos de linguagem sejam fluentes em linguagens de consulta, requerem contexto detalhado sobre a estrutura dos dados e as relações para gerar consultas eficazes.
Indexação semântica personalizada
A indexação semântica personalizada exige que os programadores criem índices alojados externamente com configurações personalizadas de análise sintática, classificação, dicionário e tamanho de fragmentos. Esta abordagem proporciona um controlo detalhado sobre os resultados de pesquisa e permite uma otimização especializada para tipos de conteúdo e casos de uso específicos.
Como índices semânticos personalizados apresentam-se como ferramentas externas aos agentes alojados pelo Microsoft 365, permitem ciclos de raciocínio iterativo e operações complexas de pesquisa em vários passos. Esta flexibilidade suporta cenários de pesquisa sofisticados que requerem otimização específica de domínio ou processamento especializado de conteúdos.
Abordagens híbridas de múltiplas curvas
Abordagens híbridas combinam pesquisa estruturada ou semântica para identificação inicial de ficheiros com fluxos de múltiplas voltas para uma análise abrangente de conteúdos. Este padrão proporciona raciocínio mais profundo sobre o conteúdo completo do ficheiro, ao mesmo tempo que gere as implicações de desempenho de uma análise abrangente.
Observação
Fluxos de múltiplas voltas requerem tempo extra de processamento devido a múltiplas chamadas de serviço necessárias para gerar respostas completas. Esta abordagem proporciona completude à custa dos tempos de resposta, tornando-a adequada para cenários onde a análise abrangente supera os requisitos de velocidade.
Próximo passo
Decida como o seu agente interage com sistemas externos e realiza ações para além da simples recuperação de informação.