Compartir a través de


Patrones de búsqueda y recuperación

Los agentes modernos necesitan capacidades sofisticadas de búsqueda y recuperación para acceder y procesar información de diversas fuentes de datos de manera eficaz. Este artículo examina cuatro patrones principales para implementar búsqueda y recuperación en arquitecturas de agentes: las capacidades de búsqueda integradas de Microsoft, consultas estructuradas a bases de datos, indexación semántica personalizada y enfoques híbridos de varios pasos.

Cada patrón ofrece ventajas y compensaciones distintas en cuanto al esfuerzo del desarrollador, la granularidad del control y las características de rendimiento. Comprender estos patrones ayuda a los arquitectos de soluciones a seleccionar el enfoque óptimo en función de sus casos de uso específicos, la infraestructura existente y los requisitos de rendimiento.

Consideraciones clave cubiertas:

Las siguientes secciones detallan la arquitectura de cada patrón, consideraciones de implementación y casos de uso óptimos para guiar tus decisiones estratégicas de búsqueda y recuperación.

Capacidades de búsqueda integradas

Las capacidades de búsqueda integradas de Microsoft ofrecen el enfoque de menor esfuerzo para desarrolladores utilizando índices preconstruidos mantenidos por la infraestructura de Microsoft 365. Estas capacidades incluyen conectores Copilot, bases de conocimiento de SharePoint y funcionalidades de búsqueda web.

Diagrama de arquitectura que muestra el flujo de búsqueda integrado de Microsoft a través de conectores Copilot, conocimientos de SharePoint y búsqueda web con mínima configuración de desarrollador requerida.

Este modelo proporciona una integración fluida con los ecosistemas de Microsoft 365, pero limita el control sobre propiedades indexadas, intervalos de indexación y tipos de archivo soportados a las capacidades ofrecidas por la plataforma. La secuencia y el ranking de las búsquedas permanecen fuera del control del desarrollador, lo que hace que este enfoque sea adecuado para escenarios de búsqueda de propósito general, pero potencialmente limitado para requisitos especializados.

Nota:

Los índices semánticos devolven fragmentos (extractos cortos) de datos, lo que los hace poco adecuados para escenarios que requieren un análisis completo de documentos o tablas. Los casos de uso que requieren información de varias páginas en documentos largos o de varias tablas dentro de hojas de cálculo no son óptimos para este tipo de búsqueda.

Consultas estructuradas a bases de datos

Las arquitecturas de consulta estructuradas utilizan la capacidad de los modelos de lenguaje para generar cadenas de lenguaje de consulta para su ejecución contra sistemas de bases de datos existentes. Este enfoque optimiza los flujos de trabajo que requieren valores calculados o derivados ya resueltos dentro de los sistemas de almacenamiento de bases de datos.

Diagrama que ilustra el flujo estructurado de consultas donde los modelos de lenguaje extraen entidades de la entrada del usuario y generan consultas SQL o KQL para la ejecución de bases de datos.

Este modelo destaca cuando los agentes necesitan acceder a datos estructurados mediante lenguajes de consulta establecidos como SQL, KQL y DAX (Expresiones de Análisis de Datos). Las vistas optimizadas de bases de datos pueden mejorar aún más el rendimiento precalculando patrones comunes de consulta y simplificando el acceso a los datos para modelos de lenguaje.

Nota:

Los desarrolladores deben proporcionar documentación completa y descripciones de campo para permitir que los modelos de lenguaje generen consultas adecuadas. Aunque los modelos de lenguaje son fluidos en lenguajes de consulta, requieren un contexto detallado sobre la estructura de datos y las relaciones para generar consultas efectivas.

Indexación semántica personalizada

La indexación semántica personalizada requiere que los desarrolladores creen índices alojados externamente con configuraciones personalizadas de análisis sintáctico, clasificación, diccionario y tamaño de fragmento. Este enfoque proporciona un control detallado sobre los resultados de búsqueda y permite una optimización especializada para tipos de contenido y casos de uso específicos.

Diagrama de arquitectura que muestra la implementación personalizada de índices semánticos con alojamiento externo, análisis personalizado y control detallado de resultados de búsqueda.

Dado que los índices semánticos personalizados se presentan como herramientas externas a los agentes alojados en Microsoft 365, permiten bucles de razonamiento iterativo y operaciones complejas de búsqueda en varios pasos. Esta flexibilidad soporta escenarios de búsqueda sofisticados que requieren optimización específica de dominio o procesamiento especializado de contenido.

Enfoques híbridos de múltiples vueltas

Los enfoques híbridos combinan búsqueda estructurada o semántica para la identificación inicial de archivos con flujos de varios turnos para un análisis de contenido exhaustivo. Este patrón proporciona un razonamiento más profundo sobre el contenido completo del archivo, al tiempo que gestiona las implicaciones de rendimiento de un análisis exhaustivo.

Diagrama que muestra el enfoque de búsqueda híbrida usando la búsqueda inicial para identificar archivos, seguido de flujos de varios turnos para la extracción y razonamiento completos de contenido.

Nota:

Los flujos de varios turnos requieren un tiempo de procesamiento adicional debido a múltiples llamadas de servicio necesarias para generar respuestas completas. Este enfoque proporciona integridad a costa de tiempos de respuesta, lo que lo hace adecuado para escenarios donde el análisis integral supera los requisitos de velocidad.

Paso siguiente

Decide cómo interactúa tu agente con sistemas externos y realiza acciones más allá de la simple recuperación de información.