Compartir a través de


¿Qué es un origen de conocimiento?

Nota:

Esta característica actualmente está en su versión preliminar pública. Esta versión preliminar se ofrece sin contrato de nivel de servicio y no es aconsejable usarla en las cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios para las versiones preliminares de Microsoft Azure.

Un origen de conocimiento especifica el contenido usado para la recuperación agéntica. Encapsula un índice de búsqueda que se rellena mediante un origen de datos externo o es una conexión directa a un origen remoto, como Bing o Sharepoint que se consulta directamente. Un origen de conocimiento es una definición necesaria en una base de conocimiento.

  • Cree un origen de conocimiento como un recurso de nivel superior en el servicio de búsqueda. Cada origen de conocimiento apunta exactamente a una estructura de datos, ya sea un índice de búsqueda que cumpla los criterios para la recuperación agente o un recurso externo admitido.

  • Haga referencia a uno o varios orígenes de conocimiento en una base de conocimiento. En una canalización de recuperación de agentes, es posible consultar en varias fuentes de conocimiento en una sola solicitud. Las subconsultas se generan para cada origen de conocimiento. Los resultados principales se devuelven en la respuesta de recuperación.

  • Para determinados orígenes de conocimiento, puede usar una definición de origen de conocimiento para generar una canalización completa del indexador (origen de datos, conjunto de habilidades, indexador e índice) que funcione para la recuperación agentiva. En lugar de crear varios objetos manualmente, la información del origen de conocimiento se usa para generar todos los objetos, incluido un índice rellenado, fragmentado y en el que se pueden buscar.

Asegúrese de que tiene al menos un origen de conocimiento antes de crear una base de conocimiento. La especificación completa de un origen de conocimiento y una base de conocimiento se puede encontrar en la referencia de la API REST en versión preliminar.

Trabajar con un origen de conocimiento

  • Ruta de creación: cree primero un origen de conocimiento y, a continuación, cree una base de conocimiento.

  • Ruta de eliminación: actualice o elimine las bases de conocimiento para quitar referencias a un origen de conocimiento y, a continuación, elimine el origen de conocimiento en último lugar.

  • Un origen de conocimiento, su índice y la base de conocimiento deben existir en el mismo servicio de búsqueda. Se accede al contenido externo a través de la red pública de Internet (Bing) o en un inquilino de Microsoft (SharePoint remoto).

Orígenes de conocimientos compatibles

Estas son las fuentes de conocimiento que puede crear en esta versión preliminar:

Kind Indexado o remoto
"searchIndex" La API encapsula un índice existente. .Indexado
"azureBlob" API genera una canalización de indexador que extrae datos de un contenedor de blobs. .Indexado
"indexedOneLake" La API genera una canalización de indexador que extrae de una instancia de un almacén de lago de datos. .Indexado
"indexedSharePoint" La API genera una canalización de indexador que extrae de un sitio de SharePoint. .Indexado
"remoteSharePoint" LA API recupera el contenido directamente de SharePoint. Remote
"webParameters" LA API recupera datos de referencia en tiempo real de Microsoft Bing. Remote

Los orígenes de conocimientos indexados apuntan al índice de destino en Azure AI Search y la ejecución de consultas es local para el motor de búsqueda en el servicio de búsqueda. Las funcionalidades de palabra clave (búsqueda de texto completo), vector y consulta híbrida se usan para recuperar datos de orígenes de conocimiento indexados.

Se accede a orígenes de conocimiento remotos en el momento de la consulta. El motor de recuperación agente llama a las API de recuperación que son nativas de la plataforma (API de Bing o SharePoint).

Todo el contenido recuperado, ya sea indizado o remoto, se extrae en la canalización de clasificación en Azure AI Search, donde se puntúa por relevancia, se combina en caso de múltiples consultas, se vuelve a clasificar y se devuelve en la respuesta de recuperación.

Creación de orígenes de conocimiento

Los orígenes de conocimiento se crean como objetos independientes y, a continuación, se especifican en una base de conocimiento en un array "knowledgeSources".

Debe tener permisos de colaborador del servicio de búsqueda para crear objetos en un servicio de búsqueda. También necesita permisos de Search Index Data Contributor para cargar un índice si está utilizando una fuente de conocimiento que crea una canalización de indexador. Como alternativa, puede usar una clave de administrador de API en lugar de roles.

Puede usar la API REST o un paquete de versión preliminar del SDK de Azure para crear un origen de conocimiento. La compatibilidad con Azure Portal está disponible para determinados orígenes de conocimiento. Los vínculos siguientes proporcionan instrucciones para crear un origen de conocimiento:

Una vez creado el origen de conocimiento, puede hacer referencia a él en una base de conocimiento.

Uso de orígenes de conocimiento

El uso del origen de conocimiento se controla explícitamente, como cuando se establece alwaysQuery en la definición del origen de conocimiento o está sujeto a la lógica de selección durante el planeamiento de consultas. La planificación de consultas se produce cuando se usa un esfuerzo de razonamiento de recuperación bajo o medio. Para un esfuerzo de razonamiento mínimo, todos los orígenes de conocimiento enumerados en la base de conocimiento están en el ámbito de cada consulta. En el caso de una base de conocimiento de nivel bajo y medio, la base de conocimiento y el LLM pueden determinar en el momento de la consulta qué orígenes de conocimiento probablemente proporcionen el mejor corpus de búsqueda.

La lógica de selección del origen de conocimiento se basa en estos factores:

  • ¿Está alwaysQuery configurado? Si es así, el origen de conocimiento siempre se usa en cada consulta.

  • El name de la fuente de conocimientos.

  • El description de un índice, tomando una fuente de conocimientos indexada.

  • El retrievalInstructions especificado en la acción de recuperación o en la definición de la base de conocimiento proporciona instrucciones que incluyen o excluyen un origen de conocimiento. Es similar a un aviso. Puede especificar brevedad, tono y formato como instrucción de recuperación.

  • outputMode en una base de conocimiento también afecta al resultado de la consulta y al contenido de la respuesta.

Uso de un esfuerzo de razonamiento de recuperación para controlar el uso de LLM

No todas las soluciones se benefician del planeamiento y ejecución de consultas LLM. Si la simplicidad y la velocidad superan las ventajas que ofrece la planificación de consultas y la ingeniería de contexto del LLM, puede definir un esfuerzo de razonamiento mínimo para impedir el procesamiento del LLM en la canalización.

Para un nival bajo o medio, el nivel de procesamiento de LLM adopta un enfoque equilibrado o máximo que mejora la relevancia. Para obtener más información, consulte la sección Configuración del esfuerzo de razonamiento para la recuperación.

Nota:

Si usó attemptFastPath en la versión preliminar anterior, ese enfoque ahora se reemplaza por retrievalReasoningEffort establecido en minimal.