Partager via


Qu’est-ce qu’une source de connaissances ?

Note

Cette fonctionnalité est actuellement disponible en préversion publique. Cette préversion est fournie sans contrat de niveau de service et n’est pas recommandée pour les charges de travail de production. Certaines fonctionnalités peuvent être limitées ou non prises en charge. Pour plus d’informations, consultez Conditions d’utilisation supplémentaires pour les préversions de Microsoft Azure.

Une source de connaissances spécifie le contenu utilisé pour la récupération agentique. Il encapsule un index de recherche rempli par des données externes, ou il s’agit d’une connexion directe à une cible distante telle que Bing ou SharePoint interrogée directement. Une source de connaissances est une définition requise dans une base de connaissances.

  • Créez une source de connaissances en tant que ressource de niveau supérieur sur votre service de recherche. Chaque source de connaissances pointe vers exactement une structure de données, soit un index de recherche qui répond aux critères de récupération agentique ou une ressource externe prise en charge.

  • Référencez une ou plusieurs sources de connaissances dans une base de connaissances. Dans un pipeline de récupération agentique, vous pouvez interroger plusieurs sources de connaissances dans une seule requête. Les sous-requêtes sont générées pour chaque source de connaissances. Les résultats principaux sont renvoyés dans la réponse de récupération.

  • Pour certaines sources de connaissances, vous pouvez utiliser une définition de source de connaissances pour générer un pipeline d’indexeur complet (source de données, ensemble de compétences, indexeur et index) qui fonctionne pour la récupération agentique. Au lieu de créer manuellement plusieurs objets, les informations de la source de connaissances sont utilisées pour générer tous les objets, y compris un index rempli, segmenté et pouvant faire l’objet d’une recherche.

Vérifiez que vous disposez d’au moins une source de connaissances avant de créer une base de connaissances. Vous trouverez la spécification complète d’une source de connaissances et d’une base de connaissances dans la référence de l’API REST en préversion.

Utilisation d’une source de connaissances

  • Chemin de création : créez d’abord une source de connaissances, puis créez une base de connaissances.

  • Chemin de suppression : mettez à jour ou supprimez des bases de connaissances pour supprimer des références à une source de connaissances, puis supprimez la source de connaissances en dernier.

  • Une source de connaissances, son index et la base de connaissances doivent toutes exister sur le même service de recherche. Le contenu externe est accessible via l'Internet public (Bing) ou dans un tenant Microsoft (SharePoint distant).

Sources de connaissances prises en charge

Dans cette préversion, vous pouvez créer les sources de connaissances suivantes :

Kind Indexé ou distant
"searchIndex" L’API encapsule un index existant. Indexé
"azureBlob"L’API génère un pipeline d’indexeur qui provient d’un conteneur blob. Indexé
"indexedOneLake" L’API génère un pipeline d’indexeur qui extrait d’un lakehouse. Indexé
"indexedSharePoint" L’API génère un pipeline d’indexeur qui extrait à partir d’un site SharePoint. Indexé
"remoteSharePoint" L’API récupère du contenu directement à partir de SharePoint. Remote
"webParameters" L’API récupère les données de base en temps réel de Microsoft Bing. Remote

Les sources de connaissances indexées pointent vers un index cible sur Recherche IA Azure. L’exécution de requête est locale dans le moteur de recherche de votre service de recherche. Les fonctionnalités de mot clé (recherche en texte intégral), de vecteur et de requête hybride sont utilisées pour récupérer des données à partir de sources de connaissances indexées.

Vous accédez aux sources de connaissances distantes au moment de la requête. Le moteur de récupération agentique appelle les API de récupération natives de la plateforme (API Bing ou SharePoint).

Tout le contenu récupéré, qu’il soit indexé ou distant, est extrait dans le pipeline de tri dans Recherche IA Azure où sa pertinence est évaluée, fusionné dans le cas de requêtes multiples, reclassé et retourné dans la réponse de recherche.

Création de sources de connaissances

Créez des sources de connaissances en tant qu’objets autonomes. Ensuite, spécifiez-les dans une base de connaissances dans un tableau « knowledgeSources ».

Pour créer des objets sur un service de recherche, vous avez besoin d’autorisations Contributeur de service de recherche. Si vous utilisez une source de connaissances qui crée un pipeline d’indexeur, vous avez également besoin des droits de Contributeur aux données d’index de recherche pour charger un index. Vous pouvez également utiliser une clé d’administration d’API au lieu de rôles.

Utilisez l’API REST ou un package de préversion du Kit de développement logiciel (SDK) Azure pour créer une source de connaissances. La prise en charge du portail Azure est disponible pour certaines sources de connaissances. Les liens suivants fournissent des instructions pour créer une source de connaissances :

Après avoir créé la source de connaissances, référencez-la dans une base de connaissances.

Utilisation de sources de connaissances

Vous pouvez contrôler explicitement l’utilisation de la source de connaissances en définissant alwaysQuery la définition de la source de connaissances ou en guidant les instructions utilisées lors de la planification des requêtes. Les instructions de direction font référence à des descriptions sur un index ou à des instructions de récupération explicites dans la source de connaissances, qui fournissent des conseils sur le moment où utiliser l’index. La planification des requêtes se produit lorsque vous utilisez un effort de raisonnement de récupération faible ou moyen à partir du LLM. Pour un effort de raisonnement minimal, toutes les sources de connaissances répertoriées dans la base de connaissances sont dans l’étendue de chaque requête. Pour les niveaux faibles et moyens, la base de connaissances et le LLM peuvent déterminer au moment de la requête quelles sources de connaissances sont susceptibles de fournir le corpus de recherche le plus pertinent.

La logique de sélection de la source de connaissances est basée sur ces facteurs :

  • Est-ce que alwaysQuery est défini ? Si c’est le cas, la source de connaissances est toujours utilisée sur chaque requête.

  • Le name de la source de connaissances.

  • L'index description, en supposant une source de connaissances indexée.

  • Le retrievalInstructions spécifié dans l’action de récupération ou dans la définition de la base de connaissances fournit des conseils qui incluent ou excluent une source de connaissances. C’est similaire à une invite. Vous pouvez spécifier la concision, le ton et la mise en forme en tant qu’instruction de récupération.

  • outputMode sur une base de connaissances affecte également le résultat de la requête et le contenu de la réponse.

Utiliser un effort de raisonnement de récupération pour contrôler l’utilisation de LLM

Toutes les solutions ne bénéficient pas de la planification et de l’exécution des requêtes LLM. Si la simplicité et la vitesse l’emportent sur les avantages que procure la planification des requêtes LLM et l’ingénierie contextuelle, spécifiez un effort de raisonnement minimal pour empêcher le traitement LLM dans votre pipeline.

Pour les niveaux faible et moyen, le traitement LLM utilise une approche équilibrée ou maximale qui améliore la pertinence. Pour plus d’informations, consultez Définir l’effort de raisonnement de récupération.

Note

Si vous avez utilisé attemptFastPath dans la préversion précédente, cette approche est maintenant remplacée par retrievalReasoningEffort défini sur minimal.