Partager via


Données non structurées en tant que source de connaissances

Copilot Studio vous permet d’enrichir vos assistants avec des connaissances spécifiques à votre domaine, alimentées par les mêmes sources de données fiables et familières que vous utilisez déjà grâce aux connecteurs Power Platform.

En chargeant du contenu externe à partir de votre appareil, OneDrive ou SharePoint, vous pouvez enrichir vos assistants avec des connaissances contextuelles adaptées à votre entreprise. Ces fichiers sont stockés en toute sécurité dans Microsoft Dataverse et automatiquement traités pour être transformés en index sémantiques et en incorporations vectorielles. Cette configuration permet à vos assistants de générer des réponses plus précises, ancrées sur les informations que vous fournissez.

Les fichiers chargés dans Copilot Studio utilisent Microsoft Dataverse pour ingérer des fichiers bruts afin de créer des index et des incorporations vectorielles qui aident vos assistants à fournir des réponses de qualité. Ces fichiers peuvent être chargés à partir de votre ordinateur ou en vous connectant à OneDrive ou SharePoint.

Le chargement de fichiers en tant que sources de connaissances aide les créateurs à enrichir leurs agents avec des données supplémentaires, ce qui augmente les connaissances du modèle de langage et ancre l’agent dans des informations spécifiques fournies par le créateur. Les créateurs peuvent charger différents fichiers qui sont indexés sémantiquement en tant qu’incorporations vectorielles, puis utilisés comme sources de connaissance par les assistants. Ces connaissances utilisées par les assistants peuvent ensuite être partagées avec les utilisateurs de l’assistant, authentifiés et non authentifiés.

Graphique représentant les interactions entre les créateurs d’assistants et les utilisateurs des assistants, ainsi que la manière dont les sources de connaissances récupèrent les informations à fournir à l’utilisateur.

Afin d’améliorer les réponses de l’assistant, les fichiers chargés sont découpés en segments pour un traitement plus rapide, puis indexés sous forme de vecteurs afin de fournir des correspondances sémantiques avec la requête de l’utilisateur. Les fichiers sont stockés en toute sécurité dans Dataverse. Lorsqu’un utilisateur interroge un assistant, Copilot Studio trouve les blocs les plus pertinents qui correspondent à l’intention de la requête utilisateur et retourne les résultats à ce dernier. 

De la même manière, Dataverse ingère les fichiers OneDrive, les fichiers SharePoint (via les options de chargement de fichiers), ainsi que des contenus non structurés comme des articles de base de connaissances provenant d’autres systèmes d’entreprise tels que Salesforce, ServiceNow, Confluence et Zendesk, afin d’offrir de meilleurs résultats sémantiques à l’assistant.

Note

Pour plus d’informations sur l’utilisation de données structurées, consultez Utiliser l’interpréteur de code pour analyser des données structurées.

Connecteurs Power Platform pour les données non structurées

Les connecteurs Power Platform suivants sont configurés pour fonctionner avec des sources de données non structurées :

OneDrive

OneDrive permet aux créateurs d’utiliser une interface de sélecteur de fichiers pour choisir les fichiers et dossiers qu’ils souhaitent inclure. Une fois sélectionnés, les éléments sont récupérés dans Dataverse et indexés en vue d’une utilisation. Les dossiers ajoutés incluent tous les fichiers et sous-dossiers pris en charge dans ce dossier jusqu’à la limite totale de fichiers.

SharePoint

Les documents SharePoint permettent aux créateurs d’utiliser une interface de sélecteur de fichiers pour choisir les fichiers et dossiers qu’ils souhaitent inclure. Une fois sélectionnés, les éléments sont récupérés dans Dataverse et indexés en vue d’une utilisation. Les dossiers ajoutés incluent tous les fichiers et sous-dossiers pris en charge dans ce dossier jusqu’à la limite totale de fichiers. Actuellement, les pages ne sont pas prises en charge.

Salesforce

Le connecteur Salesforce pour les données non structurées prend en charge la possibilité de récupérer des bases de connaissances contenant des articles de connaissances. Les créateurs sélectionnent une base de connaissances et tous les articles de cette base de connaissances sont indexés pour être utilisés. Il n’est pas possible de sélectionner des articles ou des rubriques individuels. Lors de l’interrogation de données, il n’est pas possible de spécifier un article ou une base de connaissances spécifique. La liste des connaissances affiche un seul objet pour tous les objets de la base de connaissances que vous sélectionnez lors de la création de la source.

ServiceNow

Le connecteur ServiceNow pour les données non structurées prend en charge la possibilité de récupérer des bases de connaissances contenant des articles de base de connaissances. Les bases de connaissances contiennent des articles. Les créateurs sélectionnent une base de connaissances et tous les articles de cette base de connaissances sont indexés pour être utilisés. Les articles individuels ne peuvent pas être sélectionnés. Lors de l’interrogation de données, il n’est pas possible de spécifier une base de connaissances, un article ou un dossier spécifique. La liste des connaissances affiche un seul objet pour tous les objets de la base de connaissances que vous sélectionnez lors de la création de la source.

Confluence

Le connecteur Confluence pour les données non structurées prend en charge la possibilité de récupérer les espaces contenant des pages, les sous-dossiers sont également pris en charge. Les pages individuelles ne peuvent pas être sélectionnées. Lors de l’interrogation de données, il n’est pas possible de spécifier une page. La liste des connaissances affiche un seul objet pour toutes les pages de l’espace.

Zendesk

Le connecteur Zendesk pour les données non structurées prend en charge la possibilité de récupérer la base de connaissances contenant des articles de base de connaissances. Il n’est pas possible de sélectionner des articles, des catégories ou des sections individuels. Lors de l’interrogation de données, il n’est pas possible de spécifier un article, une catégorie ou une section. La liste des connaissances affiche un objet unique pour tous les articles de la base de connaissances.

Sécurité

Lorsqu’un utilisateur interroge un assistant qui utilise une source de connecteur Power Platform, quelques vérifications d’autorisation sont effectuées.

Accès aux connecteurs

Lorsqu’un créateur utilise d’abord une source basée sur un connecteur, il est invité à sélectionner un connecteur Power Platform existant ou à en ajouter un. Ce processus garantit que les données sont partagées uniquement avec les créateurs disposant des autorisations appropriées et qu’il donne accès à la source de données elle-même.

Accès au contenu

Lorsqu’une requête est effectuée, les informations de connexion de l’utilisateur sont utilisées pour interroger la source de données afin de vérifier qu’il dispose de l’autorisation d’accéder au contenu. Même si les blocs et les index sont stockés localement dans Dataverse, une vérification en direct est effectuée sur les requêtes pour vérifier que l’utilisateur actuel a accès aux données avant de fournir un résumé ou une réponse.

Note

  • Si un utilisateur ne dispose pas des autorisations pour un ensemble spécifique de fichiers ou d’articles de base de connaissances, aucun résultat ne lui est renvoyé et il reçoit le message standard « aucun résultat n’a pu être trouvé ». Si les utilisateurs estiment que des résultats devraient être disponibles pour cette source, ils doivent contacter leurs administrateurs afin de s’assurer qu’ils disposent bien des droits d’accès aux données qu’ils tentent de consulter.
  • Les informations d’autorisation de contenu ne sont pas stockées localement. Toutes les vérifications d’autorisation sont effectuées en direct avec la source pour s’assurer qu’elles sont les plus à jour.

Fréquence d’actualisation des fichiers et de synchronisation

Les fichiers connectés à partir de OneDrive et SharePoint, et les articles de connaissances non structurés sont conservés à l’aide d’un travail de synchronisation planifié. Ce travail s’exécute automatiquement en arrière-plan, en actualisant le contenu des fichiers et en réindexant les modifications pour fournir des résultats précis en réponse aux requêtes. Les actualisations gèrent non seulement les modifications apportées au contenu, mais vérifient également que tout contenu supprimé de la source n’apparaît plus dans les réponses aux requêtes. Actuellement, il n’existe aucun moyen de déclencher manuellement une actualisation.

Pour plus d’informations sur le minutage de la fréquence d’actualisation, accédez aux limites de la source de connaissances de données non structurées Copilot Studio.

Gestion des licences

Toutes les requêtes impliquant des connaissances sont facturées selon les tarifs de messagerie des réponses génératives Microsoft Copilot. Pour plus d’informations, consultez Taux de facturation et gestion.

Si les sources de connaissances exigent que les données soient ingérées, le stockage des données et les index correspondants pour récupérer ces données seront soumis aux droits de stockage dont dispose le client. Pour plus d’informations sur la recherche en langage naturel Dataverse, accédez à Améliorer les expériences basées sur l’IA avec la recherche Dataverse.

Limites et limitations

Lors de la première activation de la prise en charge des données non structurées, un délai de 5 à 30 minutes peut être nécessaire pour la configuration et l’indexation de Dataverse avant que les fichiers ajoutés ne soient traités. La durée dépend de la taille de l’environnement Dataverse actuel.

Chaque assistant peut avoir un maximum de 500 objets de connaissances. Ces objets peuvent être des fichiers, des dossiers, des articles de connaissances, des sites web ou d’autres sources.

À ce stade, seules cinq sources différentes peuvent être utilisées à la fois dans un assistant. Par exemple, SharePoint, Dataverse, OneDrive ou d’autres sources.

Pour plus d’informations sur les limites et limitations spécifiques aux sources de données non structurées prises en charge, consultez Limites de la source de connaissances de données non structurées dans Copilot Studio.

Note

Les assistants Copilot Studio ont besoin de la recherche Dataverse pour utiliser cette source de connaissances. Si vous ne pouvez pas ajouter un fichier compatible Dataverse à un assistant, demandez à votre administrateur d’activer la recherche Dataverse dans votre environnement. Pour plus d’informations sur la recherche Dataverse et sur la façon de la gérer, consultez Qu’est-ce que la recherche Dataverse ? et Configurer la recherche Dataverse dans votre environnement.

FAQ

L’icône SharePoint ne s’affiche pas dans la section Charger des fichiers de la boîte de dialogue Ajouter des connaissances ?

Il existe un léger délai entre l’installation d’une solution et son affichage dans toutes les organisations existantes. Pour lancer une mise à jour manuelle, procédez comme suit :

  1. Connectez-vous au centre d'administration Power Platform utilisant les identifiants d'administrateur.
  2. Dans la navigation latérale, sélectionnez Gérer.
  3. Dans la liste des produits, sélectionnez Applications Dynamics 365. Un volet s’ouvre alors.
  4. Recherchez « PowerAIExtensions ».
  5. Sélectionnez les trois points (...) pour Microsoft Dynamics 365 - PowerAIExtensions et sélectionnez Installer.
  6. Dans le menu déroulant, sélectionnez votre environnement, puis choisissez Installer.
  7. Une fois l’installation terminée, ouvrez Power Apps dans une nouvelle fenêtre.
  8. Dans le volet de gauche, sélectionnez Solutions.
  9. Sélectionnez Voir l’historique.
  10. Recherchez « PowerAIExtensions_Anchor » et vérifiez que la version est définie sur 1.01.688 ou version ultérieure.

Dans la boîte de dialogue Ajouter des connaissances, quelle est la différence entre les deux options SharePoint ?

Dans la boîte de dialogue Ajouter des connaissances, il existe deux options SharePoint. L’option SharePoint dans la section de chargement de fichiers (1) est utilisée pour charger des fichiers ou dossiers SharePoint individuels et active les fonctionnalités de synchronisation de fichiers. L’autre option SharePoint (2) fournit la prise en charge complète de SharePoint dans Copilot Studio.

Capture d’écran de la boîte de dialogue Ajouter des connaissances, mettant en évidence les deux options SharePoint.

Que se passe-t-il si j’ajoute plus de 500 objets de connaissances à mon assistant ?

Vous ne pouvez pas ajouter davantage d’objets, sauf si vous supprimez d’abord des objets précédents.

Chaque assistant dispose-t-il son propre index de la source de connaissances ?

Les sources de connaissances sont stockées dans Dataverse afin d’être utilisées dans l’environnement où elles ont été créées. Si le même dossier SharePoint est utilisé dans plusieurs assistants, une seule instance de ce dossier est utilisée pour l’ensemble des assistants.

Que se passe-t-il si je sélectionne un dossier qui dépasse le nombre maximal de fichiers, de dossiers et de sous-dossiers lors de l’ajout d’une source SharePoint ou OneDrive ?

Copilot Studio récupère et indexe jusqu’au nombre maximal de fichiers, dossiers et sous-dossiers, et procède à leur indexation. Les fichiers restants ne sont pas traités. Actuellement, aucune message n’indique ce qui a été ou n’a pas été traité.

L’un des fichiers que j’ai ajoutés (ou qui faisait partie d’un dossier que j’ai ajouté) apparaît dans la source de connaissances, mais je n’obtiens aucune réponse à partir de celui-ci. Pourquoi ?

Cela peut être dû à l’une des raisons suivantes :

  • Le fichier ou le dossier est défini sur « Prêt » sur la page Connaissances.
  • Vérifiez que le nom de fichier n’inclut pas de caractère non pris en charge (en particulier pour les fichiers SharePoint).
  • Assurez-vous que le fichier ne dispose pas du paramètre de confidentialité Confidentiel ou Hautement confidentiel, ni d’une protection par mot de passe.
  • Vérifiez qu’il s’agit d’un type de fichier pris en charge.
  • Si le fichier ou le dossier provient du site OneDrive ou SharePoint d’un autre utilisateur, vérifiez qu’il est partagé avec le créateur.
  • S’il s’agit d’un fichier de base de connaissances, assurez-vous que votre compte dispose des autorisations nécessaires pour afficher le contenu dans le système source.