Compartir a través de


Los datos no estructurados como fuente de conocimiento

Copilot Studio permite mejorar sus agentes con conocimientos específicos del dominio basados en los mismos orígenes de datos conocidos y de confianza que ha estado creando a través de conectores de Power Platform.

Al cargar contenido externo desde el dispositivo, OneDrive o SharePoint, puede enriquecer los agentes con conocimientos contextuales adaptados a su empresa. Estos archivos se almacenan de forma segura en Microsoft Dataverse y se procesan automáticamente en índices semánticos e incrustaciones de vectores. Esta configuración permite a los agentes generar respuestas más precisas y basadas en la información que proporcione.

Los archivos cargados en Copilot Studio usan Microsoft Dataverse para ingerir archivos sin procesar para crear índices e incrustaciones vectoriales que ayudan a proporcionar respuestas de calidad para los agentes. Estos archivos se pueden cargar desde el equipo o mediante la conexión a OneDrive o SharePoint.

Cargar archivos como orígenes de conocimiento ayuda a los creadores a enriquecer sus agentes con datos adicionales, aumentar el conocimiento del modelo de lenguaje y fundamentar el agente en información específica proporcionada por el creador. Los creadores pueden cargar varios archivos que se indexan semánticamente como incrustaciones vectoriales y, a continuación, se usan como conocimiento para los agentes. Este conocimiento utilizado por los agentes se puede compartir con usuarios con autenticación y sin autenticación del agente.

Gráfico que muestra las interacciones entre los creadores de agentes y los usuarios de los agentes, y cómo recuperan los orígenes de conocimiento la información que se va a proporcionar al usuario.

Para mejorar las respuestas de los agentes, los archivos cargados se dividen en fragmentos para acelerar su procesamiento y se indexan mediante vectores para proporcionar coincidencias semánticas con la consulta del usuario. Los archivos se almacenan de forma segura en Dataverse. Cuando un usuario consulta a través de un agente, Copilot Studio busca los fragmentos más relevantes que coinciden con la intención de la consulta del usuario y devuelve los resultados al usuario. 

De forma similar, Dataverse ingiere archivos de OneDrive, archivos de SharePoint (con las opciones de carga de archivos) y contenido no estructurado, como artículos de knowledge base de otros sistemas empresariales como Salesforce, ServiceNow, Confluence y ZenDesk para proporcionar mejores resultados semánticos para el agente.

Nota

Para obtener más información sobre el uso de datos estructurados, consulte Uso del intérprete de código para analizar datos estructurados.

Conectores de Power Platform para datos no estructurados

Los siguientes conectores de Power Platform están configurados para trabajar con orígenes de datos no estructurados:

OneDrive

Una unidad permite a los creadores usar una interfaz de selector de archivos para elegir los archivos y carpetas que desean incluir. Una vez seleccionado, los elementos se recuperan en Dataverse e indexan para su uso. Las carpetas agregadas incluyen todos los archivos y subcarpetas compatibles dentro de esa carpeta hasta el límite total de archivos.

SharePoint

Los documentos de SharePoint permiten a los creadores usar una interfaz de selector de archivos para elegir los archivos y carpetas que desean incluir. Una vez seleccionado, los elementos se recuperan en Dataverse e indexan para su uso. Las carpetas agregadas incluyen todos los archivos y subcarpetas compatibles dentro de esa carpeta hasta el límite total de archivos. Actualmente, no hay soporte para Pages.

Salesforce

El conector de Salesforce para datos no estructurados admite la capacidad de recuperar bases de conocimiento que contienen artículos de conocimiento. Los creadores seleccionan una base de conocimientos y todos los artículos de esa base de conocimientos se indexan para su uso. No se pueden seleccionar artículos o temas individuales. Al consultar datos, no es posible especificar un artículo o una base de conocimiento específicos. La lista de conocimientos muestra un único objeto para todos los objetos de conocimiento que seleccione al crear el origen.

ServiceNow

El conector de ServiceNow para datos no estructurados admite la capacidad de recuperar bases de conocimiento que contienen artículos de conocimiento. Las bases de conocimiento contienen artículos. Los creadores seleccionan una base de conocimientos y todos los artículos de esa base de conocimientos se indexan para su uso. No se pueden seleccionar artículos individuales. Al consultar datos, no es posible especificar una base de conocimientos, una carpeta o un artículo concreto. La lista de conocimientos muestra un único objeto para todos los objetos de conocimiento que seleccione al crear el origen.

Confluence

El conector de Confluence para datos no estructurados admite la capacidad de recuperar los espacios que contienen páginas, también se admiten subcarpetas. No se pueden seleccionar páginas individuales. Al consultar datos no hay capacidad para especificar una página. La lista de conocimiento muestra un único objeto para todas las páginas del espacio.

Zendesk

El conector de Zendesk para datos no estructurados admite la capacidad de recuperar bases de conocimiento que contienen artículos de conocimiento. No se pueden seleccionar artículos, categorías o secciones individuales. Al consultar datos no hay capacidad para especificar un artículo, una categoría o una sección. La lista de conocimiento muestra un único objeto para todos los artículos de la base de conocimiento.

Seguridad

Cuando un usuario consulta un agente que usa un origen de conector de Power Platform, se realizan algunas comprobaciones de autorización.

Acceso de conector

Cuando un creador usa por primera vez un origen basado en conectores, se le pide que seleccione un conector de Power Platform existente o que agregue uno. Este proceso garantiza que los datos solo se compartan con los creadores que tengan los permisos adecuados y proporcione acceso al propio origen de datos.

Acceso al contenido

Cuando se realiza una consulta, la información de conexión del usuario se usa para comprobar el origen de datos para asegurarse de que tiene permiso para ver el contenido. Aunque los fragmentos e índices se almacenan localmente en Dataverse, se realiza una comprobación dinámica en las consultas para asegurarse de que el usuario actual tiene acceso a los datos antes de proporcionar un resumen o una respuesta.

Nota

  • Si un usuario no tiene permisos para un conjunto específico de archivos o artículos de knowledge base, no se devuelve un resultado a ellos y recibe un mensaje estándar de "no se pudo encontrar ningún resultado". Si los usuarios sienten que debe haber resultados para ese origen, deben trabajar con sus administradores para asegurarse de que tienen permisos para los datos a los que intentan llegar.
  • La información de permisos de contenido no se almacena localmente. Todas las comprobaciones de permisos se realizan en tiempo real con el origen para garantizar que sean las más actualizadas.

Frecuencia de sincronización y actualización de archivos

Los archivos conectados de OneDrive y SharePoint, y los artículos de conocimientos no estructurados se mantienen actualizados mediante un trabajo de sincronización programado. Este trabajo se ejecuta automáticamente en segundo plano, actualizando el contenido de los archivos y reindexando los cambios para proporcionar resultados precisos para las consultas. Las actualizaciones administran no solo los cambios en el contenido, sino que también garantizan que el contenido eliminado del origen ya no aparezca como parte de ninguna respuesta de consulta. Actualmente, no hay ninguna manera de desencadenar manualmente una actualización.

Para obtener más información sobre el tiempo de frecuencia de actualización, vaya a Límites del origen de conocimiento de datos no estructurados de Copilot Studio.

Licencias

Todas las solicitudes que implican conocimientos se cobran en las tasas de mensajería de respuestas generativas de Microsoft Copilot. Para obtener más información, vaya a Tarifas y administración de la facturación.

Si los orígenes de conocimiento requieren la ingesta de datos, el almacenamiento de los datos y los índices correspondientes para recuperar esos datos estarían sujetos a los derechos de almacenamiento que tiene el cliente. Para obtener más información sobre la búsqueda en lenguaje natural de Dataverse, vaya a Mejorar las experiencias con tecnología de inteligencia artificial con la búsqueda de Dataverse.

Límites y limitaciones

Cuando se habilita por primera vez la compatibilidad con datos no estructurados, puede haber un retraso entre 5 y 30 minutos para la configuración y la indexación de Dataverse antes de procesar los archivos agregados. El período de tiempo depende del tamaño del entorno actual de Dataverse.

Cada agente puede tener un máximo de 500 objetos de conocimiento. Estos objetos pueden ser archivos, carpetas, artículos de conocimiento, sitios web u otras fuentes.

En este momento, solo se pueden usar cinco orígenes diferentes a la vez en un agente. Por ejemplo, SharePoint, Dataverse, OneDrive u otros orígenes.

Para obtener más información sobre límites y limitaciones específicos para los orígenes de datos no estructurados admitidos, vaya a Límites de orígenes de conocimiento de datos no estructurados de Copilot Studio.

Nota

Los agentes de Copilot Studio requieren la búsqueda de Dataverse para usar este origen de conocimiento. Si no puede agregar un archivo habilitado para Dataverse a un agente, pida al administrador que active la búsqueda de Dataverse en su entorno. Para obtener más información sobre la búsqueda de Dataverse y cómo administrarla, consulte ¿Qué es la búsqueda de Dataverse y Configurar la búsqueda de Dataverse para su entorno?

Preguntas frecuentes

El icono de SharePoint no se muestra en la sección Cargar archivos del cuadro de diálogo Agregar conocimiento?

Hay un ligero retraso entre instalar una solución y mostrarla en todas las organizaciones existentes. Para iniciar una actualización manual, siga estos pasos:

  1. Inicie sesión en el Centro de administración de Power Platform con las credenciales de administrador.
  2. En el lado de navegación, seleccione Administrar.
  3. En la lista de productos, seleccione Aplicaciones de Dynamics 365. Se abre un panel.
  4. Busque "PowerAIExtensions".
  5. Selecciona los tres puntos (...) para Microsoft Dynamics 365 - PowerAIExtensions y selecciona Instalar.
  6. En el menú desplegable, seleccione el entorno y, a continuación, seleccione Instalar.
  7. Una vez completada la instalación, abra Power Apps en una nueva ventana.
  8. En el panel izquierdo, seleccione Soluciones.
  9. Seleccione Ver historial.
  10. Busque "PowerAIExtensions_Anchor" y asegúrese de que está establecido en 1.01.688 o superior.

En el cuadro de diálogo Agregar conocimiento, ¿cuál es la diferencia entre las dos opciones de SharePoint?

En el cuadro de diálogo Agregar conocimiento, hay dos opciones de SharePoint. La opción de SharePoint en la sección de carga de archivos (1) se usa para cargar archivos o carpetas individuales de SharePoint y habilita las funcionalidades de sincronización de archivos. La otra opción de SharePoint (2) proporciona la compatibilidad completa de SharePoint en Copilot Studio.

Captura de pantalla del cuadro de diálogo Agregar conocimiento, resaltando dos opciones de SharePoint.

¿Qué ocurre cuando agrego más de 500 objetos de conocimiento a mi agente?

No puede agregar más objetos a menos que elimine primero los objetos anteriores.

¿Cada agente tiene su propio índice del origen de conocimiento?

Los orígenes de conocimiento se almacenan en Dataverse para su uso en el entorno en el que se crearon. Si se usa la misma carpeta de SharePoint en varios agentes, se usa una sola instancia de la carpeta para todos los agentes.

¿Qué sucede si selecciona una carpeta que tiene más del número máximo de archivos, carpetas y subcarpetas al agregar una fuente de SharePoint u OneDrive?

Copilot Studio recupera e indexa hasta el número máximo de archivos, carpetas y subcarpetas, y los indexa. El resto no se procesan. Actualmente, no hay ninguna mensajería para indicar qué era o no se procesó.

Uno de los archivos que agregó (o que formaba parte de una carpeta que agregó) se muestra como parte del origen de conocimiento, pero no puedo obtener respuestas de ella. ¿Por qué?

Este problema podría estar relacionado con una de las siguientes razones:

  • El archivo o la carpeta se establece en "Listo" en la página Conocimiento.
  • Asegúrese de que el nombre de archivo no incluya un carácter no admitido (específicamente para archivos de SharePoint).
  • Asegúrese de que el archivo no tiene un ajuste de sensibilidad de Confidencial o Altamente confidencial, ni está protegido por contraseña.
  • Asegúrese de que es un tipo de archivo compatible.
  • Si el archivo o la carpeta procede de un sitio de OneDrive o SharePoint de otro usuario, compruebe que se comparte con el creador.
  • Si el archivo es un archivo de base de conocimiento, asegúrese de que la cuenta tiene permisos para ver el contenido en el sistema de origen.