Compartir a través de


Más información sobre el análisis de inteligencia artificial en Investigaciones de seguridad de datos (versión preliminar)

Importante

Investigaciones de seguridad de datos usa inteligencia artificial generativa (IA), modelos de lenguaje grande y orquestación en el análisis de datos de la organización. Es posible que los resultados generados por la inteligencia artificial no siempre sean precisos o completos. Aunque nos esforzamos por proporcionar información confiable y útil, los sistemas de inteligencia artificial pueden producir resultados incorrectos o falsos. Es importante comprobar la información y usarla con precaución. Microsoft no ofrece garantías, expresas, implícitas o legales, en cuanto a la información proporcionada por los sistemas de inteligencia artificial.

Investigaciones de seguridad de datos (versión preliminar) usa herramientas y servicios de inteligencia artificial para ayudarle a revisar y tomar medidas rápidamente sobre los elementos asociados a incidentes de seguridad. Los servicios relacionados con la inteligencia artificial incluyen las siguientes herramientas:

  • Búsqueda de vectores
  • Categorización
  • Examinación

La búsqueda de vectores en Investigaciones de seguridad de datos (versión preliminar) proporciona una manera de buscar contextualmente a través de los datos que se agregan al ámbito de investigación mediante la orquestación avanzada y las incrustaciones. La búsqueda de vectores es una tecnología del motor de búsqueda que se centra en comprender el significado y el contexto detrás de las palabras y frases de una consulta, en lugar de simplemente buscar coincidencias de palabras clave.

Algunos aspectos clave de la búsqueda de vectores son:

  • Comprensión contextual: la búsqueda de vectores interpreta el contexto de los términos de búsqueda, teniendo en cuenta factores como la organización, el historial de búsqueda y el significado general de la consulta.

  • Reconocimiento de intenciones: la búsqueda de vectores funciona para comprender su intención, ya sea que busque información, intente realizar una acción o busque un tipo específico de contenido asociado a una búsqueda.

  • Relevancia y precisión: al centrarse en la semántica (el significado y la intención de las palabras de la consulta), la búsqueda vectorial proporciona resultados más precisos y pertinentes y mejora la experiencia de búsqueda general.

  • Búsqueda sugerida (versión preliminar): la búsqueda de vectores también permite seleccionar consultas de búsqueda sugeridas personalizadas en función del contexto de investigación o de las búsquedas anteriores de una investigación. Si la investigación no tiene un contexto definido y no tiene ninguna búsqueda anterior, puede elegir entre las siguientes búsquedas sugeridas predeterminadas:

    • Busque cualquier cosa que contenga credenciales o contraseñas.
    • Buscar todo el contenido que contiene información confidencial
    • Enumerar todos los documentos legales y financieros

Cuando los investigadores de su organización investigan conjuntos de datos en peligro, la búsqueda de vectores en Investigaciones de seguridad de datos (versión preliminar) puede mejorar significativamente la investigación abordando varios desafíos clave:

  • Identificación de información relevante: la búsqueda de vectores comprende el contexto y la intención detrás de las consultas. Este enfoque le ayuda a localizar rápidamente documentos, correos electrónicos o registros pertinentes, incluso si no contienen las palabras clave exactas que usó.
  • Control de la ambigüedad: la búsqueda de vectores desambigua los términos que tienen varios significados, lo que garantiza que se obtienen resultados contextualmente adecuados para la investigación.
  • Reducción del ruido: la búsqueda de vectores filtra información irrelevante, lo que le permite centrarse en los datos más pertinentes y reducir el tiempo invertido en tamizar a través de resultados no relacionados.
  • Mejora de la eficacia: la búsqueda de vectores simplifica el proceso de búsqueda, lo que hace que la investigación sea más eficaz y eficaz, ya que proporciona rápidamente la información más relevante.

Cómo funciona

Al crear una investigación, definir el ámbito y preparar los datos para la inteligencia artificial, puede ejecutar búsquedas vectoriales en el conjunto de datos. Aunque los pasos anteriores del proceso permiten la búsqueda sencilla de palabras clave, metadatos y intervalos de fechas, la búsqueda de vectores usa incrustaciones de inteligencia artificial para realizar búsquedas contextuales a través de datos. Este proceso permite a los investigadores encontrar elementos sin conocer su contenido exacto.

Importante

Solo se vectorizan los elementos que contienen texto. Se excluyen los archivos de imagen, el correo electrónico que contiene solo imágenes, invitaciones a reuniones y notificaciones de calendario.

La búsqueda de vectores funciona ejecutando primero todos los datos con ámbito en una investigación a través de un modelo de incrustaciones de inteligencia artificial. Este modelo extrae el significado semántico de cada elemento del conjunto de datos y los divide en partes más pequeñas. Este proceso se denomina inserción y permite Investigaciones de seguridad de datos (versión preliminar) usar valores de dimensión para comprender los datos contextualmente. Se crea un índice de búsqueda semántica a partir de estos valores que puede consultar.

Al crear una consulta de búsqueda de vectores en una investigación, la inteligencia artificial expande y amplía automáticamente la consulta y ejecuta la consulta a través del índice de búsqueda semántico. Investigaciones de seguridad de datos (versión preliminar) coincide con el significado semántico de la consulta con el significado semántico del contenido y devuelve todos los elementos contextualmente relevantes.

Por ejemplo, si busca "Datos confidenciales incluidos en el proyecto de seguridad de Contoso", el motor de búsqueda vectorial entiende que busca datos confidenciales en este proyecto específico en lugar de simplemente buscar palabras clave (confidencial, datos, Contoso, etc.) contenidas en la consulta de búsqueda. Mediante la búsqueda de vectores, puede consultar los datos afectados para buscar todos los elementos de datos relacionados con un asunto determinado, incluso si faltan palabras clave.

Además, se asigna automáticamente una puntuación de relevancia de búsqueda a cada elemento devuelto. La puntuación de relevancia de búsqueda le ayuda a determinar rápidamente el nivel de confianza de la conexión entre la búsqueda y los elementos identificados por la búsqueda vectorial.

Para obtener más información sobre los conceptos de búsqueda de vectores, consulte la sección conceptos del artículo Vectores en Azure búsqueda de inteligencia artificial.

Búsqueda con inteligencia artificial (versión preliminar)

Basándose en la búsqueda de vectores, Search with AI (preview) incorpora funcionalidades de generación aumentada de recuperación (RAG) y optimiza el modelo de resultados de búsqueda. Esta característica incluye elementos relevantes de búsqueda basados en tipos de archivo de elementos, tamaños, versiones y mucho más.

Esta expansión de funcionalidad a la búsqueda de vectores también incluye un resumen de búsqueda basado en elementos individuales devueltos en la búsqueda, incluidos vínculos de cita a ejemplos de resultados de búsqueda específicos, para ayudarle a evaluar rápidamente si la búsqueda satisface sus necesidades.

Investigaciones de seguridad de datos Buscar con IA (versión preliminar).

Categorización

Cuando se infringe la organización e identifica los datos afectados, los investigadores deben priorizar los datos para empezar a identificar los riesgos de seguridad. Las categorías de Investigaciones de seguridad de datos (versión preliminar) eliminan la necesidad de asignar manualmente categorías a elementos de ámbitos de investigación grandes y complejos.

Puede usar la categorización con tecnología de inteligencia artificial en Investigaciones de seguridad de datos (versión preliminar) para razonar más rápidamente y priorizar los datos potencialmente afectados. Para clasificar los datos, puede seleccionar todas o algunas opciones de categoría predeterminadas, usar categorías sugeridas por IA en función de su investigación o crear sus propias categorías personalizadas.

Las categorías generadas por IA se enriquecen con información adicional sobre el contenido de nivel de asunto en el ámbito:

  • Nombre: nombre de la categoría o área en función del contenido
  • Resumen: breve descripción del contenido subyacente

Dentro de cada categoría, puede usar herramientas de búsqueda y examen de vectores en cualquier contenido.

Categorías predeterminadas

Investigaciones de seguridad de datos (versión preliminar) incluye categorías predeterminadas para clasificar elementos en el ámbito de investigación. Al ejecutar la categorización, puede seleccionar todas las categorías predeterminadas o solo las categorías predeterminadas que se aplican al ámbito de la revisión. El análisis omite las categorías predeterminadas no seleccionadas y no se pueden revisar los resultados de estas categorías.

El procesamiento de inteligencia artificial determina las categorías predeterminadas iniciales para los elementos de contenido:

  • Información empresarial: información de negocios general. Esta categoría normalmente contiene un gran número de elementos. Algunas áreas de ejemplo de esta categoría pueden incluir involucración y análisis digitales, recursos humanos y de usuario, comunicación administrativa rutinaria, participación y experiencia del cliente, etc.
  • Registros de comunicación: información de comunicación general. Esta categoría también suele contener un gran número de elementos. Use esta categoría para ver las investigaciones basadas en áreas de comunicaciones. Algunas áreas de ejemplo de esta categoría pueden incluir quejas de clientes, saludos de vacaciones, notas internas, actualizaciones del proyecto, etc.
  • Credenciales e información de acceso: información relacionada con el acceso a los recursos en las investigaciones. Esta información ayuda a identificar datos y comunicaciones potencialmente peligrosos en su organización. Algunas áreas de ejemplo de esta categoría pueden incluir credenciales de usuario, acceso no autorizado a la base de datos, exposición de datos, etc.
  • Información del cliente: información compartida con los clientes. Use esta categoría para comprender qué datos de cliente pueden estar en riesgo. Algunas áreas de ejemplo de esta categoría pueden incluir confirmaciones de pago, mejora de la experiencia del cliente, información de entrega, etc.
  • Información del usuario: información relacionada con los usuarios de su organización. Esta categoría también suele contener un gran número de elementos. Algunas áreas de ejemplo de esta categoría pueden incluir información de empleo del usuario, estrategias de retención de usuarios, pertenencias a grupos especializadas, etc.
  • Información financiera: información financiera en una investigación. Algunas áreas de ejemplo de esta categoría pueden incluir planificación financiera, oportunidades de concesión, presupuestos, estados financieros, etc.
  • Información de salud: elementos relacionados con la salud y el médico en una investigación. Algunas áreas de ejemplo de esta categoría pueden incluir registros de salud y bienestar, actualizaciones del protocolo de seguridad COVID-19, notificaciones de salud e informes de incidentes, etc.
  • Información sobre incidentes e investigaciones: elementos sobre incidentes e investigaciones en una investigación. Esta categoría incluye incidentes de seguridad e investigaciones dentro de la organización. Algunas áreas de ejemplo de esta categoría pueden incluir infracciones de datos, incidentes de registros de estado, supervisión de cuentas de cliente de alto riesgo, etc.
  • Propiedad intelectual: datos de propiedad intelectual (P.I.) en una investigación. Algunas áreas de ejemplo de esta categoría podrían incluir futuras solicitudes de patentes, trabajos de investigación y desarrollo, métricas de resultados de experimentos, etc.
  • Información de marketing: datos de marketing en una investigación. Algunas áreas de ejemplo de esta categoría pueden incluir comunicados de prensa, campañas publicitarias, planes de marketing y ventas, o estrategias, etc.
  • Información operativa: datos operativos de la organización. Algunas áreas de ejemplo de esta categoría pueden incluir logística, envío, inventario, cumplimiento, registros fiscales, etc.
  • Información de identificación personal: agrupar datos personales y elementos relacionados en una investigación. Algunas áreas de ejemplo de esta categoría pueden incluir listas de invitados de eventos, sesiones de personal y entrenamiento, información personal de los empleados, etc.
  • Datos regulados: datos regulados en una investigación. Algunas áreas de ejemplo de esta categoría pueden incluir normativa, protección de datos, registros normativos, etc.

Categorías sugeridas

Investigaciones de seguridad de datos (versión preliminar) también proporciona categorías sugeridas generadas por inteligencia artificial basadas en el contenido analizado en el ámbito de la investigación. Estas categorías sugeridas ayudan automáticamente a las investigaciones a revisar los elementos agrupados en áreas inesperadas o desconocidas. En función del tipo de contenido incluido, las categorías sugeridas varían.

Si el contenido analizado se centra principalmente en un área de asunto específica fuera de las áreas de categoría predeterminadas, las categorías sugeridas se personalizan para ese área de contenido específica. Por ejemplo, si el contenido analizado se centra en un asunto altamente confidencial con términos y conceptos específicos solo para su organización, las categorías sugeridas se crean automáticamente para estas áreas. Estas categorías son únicas para su organización y el contenido analizado.

Categorías personalizadas

Investigaciones de seguridad de datos (versión preliminar) permite crear manualmente categorías personalizadas para el proceso de IA generativo que se usará al analizar el contenido. Al definir categorías que mejor se adapten a sus necesidades de investigación, puede ahorrar tiempo y permitir que el proceso de IA clasifique automáticamente los elementos en función de estas categorías personalizadas.

Las categorías personalizadas pueden ser palabras o frases específicas que capturan la naturaleza específica del contenido que le interesa durante la investigación. Por ejemplo, las categorías personalizadas pueden incluir vulnerabilidad de seguridad, corrección de errores, nombres de código de proyecto específicos o propiedad intelectual personalizada como R&D relacionada con un medicamento específico o candidatos a medicamentos.

Algunas categorías personalizadas adicionales que podrían resultar útiles en las investigaciones:

  • Códigos de acceso
  • Documentación de acceso de API
  • Claves de autenticación de API
  • Tokens de API
  • Archivos de configuración de la aplicación
  • Detalles de entidad de certificación (CA)
  • Certificados
  • Credenciales de base de datos
  • Certificados digitales
  • Planes de recuperación ante desastres
  • Datos de ubicación del empleado
  • Claves de cifrado
  • Archivos de configuración del entorno
  • Registros de administración de incidentes
  • Tokens de integración
  • Tokens JWT
  • Directivas de administración de claves
  • Códigos de copia de seguridad de autenticación multifactor (MFA)
  • Números de identificación personal (PIN)
  • Detalles de la cuenta con privilegios
  • Cadenas seguras
  • Registros de seguridad
  • Directivas de seguridad
  • Sesión
  • Claves privadas SSH
  • Secretos de API de terceros
  • Credenciales de usuario
  • Evaluaciones de vulnerabilidades

Examinación

A medida que identifica elementos que requieren un análisis más profundo, Investigaciones de seguridad de datos (versión preliminar) proporciona funcionalidades de examen basadas en inteligencia artificial para ayudarle a centrarse en la seguridad clave y los riesgos de datos confidenciales.

  • Credenciales: use este área de enfoque de examen para examinar y extraer credenciales de todos los elementos seleccionados en un ámbito de investigación. Esta información proporciona a los investigadores una manera rápida de comprender qué cuentas y credenciales están asociadas a un incidente de seguridad y que podrían filtrarse.

  • Riesgo: use este área de enfoque de examen para puntuar todas las áreas de riesgo de los archivos seleccionados para ayudar a los investigadores a centrarse y priorizar las investigaciones. Esta herramienta proporciona el riesgo general para cada elemento, si el elemento tiene privilegios de contenido y otros riesgos específicos para el elemento.

    Entre los tipos de áreas de riesgo se incluyen:

    • Identificadores de recursos
    • Credenciales y secretos
    • Evidencia de discusiones de vulneración de las discusiones de actores de amenazas
    • Incidentes de seguridad urgentes
    • Vulnerabilidad e higiene de la seguridad
    • Contenido personal y confidencial
    • Información de red y acceso
    • Cumplimiento de directivas y protección de datos
    • Información de infraestructura
    • Información del cliente
    • Información gubernamental
    • Información con privilegios
    • Secretos comerciales
  • Mitigación: use este área de enfoque de examen para puntuar el riesgo de los archivos seleccionados y habilitar Investigaciones de seguridad de datos (versión preliminar) para proporcionarle instrucciones de mitigación sobre lo que debe hacer a continuación. Los archivos seleccionados obtienen una puntuación de riesgo, un resumen de riesgos y recomendaciones de mitigación detalladas para evitar más daños por una vulneración de contenido.

Recomendaciones de análisis de inteligencia artificial

En la tabla siguiente se describen recomendaciones, escenarios de ejemplo y procedimientos recomendados al usar las herramientas de análisis de inteligencia artificial en Investigaciones de seguridad de datos (versión preliminar).

Recomendaciones Búsqueda de vectores Categorización Examinación
Cuándo usarlo Busque ejemplos de elementos específicos dentro de un conjunto de datos vectorizados (facturas, correcciones de errores, etc.) para confirmar y investigar más hipótesis.

Use la búsqueda vectorial para un análisis interactivo rápido, los resultados se rellenan rápidamente.
Ordene rápidamente grandes cantidades de datos en categorías predeterminadas, personalizadas o generadas por inteligencia artificial para priorizar el foco de investigación por confidencialidad y gravedad.

En función del tamaño del conjunto de datos, la categorización puede tardar algún tiempo en completarse.
El análisis de destino en el nivel de elemento de un conjunto de datos con ámbito ayuda a extraer información de un recurso de datos confirmado para los pasos siguientes.

Use el examen para identificar elementos para la mitigación.
Escenario de ejemplo Evaluación de actividad potencialmente fraudulenta. Priorización de los elementos para el análisis después de una gran vulneración. Extracción de credenciales de un conjunto de datos validado y pasos de mitigación recomendados.
Procedimientos recomendados Busque elementos de interés en todo el contenido vectorizado para generar categorías sugeridas de inteligencia artificial más significativas. Seleccione una o varias categorías y use la búsqueda de vectores para buscar dentro de la categoría.

Revise las áreas generadas por IA dentro de cada categoría para comprender el contenido específico del conjunto de datos.
Use el examen para profundizar en elementos específicos con alta sensibilidad para obtener puntuaciones y resultados individuales.

¿Está listo para empezar?