Compartir a través de


Seguridad de Azure Data Lake Storage Gen1

Muchas empresas están aprovechando el análisis de macrodatos para obtener conocimientos empresariales que les ayuden a tomar decisiones inteligentes. Es posible que una organización tenga un entorno regulado y complejo, con un número cada vez mayor de distintos tipos de usuarios. Es esencial para una empresa asegurarse de que los datos empresariales más importantes se almacenaron de la forma más segura, y que se concedió a los usuarios individuales el nivel adecuado de acceso. Azure Data Lake Storage Gen1 está diseñado para ayudar a cumplir estos requisitos de seguridad. En este artículo aprenderá las funcionalidades de seguridad de Data Lake Storage Gen1, como:

  • Autenticación
  • Autorización
  • Aislamiento de red
  • Protección de los datos
  • Auditoría

Autenticación y administración de identidades

La autenticación es el proceso por el que se verifica una identidad de usuario cuando el usuario interactúa con Data Lake Storage Gen1 o con cualquier servicio que se conecte al mismo. Para la autenticación y administración de identidades, Data Lake Storage Gen1 usa Microsoft Entra ID, una completa solución en la nube de administración de identidades y acceso que simplifica la administración de usuarios y grupos.

Cada suscripción de Azure se puede asociar a una instancia de Microsoft Entra ID. Solo los usuarios y las identidades de servicio definidas en el servicio de Microsoft Entra pueden tener acceso a la cuenta de Data Lake Storage Gen1 mediante Azure Portal, las herramientas de línea de comandos o las aplicaciones cliente que la organización compila con el SDK de Data Lake Storage Gen1. Las principales ventajas del uso de Microsoft Entra ID como un mecanismo de control de acceso centralizado son:

  • Administración simplificada del ciclo de vida de las identidades. La identidad de un usuario o un servicio (una identidad principal del servicio) se puede crear y revocar rápidamente; basta con eliminar o deshabilitar la cuenta en el directorio.
  • Autenticación multifactor Multi-factor authentication proporciona un nivel de seguridad adicional para los inicios de sesión y las transacciones del usuario.
  • Autenticación desde cualquier cliente mediante un protocolo estándar abierto, como OAuth u OpenID.
  • Federación con los servicios de directorio empresariales y los proveedores de identidad en la nube.

Control de autorización y acceso

Una vez que un usuario se autentica mediante Microsoft Entra para acceder a Data Lake Storage Gen1, la autorización controla los permisos de acceso a Data Lake Storage Gen1. Data Lake Storage Gen1 separa la autorización para las actividades relacionadas con cuentas y datos de la siguiente manera:

RBAC de Azure para la administración de cuentas

Se definen cuatro roles básicos para Data Lake Storage Gen1 de forma predeterminada. Estos roles permiten diferentes operaciones en una cuenta de Data Lake Storage Gen1 mediante Azure Portal, los cmdlets de PowerShell y las API REST. Los roles Propietario y Colaborador pueden realizar diversas funciones de administración en la cuenta. Puede asignar el rol Lector a los usuarios que solo ven los datos de administración de cuentas.

Roles de Azure

Tenga en cuenta que aunque se asignen roles para la administración de cuentas, algunos roles afectarán al acceso a los datos. Necesita usar listas de control de acceso (ACL) para controlar las operaciones que un usuario puede realizar en el sistema de archivos. La tabla siguiente muestra un resumen de los derechos de administración y los derechos de acceso a datos para los roles predeterminados.

Roles Derechos de administración Derechos de acceso a datos Explicación
Ningún rol asignado Ninguno Regido por ACL El usuario no puede utilizar Azure Portal ni los cmdlets de Azure PowerShell para explorar Data Lake Storage Gen1. El usuario solo puede utilizar las herramientas de línea de comandos.
Propietario Todos Todos El rol de Propietario es un superusuario. Este rol puede administrar todo y tiene acceso completo a los datos.
Lector Solo lectura Regido por ACL El rol Lector puede ver todo lo relacionado con la administración de cuentas, como qué usuario está asignado a qué rol. El rol de Lector no puede realizar ningún cambio.
Colaborador Todos, excepto añadir y quitar funciones Regido por ACL El rol Colaborador puede administrar algunos aspectos de una cuenta, como las implementaciones y la creación y administración de alertas. El rol Colaborador no puede agregar ni quitar roles.
Administrador de acceso de usuario Agregar y quitar roles Regido por ACL El rol Administrador de acceso de usuarios puede administrar el acceso de los usuarios a las cuentas.

Para ver instrucciones, consulte Assign users or security groups to Data Lake Storage Gen1 accounts (Asignación de grupos de seguridad o usuarios a cuentas de Data Lake Storage Gen1).

Uso de ACL para operaciones en sistemas de archivos

Data Lake Storage Gen1 es un sistema de archivos jerárquico como el sistema de archivos distribuido de Hadoop (HDFS) que admite POSIX ACL. Controla los permisos de lectura (r), escritura (w) y ejecución (x) para los recursos del rol Propietario, para el grupo de propietarios y para otros usuarios y grupos. En Data Lake Storage Gen1, las ACL se pueden habilitar en la carpeta raíz, en las subcarpetas y en los archivos individuales. Para obtener más información sobre cómo funcionan las ACL en el contexto de Data Lake Storage Gen1, consulte Control de acceso en Data Lake Storage Gen1.

Se recomienda definir las ACL para varios usuarios mediante grupos de seguridad. Agregue usuarios a un grupo de seguridad y asigne las ACL de los archivos o carpetas a ese grupo de seguridad. Esto es útil cuando desea proporcionar permisos asignados, porque está limitado a un máximo de 28 entradas de permisos asignados. Para obtener más información acerca de cómo proteger los datos almacenados en Data Lake Storage Gen1 mediante grupos de seguridad de Microsoft Entra, consulte Asignación de usuarios o grupos de seguridad como ACL al sistema de archivos de Data Lake Storage Gen1.

Lista de permisos de acceso

Aislamiento de red

Utilice Data Lake Storage Gen1 para ayudar a controlar el acceso a su almacén de datos a nivel de la red. Puede establecer firewalls y definir un intervalo de direcciones IP para los clientes de confianza. Con un intervalo de direcciones IP, solo los clientes que tengan una dirección IP que esté dentro del intervalo definido podrán conectarse a Data Lake Storage Gen1.

Configuración del firewall y el acceso a IP

Las redes virtuales de Azure admiten etiquetas de servicio para Data Lake Gen 1. Una etiqueta de servicio representa un grupo de prefijos de direcciones IP de un servicio de Azure determinado. Microsoft administra los prefijos de dirección que abarca la etiqueta de servicio y actualiza automáticamente la etiqueta de servicio a medida que cambian las direcciones. Para más información, consulte Introducción a las etiquetas de servicio de Azure.

Protección de los datos

Data Lake Storage Gen1 protege los datos durante todo su ciclo de vida. Para los datos en tránsito, Data Lake Storage Gen1 utiliza el protocolo Seguridad de la capa de transporte (TLS 1.2) estándar del sector para proteger los datos de la red.

Cifrado en Data Lake Storage Gen1

Data Lake Storage Gen1 también proporciona el cifrado de los datos que se almacenan en la cuenta. Puede elegir si cifrar o no los datos. Si se decide por el cifrado, los datos almacenados en Data Lake Storage Gen1 se cifrarán antes de almacenarlos en medios persistentes. En tal caso, Data Lake Storage Gen1 cifrará automáticamente los datos antes de la persistencia y los descifrará antes de la recuperación, por lo que resulta un proceso completamente transparente para el cliente que accede a los datos. No se requiere ningún cambio de código en el lado del cliente para cifrar o descifrar datos.

Para la administración de claves, Data Lake Storage Gen1 ofrece dos modos de administrar las claves de cifrado maestras (MEK) que son necesarias para descifrar los datos que se almacenan en Data Lake Storage Gen1. Puede permitir que Data Lake Storage Gen1 administre las MEK en su nombre o decidir conservar la propiedad de estas mediante su cuenta de Azure Key Vault. Puede especificar el modo de administración de claves durante la creación de una cuenta de Data Lake Storage Gen1. Para obtener más información sobre cómo proporcionar una configuración relacionada con el cifrado, consulte Introducción a Azure Data Lake Storage Gen1 con Azure Portal.

Registros de actividad y diagnóstico

Puede usar los registros de actividad o diagnóstico en función de si desea consultar registros de actividades relacionadas con la administración de cuentas o con los datos.

  • Las actividades relacionadas con la administración de cuentas utilizan las API de Azure Resource Manager y se exponen en Azure Portal mediante los registros de actividad.
  • Las actividades relacionadas con los datos usan las API de REST de WebHDFS y se exponen en el Portal de Azure mediante los registros de diagnóstico.

Registro de actividad

Para cumplir las normativas, las organizaciones pueden requerir pistas de auditoría adecuadas de las actividades de administración de cuentas si necesitan profundizar en un incidente concreto. Data Lake Storage Gen1 cuenta con supervisión integrada y registra todas las actividades de administración de cuentas.

Para los registros de auditoría de la gestión de cuentas, elija y vea las columnas que desea registrar. También puede exportar los registros de actividad a Azure Storage.

Registro de actividad

Para obtener más información sobre cómo trabajar con los registros de actividad, consulte Visualización de registros de actividad para auditar las acciones sobre los recursos.

Registros de diagnóstico

Puede habilitar el registro de auditoría y diagnóstico de acceso a los datos en Azure Portal y enviar los registros a una cuenta de Azure Blob Storage, un centro de eventos o registros de Azure Monitor.

Registros de diagnóstico

Para obtener más información sobre cómo trabajar con registros de diagnóstico con Data Lake Storage Gen1, consulte Accessing diagnostic logs for Data Lake Storage Gen1 (Acceso a los registros de diagnóstico de Data Lake Storage Gen1).

Resumen

Los clientes empresariales demandan una plataforma en la nube de análisis de datos segura y fácil de usar. Data Lake Storage Gen1 se ha diseñado para satisfacer estos requisitos con la administración de identidades y la autenticación mediante la integración de Microsoft Entra, la autorización basada en ALC, el aislamiento de red, el cifrado de datos en tránsito y en reposo, así como la auditoría.

Si quiere ver las nuevas características de Data Lake Storage Gen1, envíenos sus comentarios en el foro de UserVoice de Data Lake Storage Gen1.

Consulte también