Compartir a través de


Crear salas limpias

En esta página se describe cómo crear una sala limpia de Databricks mediante la interfaz de usuario. Una sala limpia es un entorno seguro para el análisis de datos colaborativos.

Características y limitaciones clave:

  • Colaboración segura: las salas limpias permiten a varias partes trabajar conjuntamente en datos empresariales confidenciales sin acceso directo a los datos en bruto de las otras partes.
  • Capacidad de colaboradores: una sala limpia puede tener diez participantes, incluido el creador y hasta otros nueve colaboradores.
  • Límite de metastore: Azure Databricks aplica cuotas de recursos en todos los objetos protegibles de sala limpia. Consulte Límites de los recursos.

Para usar la API REST, consulte Creación de una sala limpia.

Antes de empezar

Los privilegios necesarios para usar salas limpias varían en función de la tarea:

Tarea Privilegios requeridos
Ver una habitación limpia Debe ser el propietario de la sala limpia o tener uno de los privilegios siguientes en la sala limpia: MANAGE, MODIFY CLEAN ROOM, EXECUTE CLEAN ROOM TASKo BROWSE.
Actualizar el propietario de una sala limpia Debe ser el propietario de la sala limpia o tener el privilegio MANAGE en la sala limpia.
Agregar o quitar recursos de datos en un salón limpio Debe ser el propietario de la sala limpia o tener el privilegio MODIFY CLEAN ROOM en la sala limpia. Si no es el propietario de la sala limpia, usted y el propietario de la sala limpia deben tener SELECT en cualquier tabla o vista y READ VOLUME en cualquier volumen que agregue, junto con USE CATALOG y USE SCHEMA en el catálogo principal y el esquema.
Agregar o quitar blocs de notas en una sala limpia Para el usuario que carga el archivo del cuaderno:
  • Si son los responsables designados del cuaderno, deben tener los privilegios EXECUTE CLEAN ROOM TASK o MODIFY CLEAN ROOM.
  • Si el cuaderno puede ser ejecutado por un colaborador, el usuario que carga debe tener el privilegio MODIFY CLEAN ROOM.
Actualizar un comentario en una sala limpia Debe ser el propietario de la sala limpia o tener el privilegio MODIFY CLEAN ROOM en la sala limpia.
Conceder acceso a una sala limpia Debe ser el propietario o tener el privilegio MANAGE en la sala limpia.
Eliminar una sala limpia Debe ser el propietario o tener el privilegio MANAGE en la sala limpia.

Más allá de los privilegios específicos de la tarea, cuando se comparte una sala limpia, la dirección de correo electrónico adjunta al identificador de uso compartido se convierte automáticamente en el propietario de la organización del colaborador. Consulte el paso 1. Solicite el identificador de uso compartido del colaborador.

Para obtener información sobre los requisitos de permisos para actualizar salas limpias y ejecutar tareas (cuadernos) en salas limpias, consulte Administrar salas limpias y Ejecutar cuadernos en salas limpias.

Nota

La sala limpia central puede tener un máximo de dos regiones adicionales, distintas de la región de sala limpia central, entre sus colaboradores.

Paso 1. Solicitar el identificador de uso compartido del colaborador

Para poder crear una sala limpia, debe tener el identificador de uso compartido de sala limpia de las organizaciones con las que colaborará. El identificador de uso compartido es una cadena que consta del identificador global de metastore de la organización + id. de área de trabajo + el nombre de usuario del contacto (dirección de correo electrónico). Los colaboradores pueden estar en cualquier nube o región.

Póngase en contacto con los colaboradores para solicitar su identificador de uso compartido. Pueden obtener el identificador de uso compartido mediante las instrucciones de Búsqueda del identificador de uso compartido.

Paso 2. Creación de una sala limpia

Para crear una sala limpia, debe usar el Explorador de catálogos.

  1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

  2. Haga clic en el botón Limpiar salas > .

  3. Haga clic en Crear sala limpia.

  4. En la página Crear sala limpia, escriba un nombre descriptivo para la sala limpia.

    El nombre no puede usar espacios, puntos ni barras diagonales (/).

    Una vez que se haya guardado, no se podrá cambiar el nombre de la sala limpia. Use un nombre que los posibles colaboradores encontrarán útiles y descriptivos.

  5. Seleccione el proveedor de nube y la región donde se creará la sala limpia central.

    El proveedor de nube debe coincidir con el área de trabajo actual, pero la región puede ser diferente. Considere la residencia de datos de su organización u otras directivas al realizar la selección.

  6. Cada sala limpia puede tener hasta diez colaboradores. Escriba el identificador de uso compartido de sala limpia para cada colaborador. Consulte el paso 1. Solicite el identificador de uso compartido del colaborador.

    Puede probar su sala limpia antes de la implementación completa utilizando ya sea su identificador de uso compartido o el identificador de otro usuario en su almacén de metadatos actual. Al hacerlo, se crean dos salas limpias en su metastore actual. Por ejemplo, si crea una sala limpia titulada test_clean_room, también aparece una segunda sala limpia denominada test_clean_room_collaborator. La ejecución de cuadernos con un colaborador en el mismo metastore funciona igual que con un colaborador externo. Consulte Ejecutar cuadernos en salas limpias.

  7. Anote los nombres de catálogo asignados a usted y sus colaboradores.

    Todos los recursos de datos agregados a la sala limpia aparecerán en ese catálogo en la sala limpia central y se puede hacer referencia a ellos mediante ese catálogo en el espacio de nombres de tres niveles de Unity Catalog (<catalog>.<schema>.<table-etc>).

  8. Seleccione el tipo de directiva de acceso de red. Esto no se puede cambiar una vez creada la sala limpia.

Tipo de directiva de red.

Nota

El acceso restringido puede retrasar la disponibilidad de recursos durante un máximo de diez minutos.

Después de crear la sala limpia, puede ver la directiva de acceso a la red en la pestaña Seguridad.

  1. Haga clic en Crear sala limpia.

Si el área de trabajo actual está establecida en el perfil de seguridad de cumplimiento de HIPAA, al crear una sala limpia, esa configuración se aplica a la sala limpia central. Los colaboradores deben acceder a la sala limpia desde un área de trabajo con el mismo perfil de seguridad. Consulte Perfil de seguridad de cumplimiento.

Paso 3. Agregar recursos de datos y cuadernos a la sala limpia

Tanto el creador como los colaboradores pueden agregar tablas, volúmenes, vistas y cuadernos a la sala limpia.

Nota

En las instrucciones siguientes, suponga que vuelve a una sala limpia ya creada para agregar recursos. Si acaba de crear una sala limpia por primera vez, un asistente le guiará en el proceso de añadir recursos de datos y cuadernos. La interfaz de usuario real para agregar estos recursos es la misma, independientemente de si está guiada por el asistente o no.

Para agregar cuadernos:

  1. Haga clic en el botón + Agregar cuadernos y busque el cuaderno que desea agregar.

  2. Asigne al bloc de notas el nombre .

  3. Seleccione qué colaborador puede ejecutar el cuaderno. Seleccione Usted para ejecutar el cuaderno usted mismo.

    Ejecutor autodesignado.

    Opcionalmente, puede asignar al cuaderno un nombre de cuaderno alternativo.

    Los cuadernos que comparte en salas limpias realizan consultas de datos y ejecutan cargas de trabajo de análisis de datos en las tablas, vistas y volúmenes que usted y cualquier otro colaborador hayan agregado a la sala limpia.

    Si comparte un cuaderno que incluye resultados, esos resultados se comparten con sus colaboradores.

    Puede usar un cuaderno para crear tablas de salida que se compartan temporalmente en el metastore del colaborador cuando ejecuten el cuaderno. Consulte Creación y trabajo con tablas de salida en salas limpias de Databricks.

    Para usar un conjunto de datos de prueba, descargue nuestro cuaderno de ejemplo .

    Importante

    Las referencias de bloc de notas a tablas, vistas o volúmenes que se agregaron a la sala limpia deben usar el nombre del catálogo asignado al crear la sala limpia ("creador" para los recursos de datos agregados por el creador de la sala limpia y "colaborador" para los recursos de datos agregados por el colaborador invitado). Por ejemplo, una tabla agregada por el creador podría denominarse creator.sales.california.

    Del mismo modo, compruebe que el cuaderno usa los alias asignados a los recursos de datos que se agregaron a la sala limpia.

Para agregar recursos:

  1. En el área de trabajo de Azure Databricks, haga clic en el icono Datos.Catálogo.

  2. Haga clic en el botón Limpiar salas > .

  3. Busque y haga clic en el nombre de la sala limpia que desea actualizar.

  4. Haga clic en + Agregar recursos de datos para agregar tablas, volúmenes o vistas.

  5. Seleccione los recursos de datos que desea compartir y haga clic en Agregar recursos de datos.

    Si comparte una tabla, un volumen o una vista, puede agregar opcionalmente un alias. El nombre del alias es el único nombre visible en la sala limpia.

    Al compartir una tabla, también puede agregar cláusulas de partición que le permitan compartir solo parte de la tabla. Para obtener más información sobre cómo usar particiones para limitar lo que comparte, consulte Especificar particiones de tabla para compartir.

Nota

El uso compartido de tablas federadas está en beta. Consulte Agregar esquemas o tablas externos a un recurso compartido.