Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Puede usar una canalización para establecer la comunicación entre áreas de trabajo entre un área de trabajo abierta y un área de trabajo que restrinja el acceso público entrante. Por ejemplo, puede crear una canalización en un área de trabajo abierta para acceder a un lakehouse en un área de trabajo con acceso restringido. Esta configuración permite que el cuaderno en el área de trabajo 1 acceda de forma segura al 'lakehouse' y lea las tablas de Delta Lake en el área de trabajo 2 sin exponerlas al acceso público.
Paso 1: Crear las áreas de trabajo
Necesita un área de trabajo abierta y una área de trabajo restringida. En este artículo se hace referencia a las áreas de trabajo de la siguiente manera:
- El área de trabajo de origen es el área de trabajo abierta sin restricción de acceso público. Es donde se crea una canalización.
- El área de trabajo de destino es el área de trabajo restringida con restricción de acceso público entrante. Es donde se crea la casa del lago.
Para crear las áreas de trabajo, siga estos pasos:
Cree dos áreas de trabajo en Microsoft Fabric. Para más información, consulte Creación de un área de trabajo.
En la configuración del cliente, habilite la protección de acceso de entrada a nivel de espacio de trabajo.
Para el área de trabajo de destino, configure vínculos privados a nivel del área de trabajo.
Paso 2: Crear un lakehouse en el área de trabajo restringida
Cree un lakehouse en el espacio de trabajo de destino (restringido) utilizando la siguiente API de creación de lakehouse:
POST https://{workspaceid}.z{xy}.w.api.fabric.microsoft.com/workspaces/{workspaceID}/lakehouses
Paso 3: Creación de un punto de conexión privado administrado
Cree un punto de conexión privado administrado en el área de trabajo de código fuente (abierto). Use la configuración Área de trabajo en el portal o la API siguiente:
POST https://{workspaceFQDN}/v1/workspaces/{workspaceID}/managedPrivateEndpoints
En ese código, {workspaceFQDN} es {workspaceID}.z{xy}.w.api.fabric.microsoft.com.
Por ejemplo: POST https://aaaaaaaa000011112222bbbbbbbbbbbb.zaa.w.api.fabric.microsoft.com/v1/workspaces/aaaaaaaa-0000-1111-2222-bbbbbbbbbbbb/managedPrivateEndpoints.
El targetPrivateLinkResourceId parámetro es el identificador de recurso del servicio Azure Private Link en el área de trabajo restringida. Para crear un punto de conexión privado administrado en el área de trabajo de destino, necesita este identificador de recurso.
Puede encontrar este identificador de recurso en Azure mediante la visualización del JSON del recurso para el área de trabajo. Asegúrese de que el identificador del área de trabajo en json coincide con el área de trabajo de destino prevista.
El propietario del servicio Private Link para el área de trabajo 2 debe aprobar la solicitud de un punto de conexión privado administrado en el centro> de vínculo privado de AzureConexiones pendientes.
Paso 4: Sube una tabla de Delta Lake al lakehouse
Use el Explorador de Azure Storage para cargar la carpeta de la tabla de Delta Lake en el almacenamiento administrado de restricted lakehouse:
Vaya al Explorador de Storage, seleccione el icono de conexión en el menú izquierdo y, a continuación, seleccione contenedor o directorio de ADLS Gen2.
Inicie sesión con OAuth.
Escriba un nombre para mostrar para el almacenamiento y escriba la dirección URL del contenedor de blobs en el formato siguiente:
https://{workspaceID}.z{xy}.onelake.fabric.microsoft.com/{workspaceID}/{lakehouseID}En ese código,
workspaceIDes el identificador del área de trabajo sin guiones y{xy}es los dos primeros caracteres del identificador del área de trabajo.Seleccione Conectar. El almacenamiento debería aparecer ahora en la vista del explorador.
En la carpeta Tablas , cargue la tabla de Delta Lake que desea usar. En este ejemplo se usa la tabla customers .
Paso 5: Creación de un cuaderno en el área de trabajo restringida
Cree un cuaderno que lea de la tabla y escriba en una tabla nueva. Para ello, cree un cuaderno en un área de trabajo abierta mediante la interfaz de usuario:
En el área de trabajo abierta, cree una instancia de Lakehouse con la misma tabla y un cuaderno similar mediante la interfaz de usuario.
Conecte lakehouse en el cuaderno y ejecute el script para crear una nueva tabla:
df = spark("SELECT * FROM Lakehouse_Open.customers") display(df) df.write.mode("overwrite").saveAsTable("Lakehouse_Open.customersnew")Guarde el cuaderno.
Recupere la definición del cuaderno a través de la API y obtenga el resultado de la ubicación:
Get Notebook Definition API: GET https://{WorkspaceID w/o (-)}.zxy.w.api.fabric.microsoft.com/{WorkspaceID}/notebooks/getDefinition Get location API: GET {location}/resultConvierta
notebook-content.pyde Base64 a JSON, copie el contenido convertido y, a continuación, vuelva a convertir el contenido de JSON a Base64 después de actualizar los valores siguientes con valores de restricted lakehouse.Cree un cuaderno con la definición mediante el cuerpo de la solicitud actualizado:
Create Notebook API: GET https://{WorkspaceID w/o (-)}.zxy.w.api.fabric.microsoft.com/{WorkspaceID}/notebooks Get location API: GET {location}/result
Paso 6: Creación de una canalización en el área de trabajo abierta
En el área de trabajo abierta, cree una canalización mediante el portal de Fabric o la API.
Agregue una actividad de cuaderno.
En Configuración, cree una conexión.
Seleccione el área de trabajo restringida.
Agregue el identificador del cuaderno como parámetro:
@pipeline().parameters.notebookIdEn los parámetros de canalización, escriba el identificador real del notebook del espacio de trabajo restringido.
Guarde la canalización y copie el ID de la canalización.
Paso 7: Ejecución de la canalización a través de la API
Desencadene la canalización mediante la API. Por ejemplo, use Bruno.
Este es el formato del endpoint de API para la ejecución del pipeline.
https://{openWsIdWithoutDashes}.zxy.w.api.fabric.microsoft.com/v1/workspaces/{openWsId}/items/{pipelineId}/jobs/instances?jobType=Pipeline` Get location API: GET {location}Espere a que finalice el estado de ejecución. Puede comprobar el estado en la página Supervisión del portal de Fabric.
Paso 8: Comprobar la creación de tablas
Abra el Explorador de Storage en el lago del área de trabajo restringida.
Confirme que se creó la nueva tabla.
Usa la API de Listar Tablas para obtener las tablas del Data Lakehouse.
List Tables API: GET https://{openWsIdWithoutDashes}.zxy.w.api.fabric.microsoft.com/v1/workspaces/{workspaceId}/items/{lakehouseId}/tables