在本教程中,在 Fabric 中配置打开的镜像数据库。 此示例指导你创建新的打开的镜像数据库,并了解如何将数据登陆到登陆区域。 你将熟悉 Microsoft Fabric 中打开镜像的概念。
先决条件
- 需要 Fabric 的现有容量。 如果没有, 请启动 Fabric 试用版。
- Fabric 容量需要处于活动状态并正在运行。 暂停或删除的容量会影响镜像,不会复制任何数据。
创建镜像数据库
在本部分中,我们简要概述了如何在 Fabric 门户中创建新的打开的镜像数据库。 或者,可以使用 Create mirrored database REST API 和 JSON 定义示例来创建开放镜像。
- 使用现有工作区或创建新工作区。 在工作区中,导航到 “创建 ”中心。 选择 创建。
- 找到并选择 镜像数据库 卡。
- 输入新镜像数据库的名称。
- 选择 创建。
- 通过用户界面创建 Open 镜像数据库后,镜像进程已准备就绪。 查看新镜像数据库项的 主页 。 找到 着陆区 URL 位于镜像数据库主页的详细信息部分。
开始复制数据
创建镜像数据库后,开始上传文件。 可以使用 Fabric 门户或通过 OneLake 以编程方式上传初始数据和将来更改的数据集。
通过 Fabric 门户上传
上传初始数据和/或增量更改的数据以打开镜像:
选择镜像数据库的主页上的 “上传文件 ”。
在 “上传文件 ”页上,使用 Fabric 门户中的上传对话框上传文件。
重要
Parquet 或带分隔符的文本文件的文件名需要与已规定的格式和文件名一致。 有关详细信息,请参阅 开启镜像着陆区的要求和格式。
在 “预览数据 ”页上,可以看到要上传的数据的预览。 提供表名称,并指定主键列。 选择“ 创建表”。
上传后,数据将立即开始复制到 OneLake。 几分钟后,在 资源管理器中,可以通过从 OneLake 的 上传文件 或 OneLake 中的表中选择文件来查看已在 OneLake 中复制的文件。
在资源管理器中的复制状态中,您可以看到有多少行已复制,以及与镜像到 OneLake 的数据相关的任何错误。
如果您更改了镜像数据库中现有数据表的数据格式,您可以上传或拖放这些更改文件。 更改将自动反映在 OneLake 中。
使用其他机制将数据写入着陆区
应用程序现在可以将初始加载和增量更改数据写入着陆区 URL,这是 OneLake 的特定开放镜像路径。
- 按照 连接到 Microsoft OneLake 的指引,使用 ADLS Gen2 API 授权并写入 OneLake 中的镜像数据库着陆区。
- 查看 开放镜像落地区域的要求及格式规范。
- 使用 Open Mirroring Python SDK 入门!
启动镜像过程
-
“配置镜像”屏幕允许你镜像数据库中的所有数据,这是默认选项。
- 镜像所有数据意味着,镜像启动后创建的任何新表都会被镜像。
- 也可选择只镜像某些对象。 禁用“镜像所有数据”选项,然后从数据库中选择单独的表。 在本教程中,我们将选择“镜像所有数据”选项。
- 选择“镜像数据库”。 镜像开始。
- 等待 2-5 分钟。 然后,选择“监视复制”以查看状态。
- 几分钟后,状态应变为“正在运行”,这表明正在同步表。 如果未看到表和相应的复制状态,请等待几秒钟,然后刷新面板。
- 完成表的初始复制后,“上次刷新”列中会显示一个日期。
- 现在,你的数据已启动并运行,整个 Fabric 中具有各种可用的分析场景。
监视结构镜像
配置镜像后,将定向到“镜像状态”页。 可以在此处监视复制的当前状态。
有关复制状态的详细信息和细节,请参阅监视 Fabric 镜像数据库复制。