教程:配置 Microsoft Fabric 的开放镜像数据库

在本教程中,在 Fabric 中配置打开的镜像数据库。 此示例指导你创建新的打开的镜像数据库,并了解如何将数据登陆到登陆区域。 你将熟悉 Microsoft Fabric 中打开镜像的概念。

先决条件

  • 需要 Fabric 的现有容量。 如果没有, 请启动 Fabric 试用版
    • Fabric 容量需要处于活动状态并正在运行。 暂停或删除的容量会影响镜像,不会复制任何数据。

创建镜像数据库

在本部分中,我们简要概述了如何在 Fabric 门户中创建新的打开的镜像数据库。 或者,可以使用 Create mirrored database REST API 和 JSON 定义示例来创建开放镜像。

  1. 使用现有工作区或创建新工作区。 在工作区中,导航到 “创建 ”中心。 选择 创建
  2. 找到并选择 镜像数据库 卡。
  3. 输入新镜像数据库的名称。
  4. 选择 创建
  5. 通过用户界面创建 Open 镜像数据库后,镜像进程已准备就绪。 查看新镜像数据库项的 主页 。 找到 着陆区 URL 位于镜像数据库主页的详细信息部分。

Fabric 门户中的屏幕截图,其中显示了镜像数据库项主页中的登陆区域 URL 位置。

开始复制数据

创建镜像数据库后,开始上传文件。 可以使用 Fabric 门户或通过 OneLake 以编程方式上传初始数据和将来更改的数据集。

通过 Fabric 门户上传

上传初始数据和/或增量更改的数据以打开镜像:

  1. 选择镜像数据库的主页上的 “上传文件 ”。

    Fabric 门户中打开镜像数据库主屏幕的“上传文件”选项的屏幕截图。

  2. “上传文件 ”页上,使用 Fabric 门户中的上传对话框上传文件。

    重要

    Parquet 或带分隔符的文本文件的文件名需要与已规定的格式和文件名一致。 有关详细信息,请参阅 开启镜像着陆区的要求和格式

  3. “预览数据 ”页上,可以看到要上传的数据的预览。 提供表名称,并指定主键列。 选择“ 创建表”。

  4. 上传后,数据将立即开始复制到 OneLake。 几分钟后,在 资源管理器中,可以通过从 OneLake 的 上传文件OneLake 中的表中选择文件来查看已在 OneLake 中复制的文件。

  5. 资源管理器中的复制状态中,您可以看到有多少行已复制,以及与镜像到 OneLake 的数据相关的任何错误。

  6. 如果您更改了镜像数据库中现有数据表的数据格式,您可以上传或拖放这些更改文件。 更改将自动反映在 OneLake 中。

使用其他机制将数据写入着陆区

应用程序现在可以将初始加载和增量更改数据写入着陆区 URL,这是 OneLake 的特定开放镜像路径。

启动镜像过程

  1. “配置镜像”屏幕允许你镜像数据库中的所有数据,这是默认选项。
    • 镜像所有数据意味着,镜像启动后创建的任何新表都会被镜像。
    • 也可选择只镜像某些对象。 禁用“镜像所有数据”选项,然后从数据库中选择单独的表。 在本教程中,我们将选择“镜像所有数据”选项。
  2. 选择“镜像数据库”。 镜像开始。
  3. 等待 2-5 分钟。 然后,选择“监视复制”以查看状态。
  4. 几分钟后,状态应变为“正在运行”,这表明正在同步表。 如果未看到表和相应的复制状态,请等待几秒钟,然后刷新面板。
  5. 完成表的初始复制后,“上次刷新”列中会显示一个日期。
  6. 现在,你的数据已启动并运行,整个 Fabric 中具有各种可用的分析场景。

监视结构镜像

配置镜像后,将定向到“镜像状态”页。 可以在此处监视复制的当前状态。

有关复制状态的详细信息和细节,请参阅监视 Fabric 镜像数据库复制

后续步骤