在复制活动中配置 Azure 表存储

本文概述了如何使用管道中的复制活动从和到 Azure Table Storage 复制数据。

支持的配置

有关复制活动下每个选项卡的配置,请分别转到以下部分。

概况

请参阅 常规 设置 指南,以配置 常规 设置选项卡。

来源

转到“源”选项卡以配置复制活动源。 有关详细配置,请参阅以下内容。

需要以下三个属性:

  • 连接:从连接列表中选择 Azure 表存储连接。 如果不存在连接,则通过选择“ 新建”创建新的 Azure 表存储连接。

  • 使用查询:指定读取数据的方式。 选择要从指定表读取数据的 ,或选择 “查询 ”以使用查询读取数据。

    如果选择 “表”:

    显示选择“表”时使用查询的屏幕截图。

    • :在 Azure 表存储数据库实例中指定表的名称。 从下拉列表中选择表,或者通过选择 “编辑”手动输入名称。

    如果选择 “查询”:

    屏幕截图显示在选择“查询”时使用查询。

    • :在 Azure 表存储数据库实例中指定表的名称。 从下拉列表中选择表,或者通过选择 “编辑”手动输入名称。

    • 查询:指定要读取数据的自定义表存储查询。 源查询是 $filter 查询选项的直接映射,该选项由 Azure 表存储支持;详细了解语法,请参阅 本文

      注释

      Azure 表查询操作在 30 秒后超时,由 Azure 表服务强制执行。 了解如何在 查询设计 文章中优化查询。

在“高级”下,可以指定以下字段:

  • 忽略未找到表:指定是否允许在表不存在的情况下引发异常。 默认情况下,它未选中。

  • 其他列:添加其他数据列以存储源文件的相对路径或静态值。 后者支持表达式。

目的地

转到“目标”选项卡,配置复制活动目标。 有关详细配置,请参阅以下内容。

需要以下三个属性:

  • 连接:从连接列表中选择 Azure 表存储连接。 如果不存在连接,则通过选择“ 新建”创建新的 Azure 表存储连接。
  • :在 Azure 表存储数据库实例中指定表的名称。 从下拉列表中选择表,或者通过选择 “编辑”手动输入名称。

在“高级”下,可以指定以下字段:

  • 插入类型:选择要将数据插入 Azure 表的模式。 模式为 MergeReplace。 此属性控制输出表中具有匹配分区和行键的现有行是否已替换或合并其值。 此设置适用于行级别而非表级别。 这两个选项都不会删除输入中不存在的输出表中的行。 若要了解合并和替换设置的工作原理,请参阅“插入”或“合并实体”和“插入”或“替换实体”。

  • 分区键值选择:从 “指定分区值 ”或 “使用目标”列中进行选择。 分区键值可以是固定值,也可以从目标列中获取值。

    如果选择 “指定分区”值

    • 默认分区值:指定目标可以使用的默认分区键值。

    如果选择 “使用目标列”

    • 分区键列:选择列值用作分区键的列的名称。 如果未指定,“AzureTableDefaultPartitionKeyValue”将用作分区键。
  • 行键值选择:从 唯一标识符 中选择或使用 目标列。 行键值可以是自动生成的唯一标识符,也可以从目标列获取值。

    如果选择 “使用目标列”

    • 行键列:选择列值用作行键的列的名称。 如果未指定,请对每行使用 GUID。
  • 写入批大小:当达到指定的写入批大小时,将数据插入到 Azure 表中。 允许的值是整数(行数)。 默认值为 10,000。

  • 写入批处理超时:在达到指定的写入批处理超时时将数据插入 Azure 表。 允许的值是时间跨度。

  • 最大并发连接:活动运行期间与数据存储建立的并发连接上限。 仅当想要限制并发连接时指定值

映射

有关 映射 选项卡配置,请参阅 映射选项卡下配置映射。

设置

对于“设置”选项卡配置,请转到“设置”选项卡下的“配置其他设置”。

表摘要

下表包含有关 Azure 表存储中的复制活动的详细信息。

源信息

Name Description 价值 必选 JSON 脚本属性
连接 与源数据存储的连接。 < 您的 Azure 表存储连接 > 是的 连接
使用查询 读取数据的方式。 应用 以从指定表读取数据,或使用 查询应用查询 读取数据。 •表格
• 查询
是的 /
Azure 表存储数据库实例中表的名称。 < 表名称 > 是的 tableName
查询 指定用于读取数据的自定义 Table 存储查询。 源查询是 $filter 查询选项的直接映射,该选项由 Azure 表存储支持;详细了解语法,请参阅 本文 < 查询 > azureTableSourceQuery
忽略找不到表的错误 指示是否允许表的异常不存在。 已选择或未选中(默认值) azureTableSourceIgnoreTableNotFound:
true 或 false (默认值)
其他列 添加其他数据列以存储源文件的相对路径或静态值。 后者支持表达式。 • 姓名
•价值
附加列:
•名字
•价值

目的地信息

Name Description 价值 必选 JSON 脚本属性
连接 与目标数据存储的连接。 < 您的 Azure 表存储连接 > 是的 连接
Azure 表存储数据库实例中表的名称。 < 表名称 > 是的 tableName
插入类型 插入数据到 Azure 表的模式。 此属性控制输出表中具有匹配分区和行键的现有行是否已替换或合并其值。 合并
替换
azureTableInsertType:
•合并
•取代
分区键值选择 分区键值可以是固定值,也可以从目标列中获取值。 指定分区值
使用目标列
/
默认分区值 目标可以使用的默认分区键值 < 默认分区值 > azureTableDefaultPartitionKeyValue
分区键列 其值用作分区键的列的名称。 如果未指定,“AzureTableDefaultPartitionKeyValue”将用作分区键。 < 分区键列 > azureTablePartitionKeyName
行键值选择 行键值可以是自动生成的唯一标识符,也可以从目标列获取值。 唯一标识符
使用目标列
/
行键列 其列值被用作行键的列名称。 如果未指定,请对每行使用 GUID。 < 行键列 > azureTableRowKeyName
写入批大小 达到写入批次大小时,将数据插入 Azure 表。 整数
(默认值为 10,000)
writeBatchSize (写入批量大小)
写入批处理超时 达到写入批处理超时时,将数据插入到 Azure 表中。 timespan writeBatchTimeout
最大并发连接数 活动运行期间与数据存储建立的并发连接的上限。 仅当想要限制并发连接时,才指定一个值。 < 最大并发连接数 > maxConcurrentConnections