任务 4(可选):组合、匹配和发布新数据集

随着时间的推移,您将会想要向 MDS 存储库中添加更多的数据。 在添加数据前,将新数据与已在 MDS 中进行管理的数据进行比较可能会很有用,因为这样可以确保不会添加重复数据或不正确的数据。 在用于 Excel 的 Master Data Services 外接程序中,您可以合并两个工作表的数据并比较数据以在将数据发布到 MDS 前识别并删除重复项。 MDS Excel 外接程序的匹配功能使用 DQS 匹配功能来识别数据中的匹配项。 在本任务中,您将两个工作表中的数据合并到一个工作表中,然后执行匹配活动以在发布到 MDS 前识别并删除重复项。 有关详细信息,请参阅用于 Excel 的 MDS 外接程序中的数据质量匹配合并数据主题。

  1. 启动 Excel 的新实例。 单击“开始”,指向“运行”,键入 Excel,然后单击“确定”。

  2. 通过单击菜单栏上的“主数据”切换到“主数据”选项卡。

  3. 单击功能区上“连接并加载”组中的“连接”以连接到“MDS 服务器”。 您在本课前面已配置了此连接。

    Excel - 在“主数据”选项卡上显示“资源管理器”按钮

  4. 您应看到右侧的“主数据资源管理器”窗格。 如果未看到主数据资源管理器,请单击功能区上的“显示资源管理器”按钮。

  5. 在“主数据资源管理器”窗口中,为“模型”在下拉列表中选择 Suppliers。 您应看到该模型具有一个实体:Supplier

    Excel -“主数据资源管理器”窗口

  6. 在实体列表中双击 Supplier 以将该实体成员加载到 Excel 工作表。

  7. 单击底部的 Sheet2 以切换到 Sheet2 选项卡。 如果未看到 Sheet2,请添加一个新工作表。

  8. 打开 Suppliers.xls 文件(包含在教程文件中的原始输入文件)并将全部(三)行从 CombineAndCleanse 工作表复制到 Sheet2

  9. 切换回连接到 MDSBook1 – Microsoft Excel 中的 Supplier 工作表(不是包含已清理和已匹配供应商列表的 Excel)。

  10. 单击菜单栏上的“主数据”。

  11. 单击功能区上的“合并数据”。 您将看到“合并数据”对话框。

  12. 在“合并数据”对话框中,单击“要与 MDS 数据组合的范围”文本框旁边的按钮,如下图中所示。

    Excel -“合并数据”对话框

  13. 您现在应看到收缩的对话框。 现在,单击 Sheet2 以切换到 Sheet2 选项卡,该选项卡包含具有 4 行(包括一个标题行)的新供应商数据。

  14. Sheet2 中,选择包括该标题行的所有行(即使它们看上去已选定)。 您应看到“要与 MDS 数据组合的范围”自动更新。

    Excel -“合并数据”对话框 - 最小化

  15. 在不关闭“合并数据”对话框的情况下切换回 Suppliers 选项卡。

  16. 单击文本框旁边的按钮。 您现在应看到对话框已展开。 您应看到 MDS 实体 Supplier 的列到 Excel 列之间的所有映射已自动填充。

    Excel -使用数据填充的“合并数据”对话框

  17. 确保将 Code 实体列映射到工作表中的 SupplierID 列,将 Zip Code 实体列映射到工作表中的 Zip Code 列。

  18. 在“合并数据”对话框中,单击“合并”。

  19. 确认将三个数据行添加到了工作表的底部且它们应用颜色标记出来。

    Excel - 合并后的新元素

  20. 单击功能区上的“匹配数据”以识别重复项。 此功能使用 DQS 的匹配功能。

  21. 在“匹配数据”对话框中,为“DQS 知识库”选择 Suppliers

    Excel -“匹配数据”对话框

  22. 将工作表列映射到域,如下表中所示。

    工作表列

    Code(您上载了 Supplier ID 作为 MDS 中 Supplier 实体的代码)

    Supplier ID

    Name(您上载了 Supplier Name 作为 MDS 中 Supplier 实体的名称)

    Supplier Name

    ContactEmailAddress

    ContactEmail

  23. 选择 Code 列映射的“先决条件”。

  24. 输入 70% 作为 Supplier Name 的“权重”,输入 30% 作为 Contact Email 的“权重”,如图中所示。

  25. 单击“确定”。

  26. 此匹配过程应识别具有 Code: S1 的供应商的一个重复项。

    Excel - 匹配结果

  27. 选择“重复的行(橙色)”并右键单击,然后单击“删除”以删除该行。

  28. 删除 CLUSTER_ID 列,因为您不再需要它。

  29. 单击“发布”以将具有 Code S66S57 的其他两个新记录发布到 MDS。

  30. 在“发布并添加批注”对话框中,添加一个批注,然后单击“发布”。

  31. 切换到“主数据管理器 Web 应用程序”。

  32. 在主页上,确保为“模型”选择了 Suppliers,然后单击“资源管理器”。 如果已打开“资源管理器”,则刷新 Internet 浏览器。

  33. Code 对列表排序,查找代码为 S57S66 的记录。 您还可以使用工具栏上的“筛选”按钮搜索列表中的特定记录。

  34. 现在,关闭 Book1 – Microsoft Excel 窗口而不保存文件。

下一步

任务 5:从 Excel 中创建基于域的属性