随着时间的推移,您将会想要向 MDS 存储库中添加更多的数据。 在添加数据前,将新数据与已在 MDS 中进行管理的数据进行比较可能会很有用,因为这样可以确保不会添加重复数据或不正确的数据。 在用于 Excel 的 Master Data Services 外接程序中,您可以合并两个工作表的数据并比较数据以在将数据发布到 MDS 前识别并删除重复项。 MDS Excel 外接程序的匹配功能使用 DQS 匹配功能来识别数据中的匹配项。 在本任务中,您将两个工作表中的数据合并到一个工作表中,然后执行匹配活动以在发布到 MDS 前识别并删除重复项。 有关详细信息,请参阅用于 Excel 的 MDS 外接程序中的数据质量匹配和合并数据主题。
启动 Excel 的新实例。 单击“开始”,指向“运行”,键入 Excel,然后单击“确定”。
通过单击菜单栏上的“主数据”切换到“主数据”选项卡。
单击功能区上“连接并加载”组中的“连接”以连接到“MDS 服务器”。 您在本课前面已配置了此连接。
.jpg)
您应看到右侧的“主数据资源管理器”窗格。 如果未看到主数据资源管理器,请单击功能区上的“显示资源管理器”按钮。
在“主数据资源管理器”窗口中,为“模型”在下拉列表中选择 Suppliers。 您应看到该模型具有一个实体:Supplier。
.jpg)
在实体列表中双击 Supplier 以将该实体成员加载到 Excel 工作表。
单击底部的 Sheet2 以切换到 Sheet2 选项卡。 如果未看到 Sheet2,请添加一个新工作表。
打开 Suppliers.xls 文件(包含在教程文件中的原始输入文件)并将全部(三)行从 CombineAndCleanse 工作表复制到 Sheet2。
切换回连接到 MDS 的 Book1 – Microsoft Excel 中的 Supplier 工作表(不是包含已清理和已匹配供应商列表的 Excel)。
单击菜单栏上的“主数据”。
单击功能区上的“合并数据”。 您将看到“合并数据”对话框。
在“合并数据”对话框中,单击“要与 MDS 数据组合的范围”文本框旁边的按钮,如下图中所示。
.jpg)
您现在应看到收缩的对话框。 现在,单击 Sheet2 以切换到 Sheet2 选项卡,该选项卡包含具有 4 行(包括一个标题行)的新供应商数据。
在 Sheet2 中,选择包括该标题行的所有行(即使它们看上去已选定)。 您应看到“要与 MDS 数据组合的范围”自动更新。
.jpg)
在不关闭“合并数据”对话框的情况下切换回 Suppliers 选项卡。
单击文本框旁边的按钮。 您现在应看到对话框已展开。 您应看到 MDS 实体 Supplier 的列到 Excel 列之间的所有映射已自动填充。
.jpg)
确保将 Code 实体列映射到工作表中的 SupplierID 列,将 Zip Code 实体列映射到工作表中的 Zip Code 列。
在“合并数据”对话框中,单击“合并”。
确认将三个数据行添加到了工作表的底部且它们应用颜色标记出来。
.jpg)
单击功能区上的“匹配数据”以识别重复项。 此功能使用 DQS 的匹配功能。
在“匹配数据”对话框中,为“DQS 知识库”选择 Suppliers。
.jpg)
将工作表列映射到域,如下表中所示。
工作表列
域
Code(您上载了 Supplier ID 作为 MDS 中 Supplier 实体的代码)
Supplier ID
Name(您上载了 Supplier Name 作为 MDS 中 Supplier 实体的名称)
Supplier Name
ContactEmailAddress
ContactEmail
选择 Code 列映射的“先决条件”。
输入 70% 作为 Supplier Name 的“权重”,输入 30% 作为 Contact Email 的“权重”,如图中所示。
单击“确定”。
此匹配过程应识别具有 Code: S1 的供应商的一个重复项。
.jpg)
选择“重复的行(橙色)”并右键单击,然后单击“删除”以删除该行。
删除 CLUSTER_ID 列,因为您不再需要它。
单击“发布”以将具有 Code S66 和 S57 的其他两个新记录发布到 MDS。
在“发布并添加批注”对话框中,添加一个批注,然后单击“发布”。
切换到“主数据管理器 Web 应用程序”。
在主页上,确保为“模型”选择了 Suppliers,然后单击“资源管理器”。 如果已打开“资源管理器”,则刷新 Internet 浏览器。
按 Code 对列表排序,查找代码为 S57 和 S66 的记录。 您还可以使用工具栏上的“筛选”按钮搜索列表中的特定记录。
现在,关闭 Book1 – Microsoft Excel 窗口而不保存文件。