任务 3:创建并运行数据质量项目以进行匹配

在本任务中,您将创建匹配活动的数据质量项目并对已清理的供应商数据运行匹配过程以删除数据中的所有重复项。

  1. 在“DQS 客户端”的主页上,单击“新建数据质量项目”。

  2. 从“项目的名称”键入“删除供应商重复项”。

  3. 为“使用知识库”字段从知识库列表中选择 Suppliers。 您在上一课中在此知识库中创建了匹配策略。

  4. 在右下方的窗格中从活动列表选择“匹配”。

    新建数据质量项目 - 已选择匹配

  5. 单击“下一步”。

  6. 在“映射”页中,为“数据源”选择“Excel 文件”。

  7. 单击“浏览”并选择 Cleansed Supplier List.xls(它是清理活动的输出文件)。

  8. SupplierID 源列映射到 Supplier ID 域,将 Supplier Name 列映射到 Supplier Name 域,然后将 ContactEmailAddress 列映射到 Contact Email 域。

  9. 单击“下一步”以切换到“匹配”页。

  10. 单击“启动”以启动匹配过程。 您应看到与上一个任务类似的结果,因为您使用了相同的输入文件来定义匹配策略。

  11. 在列表框中查看所有匹配的记录及其匹配分数。 结果应与您在上一个任务中看到的结果相同。 请参阅上一个任务中的步骤来分析此匹配活动的结果。

  12. 单击“下一步”以切换到“导出”页。

下一步

任务 4:将匹配活动的结果导出到 Excel 文件