任务 1:创建知识库和域

在本任务中,您将创建 Suppliers 知识库,并且创建用于清理数据以及对数据进行匹配以便删除重复项的域。

  1. 启动“数据质量客户端”。 单击“开始”,指向“所有程序”,依次单击 Microsoft SQL Server 2012Data Quality Services 和“数据质量客户端”。

  2. 在“连接到服务器”对话框中,选择要安装 DQS 的数据库服务器实例,然后单击“连接”。

    “连接到服务器”对话框

  3. 在数据质量客户端主页的“知识库管理”窗格中,单击“新建知识库”。

    知识库管理 - 新建知识库

  4. 为知识库的“名称”输入 Suppliers

    新建知识库 - 域管理

  5. 确认“知识库创建自”字段设置为“无”,因为您是从头开始创建 Suppliers 知识库。

  6. 确认为“活动”选择“域管理”,然后单击“下一步”。 通过域管理活动,您可以在知识库中创建和管理域。

  7. 在“域管理”窗口中,单击“创建域”工具栏按钮以创建一个域。

    “创建域”工具栏按钮

  8. 在“创建域”对话框中,为“域名”键入 Supplier ID,然后单击“确定”。

    “创建域”对话框

  9. 重复执行前一步以便创建具有所有默认设置的以下域。 为使本教程简单易懂,将所有域的“数据类型”均设置为 String。 其他允许的数据类型是:Integer、Decimal 和 Date。 在选择了“使用前导值”选项(默认设置)时,所有同义词都会被输出中同义词组的前导值替代。 设置“将字符串规范化”选项(默认设置)可以删除域值中的任何特殊字符。 通过“将输出格式设置为”选项,您可以选择在输出域中的数据值时要采用的格式。 选择“启用拼写检查器”(默认设置)可在填充域时对所有字符串值运行拼写检查器。 “语言”设置指定要应用的“拼写检查器”的语言版本。 选择“禁用语法错误算法”可填充域而不会检查字符串值是否存在语法错误。 有关详细信息,请参阅 MSDN 库中的创建域主题。

    • Supplier Name

    • Contact Email

    • Address Line

    • City

    • State

    • Country

    • Zip

下一步

任务 2:手动添加域值