在本任务中,您将创建 Suppliers 知识库,并且创建用于清理数据以及对数据进行匹配以便删除重复项的域。
启动“数据质量客户端”。 单击“开始”,指向“所有程序”,依次单击 Microsoft SQL Server 2012、Data Quality Services 和“数据质量客户端”。
在“连接到服务器”对话框中,选择要安装 DQS 的数据库服务器实例,然后单击“连接”。
.jpg)
在数据质量客户端主页的“知识库管理”窗格中,单击“新建知识库”。
.jpg)
为知识库的“名称”输入 Suppliers。
.jpg)
确认“知识库创建自”字段设置为“无”,因为您是从头开始创建 Suppliers 知识库。
确认为“活动”选择“域管理”,然后单击“下一步”。 通过域管理活动,您可以在知识库中创建和管理域。
在“域管理”窗口中,单击“创建域”工具栏按钮以创建一个域。
.jpg)
在“创建域”对话框中,为“域名”键入 Supplier ID,然后单击“确定”。
.jpg)
重复执行前一步以便创建具有所有默认设置的以下域。 为使本教程简单易懂,将所有域的“数据类型”均设置为 String。 其他允许的数据类型是:Integer、Decimal 和 Date。 在选择了“使用前导值”选项(默认设置)时,所有同义词都会被输出中同义词组的前导值替代。 设置“将字符串规范化”选项(默认设置)可以删除域值中的任何特殊字符。 通过“将输出格式设置为”选项,您可以选择在输出域中的数据值时要采用的格式。 选择“启用拼写检查器”(默认设置)可在填充域时对所有字符串值运行拼写检查器。 “语言”设置指定要应用的“拼写检查器”的语言版本。 选择“禁用语法错误算法”可填充域而不会检查字符串值是否存在语法错误。 有关详细信息,请参阅 MSDN 库中的创建域主题。
Supplier Name
Contact Email
Address Line
City
State
Country
Zip