在此任务中,你将对供应商 ID 和供应商名称域执行知识发现活动。 在此方案中,知识发现过程主要导入这两个域的值。
在本教程中,你从头开始构建知识库。 还可以通过执行知识发现活动开始创建知识库。 在主页中单击“ 创建知识库 ”时,DQS 客户端会将你转到一个页面,其中包含为活动选择 的域管理 活动。 可以将 活动 更改为 知识发现 ,然后在下一页中创建域作为知识发现过程的一部分。 有关更多详细信息,请参阅 “执行知识发现 ”。
在 DQS 客户端主页的“最近知识库”部分中,单击供应商知识库旁边的右箭头,然后单击“知识发现”。 或者,可以单击“打开知识库”,从知识库列表中选择“供应商”,选择“知识发现”作为活动,然后单击“下一步”。
选择Excel 文件作为数据源。
单击“ 浏览”,导航并选择 Suppliers.xls,然后单击“ 打开”。
为工作表选择“发现供应商”。
在“映射”部分中,使用下拉列表将 Excel 文件中的“供应商 ID”列和“供应商名称”列映射到“供应商名称”域。 Excel 文件包含 供应商 ID 和 供应商名称 域的示例数据。 在发现过程中,可以选择要为其发现数值的域。 可以在此页上创建域,然后将源列映射到这些域。 在知识发现活动期间创建域是常见的,而在域管理活动期间创建域则相对不常见。
单击“ 下一步 ”切换到 “发现 ”页。
在“ 发现 ”页上,单击“ 开始” 以启动发现过程。 在 Suppliers.xls 文件中对 供应商 ID 和 供应商名称 列进行识别。 应使用从发现中提取的知识填充 供应商 ID 和 供应商名称 域。
分析完成后,请查看页面底部的“探查器”选项卡中的“源统计信息”。 请注意,发现了 10 条包含总计 20 个值的新记录(Excel 工作表中的供应商 ID 和供应商名称值)。 你还将看到有多少个值是新值、唯一值、新且唯一的值以及有效值。 在右侧的列表框中,可以查看发现过程中涉及的每个域的更多详细信息。 如果将鼠标悬停在“完整性”列中的状态栏上,可以看到源列中是否有任何缺失值。
单击“ 下一步 ”切换到“ 管理域值 ”页。
在“ 管理域值 ”页中,单击域列表中的 “供应商名称 ”域。
在右窗格中,右键单击“懒人乡村商店x”(注意末尾的“x”),然后选择“懒人乡村商店”。 DQS 在域上运行拼写检查器后建议进行此更改。 默认情况下,在创建的域中启用拼写检查器。
在域值列表中,确认将值 Lazy Country Storex 设置为错误(红色 X 标记),并且将 Lazy Country Store 作为更正, 同时 Lazy Country Store 也作为有效值添加。
单击“完成”。
在 “SQL Server Data Quality Services ”对话框中,单击“ 发布”。
单击“成功”消息框上的 “确定 ”。
你已完成本教程的第一课。