在企业中管理信息通常涉及集成来自企业和企业之外的信息、清理数据、对数据进行匹配以便删除重复项、标准化数据、丰富数据、使数据符合法律和遵从性要求,以及将数据存储于具有所有必需的安全设置的集中位置。
SQL Server 2012 在单个产品中提供一个有效企业信息管理 (EIM) 解决方案所需的所有组件。 可帮助您生成 EIM 解决方案的 SQL Server 2012 的关键组件是:
SQL Server Integration Services
SQL Server Data Quality Services
SQL Server Master Data Services
SQL Server Integration Services (SSIS) 提供强大的可扩展平台,用于在支持业务工作流、数据仓库或主数据管理的全面的提取、转换和加载 (ETL) 解决方案中集成来自不同源的数据。 有关 SSIS 的快速概览和典型用法,请参阅 Integration Services 概述主题。
通过 SQL Server Data Quality Services (DQS),您可以清理、匹配、标准化和丰富数据,以便您可以提供可信的信息来用于商业智能、数据仓库和事务处理工作负荷。 有关针对 DQS 的业务需要以及 DQS 如何满足这些需要,请参阅 Data Quality Services 简介主题。
SQL Server Master Data Services (MDS) 提供一个集中的数据中心,确保信息的完整性和数据的一致性在不同应用程序中是不变的。 有关 MDS 的重要功能的简要说明,请参阅 Master Data Services 概述主题。
有关一起使用这些 Microsoft EIM 技术实现一个 EIM 解决方案的全面的指导,请参阅使用 SQL Server 2012 进行企业信息管理和使用 EIM 技术清理和匹配主数据白皮书;还可以观看企业信息管理 (EIM):将 SSIS、DQS 和 MDS 融汇在一起视频,这是针对 EIM 方案的一个很酷的演示。
在本教程中,您将学习如何一起使用 SSIS、MDS 和 DQS 来实现一个示例企业信息管理 (EIM) 解决方案。 首先,您将使用 DQS 创建一个包含与数据(元数据)有关的知识的知识库,通过使用该知识库清理一个 Excel 文件中的数据,并且对数据进行匹配以便标识并删除数据中的重复项。 接下来,您将使用用于 Excel 的 MDS 外接程序将已清理和匹配的数据上载到 MDS。 然后,您通过使用一个 SSIS 解决方案自动化整个过程。 本教程中的 SSIS 解决方案从一个 Excel 文件中读取输入数据,但您可以对其进行扩展,以便从不同数据源(例如 Oracle、Teradata、DB2 和 Windows Azure SQL Database)读取数据。
先决条件
安装了以下组件的 Microsoft SQL Server 2012。
Integration Services (SSIS)
Master Data Services (MDS)
Data Quality Services (DQS)
SQL Server Data Tools
有关安装此产品的详细信息,请参阅 SQL Server 2012 安装指南。
使用 Master Data Services 配置管理器配置 MDS
使用配置管理器创建和配置 Master Data Services 数据库。 在您创建 MDS 数据库后,在某一网站(例如:https://localhost/MDS)中为 MDS 创建一个 Web 应用程序,并且将该 MDS 数据库与该 MDS Web 应用程序相关联。 请注意,若要创建 MDS Web 应用程序,您应该在您的计算机上安装有 IIS。 有关配置 MDS 数据库和 Web 应用程序的先决条件的详细信息,请参阅 Web 应用程序要求 (Master Data Services) 和数据库要求 (Master Data Services)。
使用数据质量服务器安装程序安装和配置 DQS。 依次单击“开始”、“所有程序”、Microsoft SQL Server 2012、Data Quality Services 和“数据质量服务器安装程序”。
Microsoft Excel 2010(首选 32 位)。
从此处安装 Master Data Services Excel 外接程序(基于在您的计算机上具有的 Excel 版本,可为 32 位或 64 位)。 若要查找在您的计算机上安装的 Excel 的版本,请运行 Excel,在菜单栏上单击“文件”,然后单击“帮助”在右侧窗格中查看版本。 请注意,您需要在安装 Excel 外接程序前安装 Visual Studio 2010 Tools for Office Runtime。
(可选)使用 Windows Azure Marketplace 创建帐户。 本教程中的任务之一要求您具有 Azure Marketplace(最初名为 Data Market)帐户。 如果需要您可以跳过此任务,继续执行下一任务。
从 Microsoft 下载中心下载 Suppliers.xls 文件。
如果您在使用“64 位版本的 Excel”,DQS 不允许您将清理或匹配结果导出到某一 Excel 文件。 此问题是一个已知问题。 若要解决此问题,请执行以下操作:
安装 SQL Server 2012 SP1(在具有 64 位 Excel 的 64 位计算机上)。
运行 DQLInstaller.exe –upgrade。 如果您安装了 SQL Server 的默认实例,则 DQSInstaller.exe 文件将出现在 C:\Program Files\Microsoft SQL Server\MSSQL11.MSSQLSERVER\MSSQL\Binn 下。 双击 DQSInstaller.exe 文件。
在“Master Data Services 配置管理器”中,单击“选择数据库”,选择现有 MDS 数据库,然后单击“升级”。
课程
课程 |
简短说明 |
学完本课的估计时间(分钟)。 |
|---|---|---|
在本课中,您将创建一个名为 Suppliers 的 DQS 知识库。 |
60 |
|
在本课中,您通过使用在第一课中创建的 Suppliers 知识库,创建并运行一个 DQS 项目以便清理 Excel 文件中的供应商数据。 |
45 |
|
在本课中,您创建一个 DQS 项目以便执行匹配活动,从而从已清理的供应商列表中标识并删除重复项。 |
45 |
|
在本课中,您通过使用“用于 Excel 的 MDS 外接程序”将已清理和匹配的供应商数据上载到 Master Data Services (MDS) 中。 |
45 |
|
在本课中,您创建一个 SSIS 解决方案,该解决方案使用 DQS 清理输入数据、匹配已清理的数据以便删除重复项,以及以自动方式在 MDS 上存储已清理和匹配的数据。 |
75 |
后续步骤
要开始学习本教程,请转到第一课:第 1 课:创建 DQS Suppliers 知识库.