Microsoft Analysis Services 提供了用于创建和使用数据挖掘模型的集成环境。 可以轻松地绑定到数据源,在同一数据上创建和测试多个模型,并部署模型以用于预测分析。
在基本数据挖掘教程中,你学习了如何使用 SQL Server Data Tools (SSDT) 创建数据挖掘解决方案,并构建了三个模型,以支持目标邮件市场活动,以分析客户购买行为和面向潜在买家。
此中间教程基于该体验并引入了多个新方案,包括预测和市场篮分析等常见业务要求。 你将了解如何创建时序模型、关联模型和序列聚类分析模型。 最后,你将了解如何使用神经网络来探索数据相关性,以及如何使用逻辑回归进行预测。
课程是独立的,可以单独完成。
若要完成以下教程,应熟悉数据挖掘工具和基本数据挖掘教程中引入的挖掘模型查看器。
所有方案都使用 AdventureWorksDW2012 数据源,但你将为不同的方案创建不同的数据源视图。 只要先创建数据源,就可以按任意顺序执行课程。
课程方案
在目标邮件活动取得成功后,系统会要求你应用数据挖掘知识,以开发多个新模型,以便在业务规划中使用。 其中包括以下任务:
预测: 你将创建一个 时序 模型,以预测世界各地的不同地区的产品销售额。 你将为每个区域开发单个模型,并了解如何使用 交叉预测。
市场篮分析: 你将创建 关联模型,以分析访问 Adventure Works Cycles 电子商务网站期间购买的产品分组。 根据此市场篮模型,可以向客户推荐产品。
序列分析: 构建 序列聚类分析模型,以分析客户购买产品的顺序。 根据此模型,可以规划网站设计或新产品/服务的更改。
因素分析: 使用 神经网络 模型来探索呼叫中心数据中服务质量不佳的可能原因。 根据初步模型的见解,你将创建 逻辑回归模型 来预测改善客户体验的策略。
学习内容
本教程介绍如何创建和使用多种类型的数据挖掘算法。 本教程分为以下课程:
第 1 课:创建中间数据挖掘解决方案(中间数据挖掘教程)
在本课中,你将基于 AdventureWorksDW2012 数据库创建新项目,以支持多个新的数据源视图和更多挖掘模型。
第 2 课:构建预测方案(中间数据挖掘教程)
在本课中,你将创建一个挖掘模型,该模型可用作预测方案的一部分。 你还将探索使用Microsoft时序算法生成的挖掘模型。
你将为各个区域生成模型,然后生成可用于交叉预测的常规模型。
第 3 课:构建购物篮分析场景(中级数据挖掘教程)
在本课中,你将添加新的数据源视图,并了解如何使用嵌套表和密钥。 根据此数据,你将创建一个挖掘模型,该模型可用作市场篮方案的一部分。 还将探索使用 Microsoft 关联算法生成的挖掘模型。
第 4 课:构建序列聚类分析方案(中间数据挖掘教程)
在本课中,你将创建一个挖掘模型,该模型可用作序列聚类分析方案的一部分。 你还将了解如何探索使用Microsoft序列聚类分析算法生成的挖掘模型。
第 5 课:构建神经网络和逻辑回归模型(中间数据挖掘教程)
在本课中,你将使用Microsoft神经网络和Microsoft逻辑回归算法创建多个相关的挖掘模型。 你还将了解如何使用数据源视图来浏览模型基础的数据。
要求
请确保已安装以下内容:
Microsoft SQL Server 2014
Microsoft SQL Server Analysis Services
具有 AdventureWorksDW2012 数据库的 SQL Server。
默认情况下,不会安装示例数据库,以提高安全性。 若要安装 Microsoft SQL Server 的官方数据库,请访问 Microsoft SQL 示例数据库 页并选择相应的示例数据库版本。
另请参阅
基本数据挖掘教程
自行车买家 DMX 教程
市场商品组合 DMX 教程