数据建模是数据挖掘的步骤,通过向数据应用 算法 来生成模式和趋势。 稍后可以使用这些模式进行分析,或进行预测。
Office 的数据挖掘外接程序通过向导支持数据挖掘,以便轻松创建模型。 向导分析数据、识别相关性、计算所有变量的统计意义,并自动选择最佳模型。
尽管此功能与 SQL Server Analysis Services 和 SQL Server Data Tools (SSDT)提供的数据挖掘工具一样强大,但向导和熟悉的 Excel 界面的组合使得可以轻松创建、修改和使用数据挖掘。
高级 (数据挖掘)
借助高级向导,可以使用 SQL Server Analysis Services 中的数据挖掘算法之一,基于 Excel 中存储的数据创建新的数据挖掘模型。
创建挖掘结构
“创建挖掘结构”向导可帮助你构建新的数据挖掘结构,该结构可作为多个挖掘模型的基础。 该向导提供一个选项,允许你预留一部分数据作为测试集使用,以便你可以依据一致的测试标准评估使用相同数据的所有模型。
将模型添加到结构
通过“向结构添加模型”向导,可以选择现有的数据挖掘结构并为其创建新的数据挖掘模型。 可以将多个挖掘模型添加到结构、更改参数或选择不同的数据挖掘算法,以及自定义输出。
分析关键影响因素 (分析)
选择感兴趣的列或输出值,然后算法分析所有输入数据,以确定对目标影响最大的因素。 (可选)可以创建一个报表来比较任何两个值,以便查看影响因素的变化方式。
分析关键影响因素工具使用 Microsoft Naïve Bayes 算法。
数据挖掘助理
关联向导生成一个模型,用于识别多个交易中出现的项目之间的关联,例如在市场篮分析中。
分类 (数据挖掘)
分类向导生成一个分类模型,用于分析导致目标结果的因素。 可以将多个算法用于此向导,包括决策树、Naïve Bayes 和神经网络。
群集(数据挖掘)
群集向导生成一个聚类分析模型,用于检测共享类似特征的行组。 聚类分析(有时称为 分段)是一种无监督学习技术,在尝试了解新数据中的模式和分组时非常有用。
Microsoft聚类分析算法支持 K 平均值和期望最大化(EM)聚类分析的多个品种
类别识别(分析)
使用 “检测类别 ”工具可以添加任何数据集并应用聚类分析来查找数据的分组。 它可用于查找相似性和创建组以进一步分析。
“检测类别”工具使用Microsoft聚类分析算法。
估计(数据挖掘)
“估计”向导生成一个估计模型,该模型提取数据模式,并使用模式来预测连续数值、日期或时间值。 它使用Microsoft决策树算法。
从示例填充 (分析)
“ 从示例填充 ”工具可帮助你插入缺失值。 提供了一些缺失值的示例,该工具基于表中所有数据生成模式,然后根据数据中的模式建议新值。
“从示例填充”工具使用微软逻辑回归算法。
预测(分析)
预测工具采用随时间变化的数据,并预测未来值。
预测工具使用Microsoft时序算法。
预测 (数据挖掘)
预测向导生成一个预测模型,用于检测一系列单元格中的模式,然后预测其他值。
突出显示异常(分析)
突出显示异常工具分析数据表中的模式,并查找不符合模式的行和值。 然后,可以查看并更正它们,然后重新运行模型,或标记后续作的值。
突出显示异常工具使用Microsoft聚类分析算法。
预测计算器 (分析)
此工具创建一个模型,该模型分析导致目标结果的因素,然后根据这些模式派生的条件预测任何新输入的结果,它还会生成交互式决策工作表,以便轻松评分新输入。 还可以创建评分工作表的打印版本以供脱机使用。
预测计算器工具使用Microsoft逻辑回归算法。
场景:目标搜寻(分析)
在 “目标查找 ”工具中,指定目标值,该工具标识必须更改以达到该目标的基础因素。 例如,如果知道必须提高通话满意度 20%,则可以要求模型预测应更改的因素以实现该目标。
Goal Seek 工具使用Microsoft逻辑回归算法。
详情
情境:What-If 情境(分析)
What-If 分析工具与目标查找工具配合使用。 使用此工具,你输入了要更改的值,模型预测该更改是否足以达到所需的结果。 例如,你可能要求模型推断是否添加一个额外的呼叫运营商会增加客户满意度一点。
What-If 工具使用Microsoft逻辑回归算法。
购物篮分析 (分析)
购物篮分析工具创建经常一起购买的产品组,以确定可用于交叉销售或向上销售的模式。 它还根据相关产品捆绑包的价格和成本生成报告,以帮助做出决策。
还可以将此工具用于经常发生的事件、导致诊断的因素或任何其他潜在原因和结果集。
购物篮分析工具使用Microsoft关联算法。
另请参阅
浏览和清理数据
验证模型和使用用于预测的模型(适用于 Excel 的数据挖掘加载项)
部署和缩放挖掘模型(Excel 数据挖掘加载项)