Excel 数据挖掘客户端 (SQL Server 数据挖掘加载项)

Excel 数据挖掘客户端是一组工具,可用于执行常见的数据挖掘任务,从数据清理到模型生成和预测查询。 可以使用 Excel 表或区域中的数据,或者访问外部数据源。

DM

  • 处理数据

    将数据加载到 Excel 中、清理数据、检查离群值以及创建统计摘要。 还可以使用外部数据执行不同类型的采样、分析数据和测试模型。 数据挖掘客户端是在没有复杂脚本或 ETL 进程的情况下为分析准备数据的最简单方法。

  • 生成模型和分析

    这些工具为已知的经验测试的数据挖掘算法(包括聚类分析(K-means 和 EM)、关联分析、时序分析和决策树提供向导接口。 通过每个向导的高级建模选项,可以选择不同的算法,例如 Naïve Bayes 或神经网络,并自定义群集种子或初始采样大小等行为。

    所有数据挖掘算法都托管在 Analysis Services 实例中,使你能够更有能力构建复杂的模型。

  • 测试、查询和验证模型

    数据挖掘客户端提供用于测试模型的行业标准工具,其中包括提升图和交叉验证。 提供的向导可以轻松测试数据集的有效性及其准确性。 查询向导将生成查询以使用模型进行预测和评分。

  • 查看模型

    大多数工具生成的图表可以直接保存到 Excel。 使用 Excel 中的浏览模型(SQL Server 数据挖掘外接程序) 工具浏览模型。

  • 管理、记录和部署

    Excel 数据挖掘客户端维护与服务器的活动连接,因此可以将数据挖掘模型保存到服务器、用于进一步测试或部署到生产服务器,以便提高可伸缩性。

与数据协作

数据准备组包含以下向导,可帮助你查看和清理数据,以准备数据挖掘任务。 大多数向导工具还允许您将数据分为训练集和测试集。

浏览数据(SQL Server 数据挖掘加载项)
对于生成和存储模型,加载项支持以下数据连接:

  • 连接到 Analysis Services 服务器,用于存储和处理模型。

  • 与外部数据源的可选连接。 可以使用可定义为 Analysis Services 数据源的任何类型的数据来生成模型,也可以仅使用 Excel 中的数据。

浏览数据(SQL Server 数据挖掘加载项)
“浏览数据”向导通过为所选列逐个绘制分布和数值,帮助你理解数据表中的数据类型和数量。

示例数据 (SQL Server 数据挖掘加载项)
为训练和测试模型创建正确的数据类型是数据挖掘的一个重要部分,但如果没有合适的工具,就可能很繁琐。 示例数据向导可以轻松地将用于模型的数据划分为两个组,一个用于生成模型,一个用于测试模型。 可以使用随机采样或过度采样。

预测计算器 (Excel 表分析工具)
“删除离群值”指导工具提供多个工具来识别和适当处理离群值。 它显示值分布以及离群值与其他数据的关系,并允许你决定是删除或更改离群值。

预测计算器 (Excel 表分析工具)
Relabel 向导可帮助你为数据创建新标签,以便更轻松地理解分析结果。 例如,可以重命名具有更具描述性名称的数据范围,也可以从列表中选择具有代表性的值。

生成模型和分析

工具栏的 “数据建模 ”部分中的选项使你可以从数据派生模式;根据属性对数据行进行分组,或浏览关联。 此工具功能区中的向导基于 Analysis Services 中提供的强大数据挖掘算法。 与 Excel 表分析工具中的类似工具不同,这些向导允许自定义算法的行为并使用各种数据源。

分类向导 (Excel 的数据挖掘加载项)
分类向导可帮助你基于 Excel 表、Excel 范围或外部数据源中的现有数据生成分类模型。 分类模型提取数据中的模式,这些模式指示相似性,并帮助你根据值的分组进行预测。 例如,分类模型可用于根据收入或支出模式预测风险。

分类向导支持使用这些Microsoft数据挖掘算法:决策树算法、逻辑回归、天真贝叶斯、神经网络。

估计向导 (Excel 的数据挖掘加载项)
估计 ”向导可帮助你创建估计模型。 估算模型从数据中提取模式,并使用模式来预测数字结果,例如货币、销售量、日期或时间。

“估计”向导使用这些Microsoft数据挖掘算法:决策树、线性回归、逻辑回归和神经网络。

分析关键影响因素(Excel 表分析工具)
群集向导可帮助你生成聚类分析模型。 聚类分析模型检测共享类似特征的行组。 此向导可用于浏览所有类型的数据中的模式。

群集向导使用Microsoft聚类分析算法,其中包括 K 平均值和 EM。

关联向导 (Excel 数据挖掘客户端)
“关联”向导可帮助你使用Microsoft关联规则算法创建数据挖掘模型,该算法可检测经常发生的项目或事件。 此类关联模型对于提出建议特别有用。

Associate向导使用Microsoft关联规则算法。

预测向导 (Excel 的数据挖掘加载项)
预测 ”向导可帮助你预测时序中的值。 通常,在预测中使用的数据包含某种时序(日期戳或某些序列 ID),并使用它来派生用于预测未来值的模式。

预测向导使用Microsoft时序算法。

高级建模 (Excel 数据挖掘加载项)
已熟悉数据挖掘? 可以使用 高级 数据建模选项,使用其他工具和向导中不包含的自定义项创建自定义数据结构和生成模型。

测试、查询和验证模型

使用 准确性和验证 工具栏上的向导使用行业标准测试来验证模型的准确性,并评估用于创建模型的数据集的可行性。

分析关键影响因素(Excel 表分析工具)
通过生成提升图或散点图来评估数据挖掘模型的性能。

分类矩阵 (SQL Server 数据挖掘加载项)
通过创建一个图表来汇总模型的准确和不准确的预测,帮助你评估分类模型的性能。

利润图表 (SQL Server 数据挖掘加载项)
通过绘制预测的准确性以及基于预测采取措施的成本和好处,帮助你了解数据挖掘模型的影响。

交叉验证 (SQL Server 数据挖掘加载项)
创建一个报表,该报表汇总了数据集的多个子集的模型准确性,以便确定模型的稳定性。

还可以使用 Excel 表中的数据作为针对存储在服务器上的挖掘模型的预测查询的输入。

查询 (SQL Server 数据挖掘加载项)
查询向导可帮助你针对现有数据挖掘模型创建预测。

高级数据挖掘查询编辑器
对于高级用户,此工具提供 DMX 的拖放界面。 可以轻松创建预测查询或新模型,而无需担心语法。

查看模型

你创建的模型会自动打开以供浏览。 但是,还可以浏览服务器上的模型并生成新的可视化效果。 使用 Visio 形状 将模型关系图导出到可自定义的画布。

在 Excel 中浏览模型 (SQL Server 数据挖掘加载项)
使用自定义为每种模型的交互式图形查看已创建的模型。

记录挖掘模型(Excel 的数据挖掘加载项)
此向导创建报告,用于提供有关模型的数据集和元数据的统计摘要,以帮助调查和解释。

管理、记录和部署

这些工具可帮助你连接到数据挖掘服务器,以及管理和导出模型,以及监视数据挖掘活动。

管理模型(SQL Server 数据挖掘加载项)
如果你有必要的权限,则可以在不离开 Excel 的情况下删除修改、重命名或处理现有挖掘模型和结构。

跟踪 (Excel 数据挖掘客户端)
单击“ 跟踪 ”以查看 Excel 客户端与 SQL Server 服务器之间交互的持续捕获。 所有活动都存储为 DMX 或 XMLA 语句,以便可以对数据挖掘会话进行故障排除,或保存信息以供以后使用。

连接到数据挖掘服务器
若要将 Excel 用作数据挖掘的客户端,必须建立与 Analysis Services 实例的连接。 该连接提供对 Analysis Services 引擎的访问权限。 如果具有权限,则连接还允许存储已发现的任何模式,并修改现有数据挖掘对象。

“连接”工具栏提供用于管理与 Analysis Services 实例的连接的向导。 必须定义与 Analysis Services 实例的连接才能使用数据挖掘工具和算法。 可以在安装外接程序时创建连接,也可以稍后添加连接。

准备开始
单击“ 入门 ”按钮启动配置向导,引导你完成创建与 Analysis Services 实例的连接的过程,并获取执行数据挖掘所需的权限。

帮助
帮助 ”下拉菜单提供联机帮助、网站和配置向导的链接,可帮助你完成设置并开始数据挖掘。

“帮助”页还链接到在线资源,包括加载项的帮助,以及其他视频、演示和示例。

另请参阅

适用于 Excel 的表分析工具
Visio 数据挖掘关系图疑难解答 (SQL Server 数据挖掘加载项)