记录数据挖掘模型(用于 Excel 的数据挖掘插件)

“文档模型”按钮、“数据挖掘”功能区

文档模型向导创建一个报表,该报表提供有关已创建的挖掘模型的有用信息。 通过记录所创建的模型,可以跟踪用于生成模型的数据源、获取有关处理模型的时间的其他信息,以及跟踪影响模型结果的参数更改。

使用文档模型向导

  1. 单击“ 数据挖掘 ”选项卡。

  2. “模型使用 ”组中,单击“ 文档模型”。

  3. “选择模型 ”对话框中,选择要报告的模型,然后单击“ 下一步”。 必须针对要记录的每个模型单独运行 文档模型 向导。

  4. “选择文档详细信息 ”对话框中,选择以下两个选项之一: 完成信息摘要信息

  5. 单击“完成”。

  6. 向导会自动创建包含指定报表的新工作表,标题为 “模型文档

了解报表

创建记录数据挖掘模型的报表时,可以创建一个摘要,其中包含包含模型名称和说明的基本信息,或包含有关挖掘模型的基础结构和高级信息的完整报表。

根据用于创建模型的算法,提供了不同类型的信息。 例如,在关联模型中,你更有兴趣了解生成的项集和规则数。 对于聚类分析模型,聚类数更有趣。

下表列出了每个选项的报表中提供的选项和信息。

注释

默认情况下,报表中的列设置为特定大小。 因此,如果任何列名或值很长,它们可能不可见,或者可能在 Excel 中显示为 ### 。 若要使值可见,可以调整行的大小。 如果选择了单元格,则可以单击并拖动编辑栏右端的双箭头以显示完整的值或字符串。

摘要报告

元数据 模型名称

模型说明

算法名称

上次处理日期
模型结果 关联 项集计数

规则计数
集群 聚类数量

支持每个集群
决策树 树数

每个树中的节点数
线性回归 树数(始终为 1)

节点数(始终为 1)
Naïve Bayes 重要属性
神经网络 输入节点数

输出节点数

隐藏节点数
顺序聚类分析 群集数

完整报告

完整报表包含摘要报表中的所有内容,以及有关模型中使用的数据列和分析结果的详细信息:

元数据 模型元数据 算法参数和值
列元数据 列名称

用法

数据类型

内容类型

值(离散值列表或值范围)
模型统计信息 连续列 平均值

最小值

最大值

根平均平方误差

平均绝对误差

日志分数

回归公式(仅适用于线性回归模型)
离散列 通过计数

失败次数

日志分数

电梯

注释

可以记录 SQL Server Analysis Services 支持的任何模型类型。 因此,该表列出了无法使用表分析工具或使用数据挖掘客户端中的向导创建的一些模型类型。 但是,可以使用 高级数据挖掘查询编辑器创建所有模型类型。 有关详细信息,请参阅查询(SQL Server 数据挖掘外接程序)。

另请参阅

部署和缩放挖掘模型(Excel 数据挖掘加载项)