估算向导(Excel数据挖掘加载项)

数据挖掘功能区中的估计向导

估计 ”向导可帮助你创建估计模型。 估算模型从数据中提取模式,并使用模式预测影响结果的因素。

估算用于预测数值结果。 例如,如果目标列包含学校的毕业率,并且毕业率表示为百分比,则可以分析可能增加或降低毕业率的因素,例如每个学校的学生数、学生教师比率和教师数。

使用“估计数据向导”

  1. “数据挖掘 ”功能区上,单击“ 估计”。

  2. “选择源数据 ”对话框中,选择要使用的源数据。 可以在 Excel 、Excel 数据范围外部数据源中使用数据。

    如果使用外部数据源,可以创建自定义视图或查询并将其另存为 Analysis Services 数据源。

  3. 在“ 估计 ”对话框中,选择要 分析的列

    目标列必须包含连续数值数据。

  4. 通过选中“输入列”复选框来选择要用作输入的列。

    这些列将用于创建模式。 应从分析中排除任何不太可能有帮助的列,例如 ID 号或包含不相关数据的列。

  5. 估计 ”向导选择数据集的最佳算法。 但是,可以单击“ 参数 ”以打开“ 算法参数 ”对话框并设置高级选项。

  6. 如果您的数据是数值型,并且可以使用Microsoft线性回归方法,那么您可以选中回归器框,以便为任何已知(或强烈怀疑)与可预测值相关的数值列进行选择。

    然后,该算法将测试该列中的值,以确定它们是否影响结果。 如果不确定,请单击 “建议 ”,算法将测试所有列,并自动检测用作回归器的最佳值。

    注释

    创建估计需要回归器。 向导始终根据数据的初始传递来建议最佳回归器。 因此,如果不确定,最好接受建议的选择。

  7. “将数据拆分为定型和测试集 ”页上,指定是否要创建用于测试的数据的一小部分。

  8. “完成 ”页上,提供新挖掘结构和挖掘模式的名称,或接受提供的默认名称。

  9. 设置使用模型的选项。

    • 选择 “浏览 ”以立即在查看器中打开模型。

      此图形查看器显示依赖项网络图和算法生成的决策树。 通过浏览此信息,可以更好地了解导致估计值的因素。

    • 选择 “启用向下钻取” ,让用户能够查看基础数据。

      仅当使用决策树或线性回归算法时,此选项才可用。

    • 使用临时模型。 如果选择此选项,模型将不会保存到服务器。 关闭 Excel 时会删除临时模型。

有关估计模型的详细信息

“估计”向导支持使用以下任何算法:

  • Microsoft决策树算法

  • Microsoft线性回归算法

  • Microsoft逻辑回归算法

  • Microsoft神经网络算法

“算法参数 ”对话框中,可以根据所选算法设置其他高级选项。 有关每个算法的选项的信息,请参阅 SQL Server 联机丛书中的以下主题:

Microsoft决策树算法技术参考

Microsoft线性回归算法技术参考

Microsoft逻辑回归算法技术参考

Microsoft神经网络算法技术参考

要求

若要使用“估计数据向导”,必须连接到 Analysis Services 数据库。

有关如何创建连接的信息,请参阅“连接到源数据”(Excel 数据挖掘客户端)。

若要使用估算算法,您尝试预测的结果必须表示为数值,例如货币、销售金额、日期或时间。

另请参阅

创建数据挖掘模型
决策树图演练(数据挖掘加载项)