“ 估计 ”向导可帮助你创建估计模型。 估算模型从数据中提取模式,并使用模式预测影响结果的因素。
估算用于预测数值结果。 例如,如果目标列包含学校的毕业率,并且毕业率表示为百分比,则可以分析可能增加或降低毕业率的因素,例如每个学校的学生数、学生教师比率和教师数。
使用“估计数据向导”
在 “数据挖掘 ”功能区上,单击“ 估计”。
在 “选择源数据 ”对话框中,选择要使用的源数据。 可以在 Excel 表、Excel 数据范围或 外部数据源中使用数据。
如果使用外部数据源,可以创建自定义视图或查询并将其另存为 Analysis Services 数据源。
在“ 估计 ”对话框中,选择要 分析的列。
目标列必须包含连续数值数据。
通过选中“输入列”复选框来选择要用作输入的列。
这些列将用于创建模式。 应从分析中排除任何不太可能有帮助的列,例如 ID 号或包含不相关数据的列。
“ 估计 ”向导选择数据集的最佳算法。 但是,可以单击“ 参数 ”以打开“ 算法参数 ”对话框并设置高级选项。
如果您的数据是数值型,并且可以使用Microsoft线性回归方法,那么您可以选中回归器框,以便为任何已知(或强烈怀疑)与可预测值相关的数值列进行选择。
然后,该算法将测试该列中的值,以确定它们是否影响结果。 如果不确定,请单击 “建议 ”,算法将测试所有列,并自动检测用作回归器的最佳值。
注释
创建估计需要回归器。 向导始终根据数据的初始传递来建议最佳回归器。 因此,如果不确定,最好接受建议的选择。
在 “将数据拆分为定型和测试集 ”页上,指定是否要创建用于测试的数据的一小部分。
在 “完成 ”页上,提供新挖掘结构和挖掘模式的名称,或接受提供的默认名称。
设置使用模型的选项。
选择 “浏览 ”以立即在查看器中打开模型。
此图形查看器显示依赖项网络图和算法生成的决策树。 通过浏览此信息,可以更好地了解导致估计值的因素。
选择 “启用向下钻取” ,让用户能够查看基础数据。
仅当使用决策树或线性回归算法时,此选项才可用。
使用临时模型。 如果选择此选项,模型将不会保存到服务器。 关闭 Excel 时会删除临时模型。
有关估计模型的详细信息
“估计”向导支持使用以下任何算法:
Microsoft决策树算法
Microsoft线性回归算法
Microsoft逻辑回归算法
Microsoft神经网络算法
在 “算法参数 ”对话框中,可以根据所选算法设置其他高级选项。 有关每个算法的选项的信息,请参阅 SQL Server 联机丛书中的以下主题:
要求
若要使用“估计数据向导”,必须连接到 Analysis Services 数据库。
有关如何创建连接的信息,请参阅“连接到源数据”(Excel 数据挖掘客户端)。
若要使用估算算法,您尝试预测的结果必须表示为数值,例如货币、销售金额、日期或时间。