预测工具可帮助你根据 Excel 数据表或其他数据源中的数据进行预测,还可以选择查看与每个预测值关联的概率。 例如,如果数据包含日期列和显示每月每一天总销售额的列,则可以预测将来的销售额。 您还可以指定预测的数量。 例如,可以预测五天或三十天。
工具完成后,它会将新的预测追加到源数据表的末尾,并突出显示新值。 不追加新的时序值;这允许你首先查看预测。
该工具还会创建一个名为 Forecasting Report 的新工作表。 此工作表报告向导是否已成功创建预测。 新工作表还包含显示历史趋势的折线图。
扩展时序以包含新的预测时,预测值将添加到折线图中。 历史值显示为实线,预测显示为虚线。
使用预测工具
打开包含可预测数值数据的 Excel 表。
单击“分析”选项卡上的“预测”。
指定要预测的列。 该工具会自动选择具有可预测数据类型的数据中的列,即连续数值数据。 如果列包含许多 null 或零值,则该工具可能不会选择包含连续数值数据的列,因为缺少的数据可能会影响结果。 如果发生这种情况,可以使用 Relabel(SQL Server 数据挖掘加载项) 工具修复数据。
指定包含日期、时间或其他序列标识符的列。 如果选择选项 <不带时间戳>,工具将根据源数据中的行序列创建序列。
指定要做出的预测数。
(可选)向算法提供一个提示,说明你希望数据是每周、每月还是在其他时间段内重复。 如果数据不适合任何给定模式,或者如果不知道任何模式,请选择“<自动>检测”以让工具查找重复时间段。
该向导将预测添加到源表,并在新工作表中创建预测报表。
若要将新值添加到预测图,请扩展时序以包含预测的值。
要求
预测的列必须包含连续数值数据,例如货币或其他数字。
如果可能,数据还应包含包含一系列时间或日期的列。 可以使用数字系列(1,2,3....),而不是日期和时间数据。 但是,序列列中的值必须是唯一的。 如果 预测 工具在序列列中找到重复值,则会发生错误。
无法使用 预测 工具预测日期。 尽管可能不会发生错误,但此算法不设计为将日期用作可预测值。
了解时间戳
必须标识要用作 时间戳的列。 时间戳有两个用途。 首先,它唯一标识时间序列中的一个值。 例如,如果要每天跟踪销售额,则每天只应有一个销售值。 日历日期可用作时间戳。 其次,时间戳列指示用于进行预测的单位。 如果要跟踪每日销售额,预测也将以天为单位。
如果数据不包含日期或时间列,该工具将自动创建名为_RowIndex的临时序列键。 该键将基于数据集中的行的顺序。
指定预测数时,输入一个指示步骤数的整数。 这些步骤的单位取决于数据中时间和日期序列中使用的单位。 如果您的数据按月份列出销售结果,那么预测将是针对连续几个月的。 除非更改源数据,否则无法更改时间单位。
了解周期性
预测基于一段时间内的重复模式。 因此,Microsoft时序算法执行计算以确定具有最强模式的时间段。 周期 性是指这些时间段。
时序可以包含许多潜在的模式。 如果确定数据包含特定模式,则可以通过向算法提供提示来提高预测质量。
例如,如果预期数据每周重复,可以选择“每周”以指示算法应查找每周模式。 但是,如果未找到强每周模式,该算法将忽略提示。
了解预测报告
在此图中,数据表中的历史值显示为深线。 预测值显示为虚线。 可以单击该行上的某个点以查看预测的值。
注释
如果在图形中看不到预测值的时间轴上的标签,请打开包含预测值的工作表,并使用 Excel 中的 Fill, Series 函数扩展时间戳列以包含预测值。
在某些情况下,预测可能没有请求的那么多的时间切片。 这通常意味着数据不足以让算法预测到未来。 预测工具将仅进行满足最小概率阈值的预测。
相关工具
Excel 数据挖掘客户端是一个单独的加载项,它提供更高级的数据挖掘功能,还包含用于预测的向导。
“预测”工具(在 Excel 的表分析工具中)和“预测”向导(在 Excel 的数据挖掘客户端中)都使用Microsoft时序算法。
预测工具更易于使用,因为它会自动配置算法以使用最适合数据的设置。
Excel 数据挖掘客户端中的 “预测 ”向导提供自定义参数的功能。
有关预测向导的详细信息,请参阅预测向导(Excel 的数据挖掘外接程序)。 有关用于预测的算法的详细信息,请参阅 SQL Server 联机丛书中的主题“Microsoft时序算法”。