可以通过五个基本步骤为 Analysis Services 数据挖掘模型创建准确性图表:
选择包含要比较的挖掘模型的挖掘结构。
选择要添加到图表的挖掘模型。
指定要用于生成图表的测试数据的源。
选择图表类型。
配置图表选项。
对于提升图、利润图和分类矩阵,这些基本步骤是相同的。 以下过程概述了为这些图表类型配置基本图表选项的步骤。 有关如何创建交叉验证报告的信息,请参阅 交叉验证报告中的度量值。
在准确性图表设计器中打开挖掘结构
在 SQL Server Data Tools(SSDT)中打开数据挖掘设计器。
在解决方案资源管理器中,双击包含挖掘模型或模型的结构。
单击“ 挖掘准确性图表 ”选项卡。
选择要包含在图表中的挖掘模型
在 SQL Server Data Tools (SSDT)中数据挖掘设计器的 “挖掘准确性图表 ”选项卡上,单击“ 输入选择 ”选项卡。
该列表显示当前结构中具有相同可预测属性的所有模型。
选择要包含在图表中的每个模型的 “显示”框 。
单击“ 可预测列名称 ”文本框,然后从列表中选择可预测列的名称。 将所有型号包含在一个图表中时,它们必须具有相同的可预测列。
如果比较两个模型和可预测列具有不同的值或不同的数据类型,请清除 Synchonize 预测列和值 框以强制比较。
注释
如果选择Synchronize预测列和值框,Analysis Services会分析模型的可预测列与测试数据中的数据,并尝试找到最佳匹配项。 因此,除非绝对有必要强制比较列,否则不要清除该框。
单击“ 预测值 ”文本框,然后从列表中选择一个值。 如果可预测列是连续数据类型,则必须在文本框中键入值。
有关详细信息,请参阅 “选择要用于测试挖掘模型的列”。
选择测试数据
在“挖掘准确性图表”选项卡的“输入选择”选项卡上,选择“选择用于准确性图表的数据集”组中的一个选项,以指定将用于生成图表的数据源。
如果您希望使用由挖掘结构测试用例和任何在创建模型期间应用的筛选器交集定义的事例子集,请选择“使用挖掘模型测试用例”选项。
选择选项“使用挖掘结构测试用例”,以使用完整的测试用例集,这些用例集已被定义为挖掘结构保留数据集的一部分。
选择此选项,如果要使用外部数据, 请指定其他数据集。 数据集必须可用作数据源视图。 单击“浏览”按钮,选择要用于准确性图表的数据表。 有关详细信息,请参阅 选择和映射模型测试数据。
如果使用外部数据集,可以选择筛选输入数据集。 有关详细信息,请参阅 “将筛选器应用于模型测试数据”。
注释
不能对模型测试用例或 “输入选择 ”选项卡上的挖掘结构测试用例创建筛选器。若要对挖掘模型创建筛选器,请修改模型的 Filter 属性。 有关详细信息,请参阅 将筛选器应用于挖掘模型。
配置图表设置并生成图表
在“ 挖掘准确性图表 ”选项卡中,单击要创建的图表的选项卡。
对于 提升图,请单击“ 提升图 ”选项卡。图表基于刚刚选择的模型、可预测属性和输入数据自动生成。
对于 分类矩阵,请单击“ 分类矩阵 ”选项卡。不需要其他设置;图表是根据所选的输入数据和模型自动生成的。
对于 利润图表,首先单击“ 提升图 ”选项卡。然后,从 “图表类型 ”下拉列表中选择“ 利润”图表。
在 “利润图表设置” 对话框中输入以下设置。
人口数
创建提升图时,您要使用的数据集中包含的案例数量。该模型始终按概率递减顺序选择事例;也就是说,如果你正在评估潜在客户,并且你选择的数字只代表客户数据库中的一半记录,则模型将衡量最适合模型的事例子集的准确性。
这是因为,当你使用模型生成邮件或创建市场活动时,你将使用与每个案例关联的预测概率来仅针对具有最高概率的客户做出积极响应。
固定成本
与业务问题关联的固定成本。如果这是针对目标邮件解决方案,固定成本可能表示打印机设置费用,该费用涵盖准备促销邮件的初始成本。
此费用一次性适用于整个目标人群。
个人成本
除了固定成本外,可与每次客户联系相关联的额外成本。 例如,可以输入促销邮件的邮资成本或拨打电话的费用。对于整个目标总体,此成本必须相同。 每个值乘以目标事例数。
每个人收入
与每个成功销售相关联的收入量。
另请参阅
增益图(Analysis Services - 数据挖掘)
分类矩阵 (Analysis Services - 数据挖掘)