第 2 课:将挖掘模型添加到购物篮挖掘结构中

在本课中,你将向第 1 课中创建的市场篮挖掘结构添加两个挖掘模型 :创建市场篮挖掘结构。 这些挖掘模型允许你创建预测。

若要预测客户倾向于同时购买的产品类型,你将使用 Microsoft关联算法MINIMUM_PROBABILTY 参数的两个不同的值创建两个挖掘模型。

MINIMUM_PROBABILTY 是一个Microsoft关联算法参数,它通过指定规则必须具有的最小概率来帮助确定挖掘模型将包含的规则数。 例如,将此值设置为 0.4 指定仅当规则描述的产品组合至少有 40% 的发生概率时,才能生成规则。

你将在后面的课程中查看更改 MINIMUM_PROBABILTY 参数的效果。

修改数据挖掘结构语句

若要将包含嵌套表的挖掘模型添加到挖掘结构,请使用 ALTER MINING STRUCTURE (DMX) 语句。 语句中的代码可以分为以下部分:

  • 确定挖掘结构

  • 命名挖掘模型

  • 定义关键列

  • 定义输入列和可预测列

  • 定义嵌套表列

  • 标识算法和参数更改

下面是将挖掘模型添加到包含嵌套表列的结构的 ALTER MINING STRUCTURE 语句的泛型示例:

ALTER MINING STRUCTURE [<Mining Structure Name>]  
ADD MINING MODEL [<Mining Model Name>]  
(  
    [<key column>],  
    <mining model column> <usage>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
) USING <algorithm>( <algorithm parameters> )  

代码的第一行用于标识即将添加挖掘模型的现有挖掘结构。

ALTER MINING STRUCTURE [<mining structure name>]  

代码的下一行将为即将添加到挖掘结构的挖掘模型命名:

ADD MINING MODEL [<mining model name>]  

有关在数据挖掘扩展插件(DMX)中命名对象的信息,请参阅标识符(DMX)。

代码接下来的几行定义了将在挖掘模型中使用的挖掘结构的列:

[<key column>],  
<mining model columns> <usage>,  

只能使用挖掘结构中已存在的列。

挖掘模型列列表中的第一列必须是挖掘结构中的键列。 但是,不必在键列后键入 KEY 以指定用法。 这是因为在创建挖掘结构时,已将列定义为键。

其余行指定新挖掘模型中列的用法。 可以使用以下语法指定挖掘模型中的列用于预测:

<column name> PREDICT,  

如果未指定使用情况,则无需在列表中包括数据挖掘结构列。 引用的数据挖掘结构使用的所有列都将自动可供基于该结构的挖掘模型使用。 但是,除非指定用法,否则模型不会使用列进行训练。

代码中的最后一行定义将用于生成挖掘模型的算法和算法参数。

) USING <algorithm>( <algorithm parameters> )  

课程任务

在本课中,你将执行以下任务:

  • 使用默认概率将关联挖掘模型添加到结构

  • 使用修改后的概率将关联挖掘模型添加到结构

使用默认的 MINIMUM_PROBABILITY 向结构添加关联挖掘模型

第一个任务是使用MINIMUM_PROBABILITY的默认值,基于Microsoft关联算法向市场篮子挖掘结构添加新的挖掘模型。

添加关联挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 “DMX”。

    查询编辑器打开后,将包含一个新的空白查询。

    注释

    若要针对特定 Analysis Services 数据库创建 DMX 查询,请右键单击数据库而不是实例。

  2. 将语句的 ALTER MINING STRUCTURE 泛型示例复制到空白查询中。

  3. 替换以下内容:

    <mining structure name>   
    

    替换为:

    [Market Basket]  
    
  4. 替换以下内容:

    <mining model name>   
    

    替换为:

    [Default Association]  
    
  5. 替换以下内容:

    [<key column>],  
    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    替换为:

    OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    

    在这种情况下,该 [Products] 表已被指定为可预测列. 。此外, [Model] 该列包含在嵌套表列列表中,因为它是嵌套表的关键列。

    注释

    请记住,嵌套密钥与事例键不同。 案例键是案例的唯一标识符,而嵌套键是要建模的属性。

  6. 替换以下内容:

    USING <algorithm>( <algorithm parameters> )  
    

    替换为:

    Using Microsoft_Association_Rules  
    

    生成的语句现在应如下所示:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Default Association]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    Using Microsoft_Association_Rules  
    
  7. 在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。

  8. 在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件 Default_Association_Model.dmx

  9. 在工具栏上,单击“ 执行 ”按钮。

将关联挖掘模型添加到结构中,并更改默认的MINIMUM_PROBABILITY值。

下一个任务是基于Microsoft关联算法将新的挖掘模型添加到市场篮挖掘结构,并将MINIMUM_PROBABILITY的默认值更改为 0.01。 更改参数将导致Microsoft关联算法创建更多规则。

添加关联挖掘模型

  1. 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 “DMX”。

    查询编辑器打开后,将包含一个新的空白查询。

  2. 将语句的 ALTER MINING STRUCTURE 泛型示例复制到空白查询中。

  3. 替换以下内容:

    <mining structure name>   
    

    替换为:

    Market Basket  
    
  4. 替换以下内容:

    <mining model name>   
    

    替换为:

    [Modified Association]  
    
  5. 替换以下内容:

    <mining model columns>,  
    <table columns>  
    (  [<nested key column>],  
       <nested mining model columns> )  
    

    替换为:

    OrderNumber,  
    [Products] PREDICT (  
            [Model]  
        )  
    

    在这种情况下,表 [Products] 已指定为可预测列。 此外, [MODEL] 该列包含在列表中,因为它是嵌套表中的关键列。

  6. 替换以下内容:

    USING <algorithm>( <algorithm parameters> )  
    

    替换为:

    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    

    生成的语句现在应如下所示:

    ALTER MINING STRUCTURE [Market Basket]  
    ADD MINING MODEL [Modified Assocation]  
    (  
        OrderNumber,  
        [Products] PREDICT (  
            [Model]  
        )  
    )  
    USING Microsoft_Association_Rules (Minimum_Probability = 0.1)  
    
  7. 在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。

  8. 在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件 Modified Association_Model.dmx

  9. 在工具栏上,单击“ 执行 ”按钮。

在下一课中,你将处理购物篮挖掘结构及其关联的挖掘模型。

下一课

第 3 课:处理购物篮数据挖掘结构