第 1 课:创建市场篮挖掘结构

在本课中,你将创建一个挖掘结构,以预测客户倾向于同时购买的 Adventure Works Cycles 的具体产品。 如果不熟悉挖掘结构及其在数据挖掘中的作用,请参阅挖掘结构(Analysis Services - 数据挖掘)。

在本课中创建的关联挖掘结构支持基于 Microsoft关联算法添加挖掘模型。 在后面的课程中,你将使用挖掘模型来预测客户倾向于同时购买的产品类型,这称为市场篮分析。 例如,你可能会发现客户倾向于同时购买山地自行车、自行车轮胎和头盔。

在本课中,挖掘结构是使用嵌套表定义的。 使用嵌套表,因为结构定义的数据域包含在两个不同的源表中。 有关嵌套表的详细信息,请参阅嵌套表(Analysis Services - 数据挖掘)。

CREATE MINING STRUCTURE 语句

若要创建包含嵌套表的挖掘结构,请使用 CREATE MINING STRUCTURE (DMX) 语句。 语句中的代码可以分为以下部分:

  • 给结构命名

  • 定义键列

  • 定义挖掘列

  • 定义嵌套表列

下面是 CREATE MINING STRUCTURE 语句的通用示例:

CREATE MINING STRUCTURE [<Mining Structure Name>]  
(  
   <key column>,  
   <mining structure columns>,  
   <table columns>  
   (  <nested key column>,  
      <nested mining structure columns> )  
)  
  

代码的第一行定义结构的名称:

CREATE MINING STRUCTURE [Mining Structure Name]  

有关在 DMX 中命名对象的信息,请参阅标识符(DMX)。

代码的下一行定义挖掘结构的键列,该列唯一标识源数据中的实体:

<key column>  

代码的下一行用于定义挖掘列,这些挖掘列将由与挖掘结构关联的挖掘模型使用:

<mining structure columns>  

代码的下一行定义嵌套表列:

<table columns>  
(  <nested key column>,  
   <nested mining structure columns> )  

有关可以定义的挖掘结构列类型的信息,请参阅 挖掘结构列

注释

默认情况下,SQL Server Data Tools (SSDT) 为每个挖掘结构创建 30% 的保留数据集;但是,使用 DMX 创建挖掘结构时,必须根据需要手动添加保留数据集。

课程任务

在本课中,你将执行以下任务:

  • 创建新的空白查询

  • 更改查询以创建挖掘结构

  • 执行查询

创建查询

第一步是在 SQL Server Management Studio 中连接到 Analysis Services 实例并创建新的 DMX 查询。

在 SQL Server Management Studio 中创建新的 DMX 查询

  1. 打开 SQL Server Management Studio。

  2. 在“ 连接到服务器 ”对话框中,对于 “服务器类型”,选择 “Analysis Services”。 在 服务器名称中,键入 LocalHost或要连接到本课的 Analysis Services 实例的名称。 单击连接

  3. 对象资源管理器中,右键单击 Analysis Services 实例,指向 “新建查询”,然后单击 “DMX”。

    查询编辑器打开后,将包含一个新的空白查询。

更改查询

下一步是修改上述的 CREATE MINING STRUCTURE 语句,以创建购物篮挖掘结构。

自定义创建挖掘结构语句

  1. 在查询编辑器中,将 CREATE MINING STRUCTURE 语句的通用示例复制到空白查询中。

  2. 替换以下内容:

    [mining structure name]   
    

    替换为:

    [Market Basket]  
    
  3. 替换以下内容:

    <key column>  
    

    替换为:

    OrderNumber TEXT KEY  
    
  4. 替换以下内容:

    <table columns>  
    (  <nested key column>,  
       <nested mining structure columns> )  
    

    替换为:

    [Products] TABLE (  
        [Model] TEXT KEY  
    )  
    

    TEXT KEY 语言指定模型列是嵌套表的键列。

    完整的挖掘结构语句现在应如下所示:

    CREATE MINING STRUCTURE [Market Basket] (  
        OrderNumber TEXT KEY,  
        [Products] TABLE (  
            [Model] TEXT KEY  
        )  
    )  
    
  5. 在“ 文件 ”菜单上,单击“ 保存 DMXQuery1.dmx As”。

  6. 在“ 另存为 ”对话框中,浏览到相应的文件夹,并命名该文件 Market Basket Structure.dmx

执行查询

最后一步是执行查询。 创建并保存查询后,需要执行该查询(即需要运行语句),以便在服务器上创建挖掘结构。 有关在查询编辑器中执行查询的详细信息,请参阅数据库引擎查询编辑器(SQL Server Management Studio)。

执行查询

  • 在查询编辑器的工具栏上,单击“ 执行”。

    在语句完成执行后,查询的状态将显示在查询编辑器底部的 “消息 ”选项卡中。 消息应显示:

    Executing the query   
    Execution complete  
    

    服务器上现在存在名为 Market Basket 的新结构。

在下一课中,你将将挖掘模型添加到刚刚创建的市场篮挖掘结构。

下一课

第 2 课:向购物篮模型结构添加挖掘模型