共用方式為


第1課:建立自行車買家資料挖掘結構

在這一課,您將建立採礦結構,讓您預測 Adventure Works Cycles 的潛在客戶是否會購買自行車。 如果您不熟悉採礦結構及其在數據採礦中的角色,請參閱採礦結構(Analysis Services - 數據採礦)。

您將在此課程中建立的 Bike Buyer 資料採礦結構支持根據 Microsoft 群集演算法和 Microsoft 決策樹演算法來新增資料挖掘模型。 在稍後的課程中,您將使用叢集採礦模型來探索客戶可分組的不同方式,並使用判定樹採礦模型來預測潛在客戶是否會購買自行車。

CREATE MINING STRUCTURE 敘述

若要建立採礦結構,您可以使用 CREATE MINING STRUCTURE (DMX) 語句。 語句中的程式代碼可以分成下列部分:

  • 為結構命名。

  • 定義關鍵欄。

  • 定義採礦欄位。

  • 定義選擇性的測試數據集。

以下是 CREATE MINING STRUCTURE 語句的泛型範例:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

程式代碼的第一行會定義 結構的名稱:

CREATE MINING STRUCTURE [<mining structure name>]  

如需在數據採礦延伸模組中命名對象的相關信息,請參閱標識碼(DMX)。

程式碼的下一行會定義採礦結構的鍵欄,用於唯一識別來源數據中的實體:

<key column>,  

在您將建立的採礦結構中,客戶標識碼CustomerKey定義了來源數據中的實體。

程序代碼的下一行是用來定義採礦數據行,這些採礦數據行將由與採礦結構相關聯的採礦模型使用:

<mining structure columns>  

您可以在<採礦結構資料行>中使用 DISCRETIZE 函式,透過下列語法將連續資料行離散化:

DISCRETIZE(<method>,<number of buckets>)

如需有關離散化欄位的詳細資訊,請參閱離散化方法(數據採礦)。 如需您可以定義之採礦結構數據行類型的詳細資訊,請參閱 採礦結構數據行

程式代碼的最後一行會在採礦結構中定義選擇性分割區:

WITH HOLDOUT (<holdout specifier>)  

您可以指定要用於測試與結構相關的採礦模型的某些部分,而其餘的數據則用於定型模型。 根據預設,Analysis Services 會建立測試數據集,其中包含 30% 的所有案例數據。 您將新增一項規格:測試數據集應包含案例的30%,最多不超過1000個案例。 如果 30% 的案例小於 1000,測試數據集會包含較小的數量。

課程任務

您將在此課程中執行下列工作:

  • 建立新的空白查詢。

  • 改變查詢以建立採礦結構。

  • 執行查詢。

建立查詢

第一個步驟是在 SQL Server Management Studio 中連線到 Analysis Services 實例,並在 SQL Server Management Studio 中建立新的 DMX 查詢。

在 SQL Server Management Studio 中建立新的 DMX 查詢

  1. 開啟 SQL Server Management Studio。

  2. 在 [ 連接到伺服器 ] 對話框中,針對 [ 伺服器類型],選取 [ Analysis Services]。 在 [伺服器名稱] 中,輸入 LocalHost,或輸入您要為此課程連線之 Analysis Services 實例的名稱。 按一下 [ 連接]。

  3. 物件瀏覽器中,右鍵單擊 Analysis Services 實例,指向新增查詢,然後單擊DMX以開啟查詢編輯器和新的空白查詢。

更改查詢

下一個步驟是修改上述 CREATE MINING STRUCTURE 語句,以建立 Bike Buyer 採礦結構。

若要自訂 CREATE MINING STRUCTURE 語句

  1. 在查詢編輯器中,將 CREATE MINING STRUCTURE 語句的泛型範例複製到空白查詢中。

  2. 取代下列項目:

    [<mining structure>]   
    

    取代為:

    [Bike Buyer]  
    
  3. 取代下列項目:

    <key column>   
    

    取代為:

    CustomerKey LONG KEY  
    
  4. 取代下列項目:

    <mining structure columns>   
    

    取代為:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. 取代下列項目:

    WITH HOLDOUT (holdout specifier>)  
    

    取代為:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    完整的採礦結構語句現在應該如下所示:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
    
  6. 在 [檔案] 功能表上,按一下 [另存新檔 DMXQuery1.dmx]。

  7. 在 [ 另存新檔 ] 對話框中,瀏覽至適當的資料夾,並將檔案 Bike Buyer Structure.dmx命名為 。

執行查詢

最後一個步驟是執行查詢。 建立並儲存查詢之後,必須執行查詢。 也就是說,必須執行 語句,才能在伺服器上建立採礦結構。 如需在查詢編輯器中執行查詢的詳細資訊,請參閱 Database Engine 查詢編輯器 (SQL Server Management Studio)

若要執行查詢

  1. 在 [查詢編輯器] 的工具列上,按兩下 [ 執行]。

    查詢的狀態會顯示在語句完成執行之後,查詢編輯器底部的 [ 訊息 ] 索引標籤中。 訊息應該會顯示:

    Executing the query   
    Execution complete  
    

    名為 Bike Buyer 的新結構現在存在於伺服器上。

在下一課,您會將採礦模型新增至您剛才建立的結構。

下一課

第 2 課:將採礦模型新增至 Bike Buyer 採礦結構