在這一課,您將建立採礦結構,讓您預測 Adventure Works Cycles 的潛在客戶是否會購買自行車。 如果您不熟悉採礦結構及其在數據採礦中的角色,請參閱採礦結構(Analysis Services - 數據採礦)。
您將在此課程中建立的 Bike Buyer 資料採礦結構支持根據 Microsoft 群集演算法和 Microsoft 決策樹演算法來新增資料挖掘模型。 在稍後的課程中,您將使用叢集採礦模型來探索客戶可分組的不同方式,並使用判定樹採礦模型來預測潛在客戶是否會購買自行車。
CREATE MINING STRUCTURE 敘述
若要建立採礦結構,您可以使用 CREATE MINING STRUCTURE (DMX) 語句。 語句中的程式代碼可以分成下列部分:
為結構命名。
定義關鍵欄。
定義採礦欄位。
定義選擇性的測試數據集。
以下是 CREATE MINING STRUCTURE 語句的泛型範例:
CREATE MINING STRUCTURE [<mining structure name>]
(
<key column>,
<mining structure columns>
)
WITH HOLDOUT (<holdout specifier>)
程式代碼的第一行會定義 結構的名稱:
CREATE MINING STRUCTURE [<mining structure name>]
如需在數據採礦延伸模組中命名對象的相關信息,請參閱標識碼(DMX)。
程式碼的下一行會定義採礦結構的鍵欄,用於唯一識別來源數據中的實體:
<key column>,
在您將建立的採礦結構中,客戶標識碼CustomerKey定義了來源數據中的實體。
程序代碼的下一行是用來定義採礦數據行,這些採礦數據行將由與採礦結構相關聯的採礦模型使用:
<mining structure columns>
您可以在<採礦結構資料行>中使用 DISCRETIZE 函式,透過下列語法將連續資料行離散化:
DISCRETIZE(<method>,<number of buckets>)
如需有關離散化欄位的詳細資訊,請參閱離散化方法(數據採礦)。 如需您可以定義之採礦結構數據行類型的詳細資訊,請參閱 採礦結構數據行。
程式代碼的最後一行會在採礦結構中定義選擇性分割區:
WITH HOLDOUT (<holdout specifier>)
您可以指定要用於測試與結構相關的採礦模型的某些部分,而其餘的數據則用於定型模型。 根據預設,Analysis Services 會建立測試數據集,其中包含 30% 的所有案例數據。 您將新增一項規格:測試數據集應包含案例的30%,最多不超過1000個案例。 如果 30% 的案例小於 1000,測試數據集會包含較小的數量。
課程任務
您將在此課程中執行下列工作:
建立新的空白查詢。
改變查詢以建立採礦結構。
執行查詢。
建立查詢
第一個步驟是在 SQL Server Management Studio 中連線到 Analysis Services 實例,並在 SQL Server Management Studio 中建立新的 DMX 查詢。
在 SQL Server Management Studio 中建立新的 DMX 查詢
開啟 SQL Server Management Studio。
在 [ 連接到伺服器 ] 對話框中,針對 [ 伺服器類型],選取 [ Analysis Services]。 在 [伺服器名稱] 中,輸入
LocalHost,或輸入您要為此課程連線之 Analysis Services 實例的名稱。 按一下 [ 連接]。在物件瀏覽器中,右鍵單擊 Analysis Services 實例,指向新增查詢,然後單擊DMX以開啟查詢編輯器和新的空白查詢。
更改查詢
下一個步驟是修改上述 CREATE MINING STRUCTURE 語句,以建立 Bike Buyer 採礦結構。
若要自訂 CREATE MINING STRUCTURE 語句
在查詢編輯器中,將 CREATE MINING STRUCTURE 語句的泛型範例複製到空白查詢中。
取代下列項目:
[<mining structure>]取代為:
[Bike Buyer]取代下列項目:
<key column>取代為:
CustomerKey LONG KEY取代下列項目:
<mining structure columns>取代為:
[Age] LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned] LONG DISCRETE, [Number Children At Home] LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS取代下列項目:
WITH HOLDOUT (holdout specifier>)取代為:
WITH HOLDOUT (30 PERCENT or 1000 CASES)完整的採礦結構語句現在應該如下所示:
CREATE MINING STRUCTURE [Bike Buyer] ( [Customer Key] LONG KEY, [Age]LONG DISCRETIZED(Automatic,10), [Bike Buyer] LONG DISCRETE, [Commute Distance] TEXT DISCRETE, [Education] TEXT DISCRETE, [Gender] TEXT DISCRETE, [House Owner Flag] TEXT DISCRETE, [Marital Status] TEXT DISCRETE, [Number Cars Owned]LONG DISCRETE, [Number Children At Home]LONG DISCRETE, [Occupation] TEXT DISCRETE, [Region] TEXT DISCRETE, [Total Children]LONG DISCRETE, [Yearly Income] DOUBLE CONTINUOUS ) WITH HOLDOUT (30 PERCENT or 1000 CASES)在 [檔案] 功能表上,按一下 [另存新檔 DMXQuery1.dmx]。
在 [ 另存新檔 ] 對話框中,瀏覽至適當的資料夾,並將檔案
Bike Buyer Structure.dmx命名為 。
執行查詢
最後一個步驟是執行查詢。 建立並儲存查詢之後,必須執行查詢。 也就是說,必須執行 語句,才能在伺服器上建立採礦結構。 如需在查詢編輯器中執行查詢的詳細資訊,請參閱 Database Engine 查詢編輯器 (SQL Server Management Studio) 。
若要執行查詢
在 [查詢編輯器] 的工具列上,按兩下 [ 執行]。
查詢的狀態會顯示在語句完成執行之後,查詢編輯器底部的 [ 訊息 ] 索引標籤中。 訊息應該會顯示:
Executing the query Execution complete名為 Bike Buyer 的新結構現在存在於伺服器上。
在下一課,您會將採礦模型新增至您剛才建立的結構。