共用方式為


建立新的OLAP採礦結構

您可以使用 Microsoft SQL Server Analysis Services 中的數據採礦精靈來建立採礦結構,以使用多維度模型的數據。 以 OLAP Cube 為基礎的採礦模型可以使用事實數據表、維度和量值群組中的數據行和值作為分析的屬性。

建立新的OLAP採礦結構

  1. 在 SQL Server Data Tools (SSDT) 的方案總管中,以滑鼠右鍵按兩下 Analysis Services 專案中的 [採礦結構 ] 資料夾,然後按兩下 [ 新增採礦結構 ] 以開啟 [資料採礦精靈]。

  2. 在 [ 歡迎使用數據採礦精靈] 頁面上,按 [下一步]。

  3. 在 [ 選取定義方法] 頁面上,選取 [從現有的 Cube],然後按 [ 下一步]。

    如果您收到訊息錯誤,則無法擷取支援的數據採礦演算法清單,請開啟 [ 項目屬性 ] 對話方塊,並確認您已指定支援多維度模型的 Analysis Services 實例名稱。 您無法在支援表格式模型化的 Analysis Services 實例上建立採礦模型。

  4. 在 [ 建立數據採礦結構] 頁面上,決定是否只建立採礦結構,或採礦結構加上一個相關的採礦模型。 一般而言,您可以更輕鬆地同時建立資料探勘模型,這樣系統就會提示您包含必要的欄位。

    如果您要建立採礦模型,請選取要使用的數據採礦演算法,然後按 [ 下一步]。 如需如何選擇演算法的詳細資訊,請參閱數據採礦演算法(Analysis Services - 數據採礦)。

  5. 在 [ 選取來源 Cube 維度 ] 頁面的 [ 選取來源 Cube 維度] 底下,找出包含大部分案例數據的維度。

    例如,如果您嘗試識別客戶群組,您可以選擇 [客戶] 維度;如果您嘗試分析交易之間的購買,您可以選擇 [因特網銷售訂單詳細數據] 維度。 您不限於只使用此維度中的數據,而是應該包含分析中使用的重要屬性。

    [下一步]。

  6. 在 [ 選取案例密鑰 ] 頁面的 [ 屬性] 底下,選取將成為採礦結構索引鍵的屬性,然後按 [ 下一步]。

    通常在採礦結構中使用的主鍵屬性,也會是維度的主鍵,並將預先選取。

  7. 在 [ 選取案例層級數據行 ] 頁面的 [ 相關屬性和量值] 底下,選取屬性和量值,其中包含您要新增至採礦結構作為案例數據的值。 按 [下一步]。

  8. 在 [ 指定採礦模型數據行使用方式 ] 頁面上,於 [ 採礦模型結構] 底下,先設定可預測的數據行,然後選擇要作為輸入的數據行。

    • 選取最左邊列中的複選框,來包含於採礦結構中的數據。 您可以在用於參考的結構中包含列,但這些列不能用於分析。

    • 選取 [輸入 ] 資料行中的複選框,以使用 屬性作為分析中的變數。

    • 僅針對可預測屬性選取 預測 欄中的複選框。

    請注意,您指定為鍵列的欄位無法用於輸入或預測。

    [下一步]。

  9. 在 [ 指定採礦模型數據行使用方式 ] 頁面上,您也可以使用 [加入巢狀數據表 ] 和 [ 巢狀數據表],將巢狀數據表新增和移除至採礦結構。

    在 OLAP 採礦模型中,巢狀數據表是 Cube 內另一組數據,其與代表案例屬性的維度有一對多關聯性。 因此,當對話框開啟時,它會預先選取與您選取為案例數據表之維度相關的量值群組。 此時,您可以選擇不同的維度,其中包含可用於分析的其他資訊。

    例如,如果您要分析客戶,您會使用 [Customer] 維度作為案例數據表。 對於內嵌表格,您可以新增顧客在購買時提供的原因,這些原因包含在 [銷售理由] 維度中。

    如果您新增巢狀數據,則必須指定兩個額外的數據列:

    • 巢狀數據表的索引鍵:這應該在頁面上預先選取[ 選取巢狀數據表索引鍵]。

    • 要用於分析的屬性或屬性:[ 選取巢狀數據表數據行] 頁面會提供巢狀數據表選取範圍中的量值和屬性清單。

      • 針對您包含在模型中的每個屬性,勾選左側欄位中的方塊。

      • 如果您想要只使用 屬性進行分析,請檢查 [輸入]。

      • 如果您想要將數據行包含為模型的其中一個可預測屬性,請選取 [預測]。

      • 您在結構中包含但未指定為輸入或可預測屬性的任何項目會以 具有 Ignore 標記新增至結構;這表示資料在建置模型時會被處理,但不會用於分析,並且僅能用於鑽取。 如果您想要包含客戶名稱等詳細數據,但不想在分析中使用這些詳細數據,這很有用。

    按兩下 [完成 ] 關閉精靈中與巢狀數據表搭配運作的部分。 您可以重複此程式以新增多個巢狀資料列。

  10. 在 [ 指定數據行的內容和數據類型 ] 頁面上,於 [採礦模型結構] 底下,設定每個數據行的內容類型和數據類型。

    備註

    OLAP 採礦模型不支援使用 偵測 功能來自動偵測數據行是否包含連續或離散數據。

    [下一步]。

  11. 切片來源 Cube 頁面上,您可以篩選用於建立資料探勘結構的數據。

    分割立方體可以讓您限制用來建置模型的數據。 例如,您可以通過在地理階層上進行切割,為每個區域建立個別的模型。

    • 維度:從下拉式清單中選擇相關的維度。

    • 階層:選取您要套用篩選的維度階層層級。 例如,如果您要依 [Geography] 維度切割,您可以選擇階層層級,例如 [區域國家名稱]。

    • 運算子:從清單中選擇運算符。

    • 篩選表達式:輸入做為篩選條件的值或表達式,或使用下拉式清單從階層指定層級的成員清單中選取值。

      例如,如果您選取 [Geography] 作為維度,並將 [區域國家/地區名稱] 選取為階層層級,下拉式清單會包含所有可用來作為篩選條件的有效國家/地區。 您可以複選。 因此,採礦結構中的數據會受限於來自這些地理區域的多維資料集數據。

    • 參數:忽略此複選框。 此對話框支援多個 Cube 篩選案例,而且此選項與建置採礦結構無關。

    [下一步]。

  12. 在 [ 將數據分割成定型和測試集 ] 頁面上,指定要保留用於測試的採礦結構數據百分比,或指定測試案例數目上限。 按 [下一步]。

    如果您指定這兩個值,則會結合限制來使用最低值。

  13. 在 [完成精靈] 頁面上,提供新 OLAP 資料探勘結構和初始資料探勘模型的名稱。

  14. 按一下完成

  15. 完成精靈 頁面上,您也可以選擇建立採礦模型維度,或使用採礦模型維度來建立 Cube。 這些選項僅支援使用下列演算法所建置的模型:

    • Microsoft叢集演算法

    • Microsoft判定樹演算法

    • Microsoft關聯規則演算法

    建立採礦模型維度:選取此複選框,並提供採礦模型維度的類型名稱。 當您使用此選項時,會在用來建置採礦結構的原始 Cube 內建立新的維度。 您可以使用這個維度向下切入並進行進一步的分析。 因為維度位於 Cube 內,因此維度會自動對應至案例數據維度。

    使用採礦模型維度建立 Cube:選取此複選框,並提供新 Cube 的名稱。 當您使用此選項時,會建立新的 Cube,其中包含建置結構時所使用的現有維度,以及包含模型結果的新數據採礦維度。

另請參閱

採礦結構任務和操作指南