共用方式為


叢集精靈 (適用於 Excel 的資料挖掘外掛程式)

資料探勘功能區中的叢集精靈

叢集精靈可協助您建置模型,以偵測共用類似特性的數據列,並將其分組,以最大化群組之間的距離。 此精靈適用於尋找各種數據中的模式。

叢集精靈會使用Microsoft叢集演算法,而且可以廣泛自定義。 它適用於現有的 Excel 表格、Excel 範圍或分析服務查詢的數據。 類似的功能是由 偵測類別 工具所提供的,提供於適用於 Excel 的數據表分析工具中。 不過,偵測類別工具無法自定義,而且必須使用 Excel 數據表中的數據。

使用叢集精靈

  1. 在 [數據採礦] 功能區中,按兩下 [ 叢集],然後按 [ 下一步]。

  2. 在 [ 選取源數據] 頁面中,選取 Excel 數據表或範圍。 或指定外部數據源。

    如果您使用外部數據源,您可以建立自定義檢視或貼上自定義查詢文字,並將數據集儲存為 Analysis Services 數據源。

  3. 在 [ 叢集] 頁面上,您可以自定義模型建置的方式。

    • 針對 區段數目,您可以告訴精靈建立固定的類別數目,或讓它自動偵測最佳群組數目。

    • 檢閱 [輸入 數據行] 列表中的數據行清單,並取消選取任何在建立模式時沒有用處的數據行。 您應該排除的數據行包括識別碼、客戶名稱等等。

  4. 或者,按兩下 [ 參數 ] 來變更演算法參數,並自定義叢集模型的行為。

  5. 在 [ 將數據分割成定型和測試集 ] 頁面中,指定要保留多少數據進行測試。 其餘部分一律用於定型模型。

    默認設定為 30% 測試數據和 70% 訓練數據。

  6. 在 [ 完成 ] 頁面上,提供數據集和模型的描述性名稱,並設定下列選項來控制如何使用完成的模型:

    • 流覽模型。 選取此選項時,只要精靈完成模型處理,就會開啟 [ 流覽 ] 視窗,以協助您探索結果。 查看器的內容取決於您建立的模型類型。 如需詳細資訊,請參閱 瀏覽叢集模型

    • 啟用鑽取。 選取此選項可檢視已完成模型的基礎數據。 只有在您建置判定樹模型時,才能使用此選項。

    • 使用暫存模型。 如果您選取此選項,模型將不會儲存至伺服器。 當您關閉 Excel 時,會刪除暫存模型。

深入瞭解叢集模型

您可以按下 [ 進階 ] 並使用 [ 演演算法參數 ] 對話框,變更此精靈所使用的叢集演算法。

Microsoft叢集演算法會提供下列叢集方法:

  • K-means - 可擴展或不能擴展。

  • 預期最大化 (EM) - 可調整或非調整。

您也可以使用 CLUSTER_SEED 參數來控制起始值,並確保使用相同數據集的重複模型具有相同的結果。

需求

若要使用叢集精靈,您必須連線到 Analysis Services 資料庫。 如需詳細資訊,請參閱連接到源數據(適用於 Excel 的數據採礦用戶端)。

另請參閱

建立數據採礦模型
偵測類別 (適用於 Excel 的數據表分析工具 )