叢集精靈（適用於 Excel 的資料挖掘外掛程式）

資料探勘功能區中的叢集精靈

叢集精靈可協助您建置模型，以偵測共用類似特性的數據列，並將其分組，以最大化群組之間的距離。此精靈適用於尋找各種數據中的模式。

叢集精靈會使用Microsoft叢集演算法，而且可以廣泛自定義。它適用於現有的 Excel 表格、Excel 範圍或分析服務查詢的數據。類似的功能是由偵測類別工具所提供的，提供於適用於 Excel 的數據表分析工具中。不過，偵測類別工具無法自定義，而且必須使用 Excel 數據表中的數據。

使用叢集精靈

在 [數據採礦] 功能區中，按兩下 [ 叢集]，然後按 [ 下一步]。
在 [ 選取源數據] 頁面中，選取 Excel 數據表或範圍。或指定外部數據源。

如果您使用外部數據源，您可以建立自定義檢視或貼上自定義查詢文字，並將數據集儲存為 Analysis Services 數據源。
在 [ 叢集] 頁面上，您可以自定義模型建置的方式。
- 針對 區段數目，您可以告訴精靈建立固定的類別數目，或讓它自動偵測最佳群組數目。
- 檢閱 [輸入 數據行] 列表中的數據行清單，並取消選取任何在建立模式時沒有用處的數據行。您應該排除的數據行包括識別碼、客戶名稱等等。
或者，按兩下 [ 參數 ] 來變更演算法參數，並自定義叢集模型的行為。
在 [ 將數據分割成定型和測試集 ] 頁面中，指定要保留多少數據進行測試。其餘部分一律用於定型模型。

默認設定為 30% 測試數據和 70% 訓練數據。
在 [ 完成 ] 頁面上，提供數據集和模型的描述性名稱，並設定下列選項來控制如何使用完成的模型：
- 流覽模型。選取此選項時，只要精靈完成模型處理，就會開啟 [ 流覽 ] 視窗，以協助您探索結果。查看器的內容取決於您建立的模型類型。如需詳細資訊，請參閱瀏覽叢集模型。
- 啟用鑽取。選取此選項可檢視已完成模型的基礎數據。只有在您建置判定樹模型時，才能使用此選項。
- 使用暫存模型。如果您選取此選項，模型將不會儲存至伺服器。當您關閉 Excel 時，會刪除暫存模型。

深入瞭解叢集模型

您可以按下 [ 進階 ] 並使用 [ 演演算法參數 ] 對話框，變更此精靈所使用的叢集演算法。

Microsoft叢集演算法會提供下列叢集方法：

K-means - 可擴展或不能擴展。
預期最大化（EM） - 可調整或非調整。

您也可以使用 CLUSTER_SEED 參數來控制起始值，並確保使用相同數據集的重複模型具有相同的結果。

需求

若要使用叢集精靈，您必須連線到 Analysis Services 資料庫。如需詳細資訊，請參閱連接到源數據（適用於 Excel 的數據採礦用戶端）。

另請參閱

建立數據採礦模型
 偵測類別（適用於 Excel 的數據表分析工具）

Last updated on 2017-12-29

共用方式為

叢集精靈 （適用於 Excel 的資料挖掘外掛程式）

使用叢集精靈

深入瞭解叢集模型

需求

另請參閱

其他資源

叢集精靈（適用於 Excel 的資料挖掘外掛程式）