[分類精靈] 可協助您根據 Excel 數據表、Excel 範圍或外部數據源中的現有數據來建置分類模型。
分類模型會擷取數據中的模式,指出相似性,並協助您根據值的群組進行預測。 例如,分類模型可用來根據收入或支出模式預測風險。
使用分類精靈
在 [數據採礦] 功能區中,按兩下 [ 分類],然後按 [ 下一步]。
在 [ 選取源數據] 頁面中,選擇要分析的數據。
此精靈支持多種數據:Excel 數據表、Excel 範圍和外部數據源。 透過外部數據,您可以將它加入 Excel,或在 Analysis Services 數據源中選擇一組數據表或檢視表。 您也可以新增數據表和變更數據行,以建立臨機作數據源。
在 [ 分類 ] 頁面上,選擇您要分類的數據行。
檢閱清單中的欄位、輸入欄位,並取消選取任何具有唯一值的欄位,因為這些欄位不利於建立模式,例如ID號碼、客戶名稱等等。 您也應該移除那些實質上與可分類數據行重複的數據行。
例如,如果您要分類預測產品的類別,則如果有已知的商務規則,則應該排除子類別欄位,否則該規則的強度可能會讓您無法探索其他相互關聯。
或者,按兩下 [ 參數 ] 來變更演算法參數,並自定義叢集模型的行為。
在 [ 將數據分割成定型和測試集 ] 頁面中,指定要保留多少數據進行測試。 其餘部分一律用於定型模型。
默認設定為 30% 測試數據和 70% 訓練數據。
在 [ 完成 ] 頁面上,提供數據集和模型的描述性名稱,並設定下列選項來控制如何使用完成的模型:
進一步了解分類模型
在 [ 演算法參數 ] 對話框中,您也可以從 Analysis Services 中提供的這些演算法中選擇分類方法:
Microsoft判定樹
Microsoft邏輯迴歸
Microsoft Naïve Bayes
Microsoft類神經網路
雖然演算法可能會產生類似的結果,但它們會以不同的方式分析數據,因此我們建議嘗試數個演算法並比較結果。 默認方法是Microsoft判定樹。
在 [ 參數 ] 列表中,您可以變更進階選項,這取決於您選擇的演算法類型。 每個演算法的參數會在《SQL Server 在線叢書》中詳細說明。
需求
若要使用 分類 精靈,您必須連線到 Analysis Services 資料庫。 如需如何建立連線的資訊,請參閱連線至源數據(適用於 Excel 的數據採礦用戶端)。