[ 估計 精靈] 可協助您建立估計模型。 估計模型會從數據擷取模式,並使用模式來預測影響結果的因素。
估計用於預測數值結果。 例如,如果您的目標數據行包含學校的畢業率,且畢業率以百分比表示,您可以分析可能增加或降低畢業率的因素,例如每所學校的學生數目、學生教師比例和教師數目。
使用估計數據精靈
在 [ 數據採礦] 功能區上,按兩下 [ 估計]。
在 [ 選取源數據] 對話框中,選取要使用的源數據。 您可以在 Excel 資料表、Excel 資料範圍或 外部數據源中使用資料。
如果您使用外部數據源,您可以建立自定義檢視或查詢,並將其儲存為 Analysis Services 數據源。
在 [ 估計] 對話框中,選取 要分析的數據行。
目標數據行必須包含連續數值數據。
選取要作為輸入的欄位,方法是勾選 輸入欄位 複選框。
這些欄位將用來建立模式。 您應該從分析中排除任何不太可能有幫助的欄位,例如標識碼號碼或包含不相關數據的欄位。
[ 估計] 精靈會選取數據集的最佳演算法。 不過,您可以按兩下 [ 參數 ] 來開啟 [ 演演算法參數 ] 對話框,並設定進階選項。
如果您的數據是數值類型,並且可以使用Microsoft線性回歸方法,那麼可以勾選回歸變數方塊,用於標記任何您知道或強烈懷疑與可預測值存在相關性的數值列。
然後,演算法會測試該數據行中的值,以判斷它們是否會影響結果。 如果您不確定,請按兩下 [ 建議 ],演算法會測試所有數據行,並自動偵測要當做回歸輸入變數使用的最佳值。
備註
需要回歸輸入項才能建立估計值。 向導總是根據數據的初步分析,建議最佳的回歸模型。 因此,如果您不確定,最好接受建議的選項。
在 [ 將數據分割成定型和測試集 ] 頁面上,指定是否要建立一小部分的數據進行測試。
在 [ 完成 ] 頁面上,提供新採礦結構和採礦模式的名稱,或接受提供的預設名稱。
設定使用模型的選項。
選取 [瀏覽 ] 以立即在查看器中開啟模型。
此圖形查看器會顯示相依性網路圖形和演算法所產生的判定樹。 藉由探索這項資訊,您可以進一步瞭解促成估計值的因素。
選擇 啟用鑽研 以讓使用者可以檢視分析的基礎數據。
只有在您使用判定樹或線性回歸演算法時,才能使用此選項。
使用暫存模型。 如果您選取此選項,模型將不會儲存至伺服器。 當您關閉 Excel 時,會刪除暫存模型。
深入了解估計模型
[估計] 精靈支援使用下列任何演算法:
Microsoft判定樹演算法
Microsoft線性回歸演算法
Microsoft羅吉斯回歸演算法
Microsoft類神經網路演算法
在 [ 演算法參數 ] 對話框中,您可以根據您選擇的演算法來設定其他進階選項。 如需每個演算法選項的相關信息,請參閱《SQL Server 在線叢書》中的下列主題:
需求
若要使用估計數據精靈,您必須連接到 Analysis Services 資料庫。
如需如何建立連線的資訊,請參閱連線至源數據(適用於 Excel 的數據採礦用戶端)。
若要使用估計演算法,您嘗試預測的結果必須以數值表示,例如貨幣、銷售金額、日期或時間。