共用方式為


精確度圖表 (SQL Server 資料探勘增益集)

[數據採礦] 功能區中的 [精確度圖表按鈕]

精確度圖表可讓您將模型套用至一組新的數據,然後評估模型執行程度。 此精靈建立的精確度 圖表是增益圖,這是經常用來測量數據採礦模型精確度的圖表類型。 相較於隨機預測,這種類型的精確度圖表會顯示您從使用指定數據採礦模型取得的改進圖形表示,以及 100% 預測正確的理想案例。 您可以在單一圖表內比較多個模型。

範例

請考慮 Adventure Works Cycles 行銷部門想要建立目標郵寄營銷活動的情況。 從過去的營銷活動中,他們知道 10% 的回應率是典型的。 他們有一個儲存在資料庫表中的10,000個潛在客戶清單。 根據一般回應率,他們可以預期有1,000個客戶回應。

不過,由於他們只能將廣告郵寄給5,000位客戶,行銷部門會使用採礦模型,以最有可能回應的5,000名客戶為目標。

如果公司隨機選取 5,000 個客戶,他們只能收到 500 個正面回應,因為只有 10% 的目標客戶通常會回應。 此案例是增益圖中隨機線條所代表的內容。

不過,如果行銷部門使用採礦模型來鎖定他們的郵寄目標,而且如果模型很完美,公司可能會透過將廣告郵寄給模型建議的 1,000 個潛在客戶,以接收 1,000 個回應。 此情境是以提升圖中的理想線表示。

使用精確度圖表精靈

若要建立精確度圖表,您必須參考現有的數據採礦結構。 您可以測量多個基於該結構的模型的準確性,只要這些模型的預測結果相同即可。

如果您不確定有哪些結構可供使用,您可以瀏覽伺服器。 如需詳細資訊,請參閱在 Excel 中瀏覽模型(SQL Server 資料探勘增益集)。

建立精確度圖表

  1. 按兩下 [資料採礦用戶端] 功能區。

  2. [精確度和驗證] 群組中,按兩下 [ 精確度圖表]。

  3. 在 [ 選取結構或模型 ] 對話框中,選擇您要評估的模型。 按 [下一步]。

    備註

    您必須選擇與您想要測試的數據緊密相符的模型。

  4. 指定要預測的列和要預測的值 對話框中,選擇您要預測的列以及目標值(如適用)。 按 [下一步]。

    例如,在上述範例中,您可以選擇建立客戶回應模型的數據行,並將目標值指定為「可能購買」。

    備註

    您無法預測連續值。 不過,您可以將數據列的值分隔成離散範圍,以便進行離散化。 建立數據採礦模型之前,您必須先執行此動作。

  5. 在 [ 選取源數據 ] 對話框中,指定您將通過模型以建立預測的數據來源。

  6. 如果您使用外部數據源,而不是與模型一起儲存的測試數據,請在 [ 指定關聯性 ] 對話框中,將新源數據中的數據行對應至數據採礦模型中使用的數據行。

    如果數據行名稱類似,精靈會自動對應它們。 雖然輸入數據中的某些數據行可能與分析無關,但可以忽略,但數據採礦模型需要某些數據行來處理輸入。 這類數據行可能包含交易標識碼、目標值或用於預測的數據行。 如果您無法對應所需的欄位,精靈會提供警告訊息。

  7. 按一下完成

    精靈會建立報表,其中包含增益圖和基礎數據。

需求

如果您要預測離散值,您必須選取您想要預測的目標值。 例如,如果您的數據分類為回應 「Yes: Buy」 為 1,而回應 「No: Do Not Buy」 為 2,您必須將 1 或 2 指定為預測值。 不過,如果您想要預測某個範圍的值,一次只能比較兩個值。 例如,如果您想要預測高於5的分數,您可能必須重新標記源數據,並建立新的模型,將結果分成兩組:大於5且小於5的模型。 然後,您可以比較這兩個群組的精確度。

瞭解精確度

您可以建立兩種類型的圖表,一種是指定可預測數據行的狀態,另一種是您未指定狀態的圖表。

如果您指定可預測數據行的狀態,圖表的 X 軸代表用來比較預測的測試數據集百分比。 圖表的 Y 軸代表預測為指定狀態的值百分比。

如果您未指定可預測數據行的狀態,圖表會顯示所有可能預測之模型的精確度。

如需增益圖的運作方式,以及如何根據隨機和理想預測線計算精確度的詳細資訊,請參閱《SQL Server 在線叢書》中的主題。

另請參閱

驗證模型和使用模型進行預測(適用於 Excel 的資料探勘增益集)