預測計算器工具可協助您建立計分卡,以用來分析新資料並評估選項或風險。 例如,如果您有客戶的歷史和人口統計資料, 預測計算器 工具可協助您完成兩項重要工作:
產生人數統計的基礎分析、購買行為,以及其他各種因數。
建立工作計分卡,協助您評估成員,並針對新產品或服務供應項目提出建議。
此精靈也會建立可存放所有基礎計算的工作表,讓您可以與模型互動,並查看不同的輸入值如何影響最終的分數。
如果您選擇,精靈也會建立一個列印版本的工作表,讓您用於離線計分。 您無法像與線上 Excel 活頁簿互動一樣與模型互動,但是列印版本會提供您需要輸入值並計算最終分數的所有計算。
使用預測計算器工具
開啟包含您要分析之資料的 Excel 資料表。
按一下 [分析] 索引標籤上的 [預測計算器]。
在 [ 預測計算器] 對話方塊中,針對 [目標] 選擇您想要預測的資料行,例如購買行為。
指定目標值。 如果值為數值,請使用 [範圍]選項,然後輸入所需範圍的最小值和最大值。 如果值是離散的,請選取 [精確 ] 選項,然後從下拉式清單中選取值。
按一下 [選擇要用於分析的資料行]。
在 [ 進階資料行選取 ] 對話方塊中,選取具有實用資訊的資料行。 移除與分析不相關的任何資料行。 按一下 [確定] 。
為防止扭曲結果,您也應該移除具有重複資訊的資料行。 例如,如果您的 [Income] 資料行包含數值資料,而 [Income Group] 資料行包含 [高]、[中] 與 [低] 標籤,則您不得在相同的模型中包含這兩個資料行, 但是您可以針對每個資料行建立一個個別的模型。
在 [ 輸出選項 ] 區段中,選取 [操作計算機 ] 以在 Excel 活頁簿中建立分析和計分卡。 選取 [印表機就緒計算機 ] 以建立分析,並產生可列印並用於手動評分的報表。
按一下 [執行] 。
此工具會建立包含報表與計分卡的新工作表。
規格需求
預測計算器工具會使用 Microsoft 羅吉斯回歸演算法,其可與離散值搭配使用,以及離散化和連續數值資料。
了解計分報表
如果您同時選取兩個輸出選項,[預測計算器] 會在目前的活頁簿中建立下列三個新工作表:
包含分析結果的 預測報表,其中包含可協助您實驗互動和收益的互動式資料表和圖表。
互動式 預測計算器 ,可協助您建立分數。
可列印計算機,其中包含要用於評分的指示和係數。
本節描述每個報表中的資訊,以及如何使用各種報表選項。
包含圖形的預測報表
第一個預測報告標題為預測計算器報告, < 以取得目標屬性 > 的目標狀態 ><。 其中包含從分析衍生出來的因數資料表,以及可協助您評估特定分析之財務影響的工具。
指定成本與收益的資料表
此報表中的第一個工具在報表左上方的資料表,您可以在其中指定與正確和不正確預測值相關聯的成本與收益。 計算器需要這些成本與收益,才能計算最佳分數臨界值。
| 項目 | 描述及範例 |
|---|---|
| 誤判成本 | 當實際的預測錯誤時,假設模型正確預測肯定結果的成本。 例如,模型預測客戶將購買某樣東西,而且您根據這個預測鎖定該客戶想出一個活動。 您可能在此輸入拓展客戶的成本。 |
| 誤否定成本 | 當實際的預測錯誤時,假設模型正確預測否定結果的成本。 例如,模型可能會預測年紀較大的客戶不太可能購買腳踏車,但是您發現該模型被扭曲了,因此您損失了鎖定年紀較大的客戶的機會。 您可能在此指派損失的機會成本。 |
| 真肯定收益 | 正確預測肯定結果的收益。 例如,如果您鎖定正確的客戶,而且要在銷售上拓展成果,您可以在此輸入每個客戶的收益。 |
| 真否定收益 | 正確預測否定結果的收益。 例如,如果您可以正確識別不應鎖定的客戶,您可能在此輸入每個客戶的 X 廣告金額。 |
檢視最大收益的圖表
當您在資料表中輸入值時,假設是目前的模型,相關的圖形會自動更新以顯示最佳的最大化收益點。 此資料表右側的折線圖會顯示各種分數臨界值的收益。 系統會根據來自模型的預測與機率,使用您輸入資料表的收益和成本數字來評估收益。
例如,如果在左上方表格中, [建議閾值] 的儲存格可最大化收益 顯示值 500,則右側的圖表會顯示 500 為折線圖上的最高點。 500 這個值表示若要達到最高的收益,您應該使用來自採礦模型的前 500 個建議 (以機率排序)。
針對每個屬性和值列出分數的資料表
報表左下方的資料表表示偵測到的值之詳細分解,以及每個值如何影響結果。 您無法變更此資料表中的值,因為這些值的顯示有助於了解預測。
例如,下表顯示目標結果為客戶購買腳踏車時的結果範例。 此資料表列出模型中使用的每個輸入資料行 (不論這些輸入是否影響模型)。 同時,如果輸入資料行包含連續數值資料,此資料表也列出離散值與離散化的值。
[相對影響]資料行中的值為機率,以百分比表示。 加上陰影的資料格則是以視覺方式表示這個值對於結果的影響。
| 屬性 | 值 | 相對影響 |
|---|---|---|
| Marital Status | Married | 0 |
| Marital Status | Single | 71 |
| 性別 | Female | 13 |
| 性別 | Male | 0 |
您可以將這些因數解譯如下:
已婚不影響客戶對於購買腳踏車的可能性。
不過,單身是客戶可能購買腳踏車的強烈指標 (70%)。
如果客戶是女性,則客戶的性別對於預測的腳踏車購買行為僅有極小的影響 (13%),而如果客戶是男性,則對於預測的腳踏車購買行為沒有任何影響。
累積錯誤分類成本的圖表
報表右下方的區域圖表示各種分數臨界值的累積錯誤分類成本。 此圖表也會使用您針對誤判、真肯定、誤否定與誤判輸入的成本和收益數字。
不像報表右上方的圖表著重在最大的收益,此圖表併入了預測錯誤的成本。 此圖表在諸如預防的狀況下特別實用,其中錯誤決策的成本可能會明顯超過猜測正確的成本。
例如,雖然第一個圖表建議鎖定模型預測的前 500 個客戶是達到最高收益的方式,但是您在查看過這個圖表後判定錯誤鎖定客戶的成本太大,而可能決定改為在前 400 個客戶後中斷行銷活動。
互動式預測計算器
預測計算器工具所建立的第二個工作表標題為預測計算器,以取得 < 目標屬性 > 的目標狀態 ><。 這是一個您可以用於計算個別分數的互動式工作表。 這個工作表使用存放在模型中的模式與統計資料,因此您可以試驗不同的值,並查看這些值如何影響預測的分數。 此報表也包含兩個區段:一個是互動式的區段,而另一個則為參考。
第一個資料表
您可以在資料表的 [值 ] 資料行中選取或輸入新值,以查看變更值如何影響分數。
例如,如果報表包含下列值,您可能會將 [Cars] 的值減少為 1,然後再減少為 0,就可以查看該值如何影響客戶的購買行為。 當您將 Cars 的值變更為 0 時,底部的預測會變更為 TRUE。
| 屬性 | 值 | 相對影響 |
|---|---|---|
| Marital Status | Married | 0 |
| 性別 | Male | 0 |
| Income | 39050 - 71062 | 117 |
| Children | 0 | 157 |
| 教育訓練 | Bachelors | 22 |
| Occupation | Skilled Manual | 33 |
| Home Owner | Yes | 8 |
| Cars | 2 | 50 |
| Commute Distance | 0-1 Miles | 99 |
| 區域 | 北美洲 | 0 |
| 年齡 | 37 - 46 | 5 |
| 總計 | 491 | |
| Prediction for 'Yes' | false |
當您輸入新值時,資料格中顯示的分數[是預測]、變更為 TRUE,以及各種屬性的 相對影響 分數也會更新。
注意
即使您只改變一個值 (例如,Cars 的數目),其他屬性的值和影響可能也會在您改變時變更。 這是因為資料採礦模型通常會尋找資料間的複雜關係,而且,變更任何一個變數都可能會有預料之外的結果。 因此,建議您使用互動式預測計算器來試驗不同的值,或瀏覽採礦模型,讓您更佳了解其互動。 如需詳細資訊,請參閱 流覽模型。
分數分解
此資料表針對輸入資料行的每個可能狀態顯示個別的分數,以及該分數對於結果的相對影響。 此資料表是靜態的,而且僅供參考。
可列印預測計算器
預測計算器工具所建立的第三張工作表標題為PrintablePrediction Calculator,以取得 < 目標屬性 > 的目標狀態 ><。 這個計分卡可以列印出來,讓您在不使用電腦時,能夠手動計算分數。
列印與使用預測計算器產生的計分報表
按一下標題為[可列印預測計算器] 屬性的 <> 索引卷標。
在 [Excel 檔案] 功能表上,選取 [ 預覽列印]。
變更頁面方向、邊界以及其他列印選項,直到計分卡符合您需要在頁面上呈現的方式為止。
此計分卡不是動態的,而且無法以任何方式連接到模型,因此,您可以移動資料行或資料列來改善格式,而不會影響基礎資料。
列印計分卡。
每個屬性只能選擇一個值。 針對您選擇的值,將核取記號放在方塊中,然後在 [ 分數 ] 資料行中寫入對應的數位。
盡可能填入多個屬性以確保精確度。
計算每個屬性的分數總和,並在 [總計 ] 資料列中輸入該數位。
使用工作表上緊接在 [總計 ] 資料列之後列印的準則,將分數轉換為預測結果。
相關工具
Analysis Services 提供 Microsoft 羅吉斯回歸演算法,以用於這種類型的分析。 如果您已經熟悉羅吉斯回歸,您可以使用適用于 Excel 的資料採礦用戶端的 [ 進階 ] 選項,輕鬆地建立羅吉斯回歸模型。 如需詳細資訊,請參閱 適用于 Excel) 的進階模型化 (資料採礦載入 宏。 For more information about the options and parameters for logistic regression models, see the topic "Microsoft Logistic Regression Algorithm" in SQL Server Books Online.