共用方式為


預測計算器 (適用於 Excel 的資料表分析工具)

預測計算器工具預測

預測計算器工具可協助您建立計分卡,以用來分析新資料並評估選項或風險。 例如,如果您有客戶的歷史和人口統計資料, 預測計算器 工具可協助您完成兩項重要工作:

  • 產生人數統計的基礎分析、購買行為,以及其他各種因數。

  • 建立工作計分卡,協助您評估成員,並針對新產品或服務供應項目提出建議。

此精靈也會建立可存放所有基礎計算的工作表,讓您可以與模型互動,並查看不同的輸入值如何影響最終的分數。

如果您選擇,精靈也會建立一個列印版本的工作表,讓您用於離線計分。 您無法像與線上 Excel 活頁簿互動一樣與模型互動,但是列印版本會提供您需要輸入值並計算最終分數的所有計算。

使用預測計算器工具

  1. 開啟包含您要分析之資料的 Excel 資料表。

  2. 按一下 [分析] 索引標籤上的 [預測計算器]。

  3. 在 [ 預測計算器] 對話方塊中,針對 [目標] 選擇您想要預測的資料行,例如購買行為。

  4. 指定目標值。 如果值為數值,請使用 [範圍]選項,然後輸入所需範圍的最小值和最大值。 如果值是離散的,請選取 [精確 ] 選項,然後從下拉式清單中選取值。

  5. 按一下 [選擇要用於分析的資料行]。

  6. 在 [ 進階資料行選取 ] 對話方塊中,選取具有實用資訊的資料行。 移除與分析不相關的任何資料行。 按一下 [確定] 。

    為防止扭曲結果,您也應該移除具有重複資訊的資料行。 例如,如果您的 [Income] 資料行包含數值資料,而 [Income Group] 資料行包含 [高]、[中] 與 [低] 標籤,則您不得在相同的模型中包含這兩個資料行, 但是您可以針對每個資料行建立一個個別的模型。

  7. 在 [ 輸出選項 ] 區段中,選取 [操作計算機 ] 以在 Excel 活頁簿中建立分析和計分卡。 選取 [印表機就緒計算機 ] 以建立分析,並產生可列印並用於手動評分的報表。

  8. 按一下 [執行]

    此工具會建立包含報表與計分卡的新工作表。

規格需求

預測計算器工具會使用 Microsoft 羅吉斯回歸演算法,其可與離散值搭配使用,以及離散化和連續數值資料。

了解計分報表

如果您同時選取兩個輸出選項,[預測計算器] 會在目前的活頁簿中建立下列三個新工作表:

  • 包含分析結果的 預測報表,其中包含可協助您實驗互動和收益的互動式資料表和圖表。

  • 互動式 預測計算器 ,可協助您建立分數。

  • 可列印計算機,其中包含要用於評分的指示和係數。

  • 本節描述每個報表中的資訊,以及如何使用各種報表選項。

包含圖形的預測報表

第一個預測報告標題為預測計算器報告, < 以取得目標屬性 > 的目標狀態 ><。 其中包含從分析衍生出來的因數資料表,以及可協助您評估特定分析之財務影響的工具。

指定成本與收益的資料表

此報表中的第一個工具在報表左上方的資料表,您可以在其中指定與正確和不正確預測值相關聯的成本與收益。 計算器需要這些成本與收益,才能計算最佳分數臨界值。

項目 描述及範例
誤判成本 當實際的預測錯誤時,假設模型正確預測肯定結果的成本。

例如,模型預測客戶將購買某樣東西,而且您根據這個預測鎖定該客戶想出一個活動。 您可能在此輸入拓展客戶的成本。
誤否定成本 當實際的預測錯誤時,假設模型正確預測否定結果的成本。

例如,模型可能會預測年紀較大的客戶不太可能購買腳踏車,但是您發現該模型被扭曲了,因此您損失了鎖定年紀較大的客戶的機會。 您可能在此指派損失的機會成本。
真肯定收益 正確預測肯定結果的收益。 例如,如果您鎖定正確的客戶,而且要在銷售上拓展成果,您可以在此輸入每個客戶的收益。
真否定收益 正確預測否定結果的收益。

例如,如果您可以正確識別不應鎖定的客戶,您可能在此輸入每個客戶的 X 廣告金額。

檢視最大收益的圖表

當您在資料表中輸入值時,假設是目前的模型,相關的圖形會自動更新以顯示最佳的最大化收益點。 此資料表右側的折線圖會顯示各種分數臨界值的收益。 系統會根據來自模型的預測與機率,使用您輸入資料表的收益和成本數字來評估收益。

例如,如果在左上方表格中, [建議閾值] 的儲存格可最大化收益 顯示值 500,則右側的圖表會顯示 500 為折線圖上的最高點。 500 這個值表示若要達到最高的收益,您應該使用來自採礦模型的前 500 個建議 (以機率排序)。

針對每個屬性和值列出分數的資料表

報表左下方的資料表表示偵測到的值之詳細分解,以及每個值如何影響結果。 您無法變更此資料表中的值,因為這些值的顯示有助於了解預測。

例如,下表顯示目標結果為客戶購買腳踏車時的結果範例。 此資料表列出模型中使用的每個輸入資料行 (不論這些輸入是否影響模型)。 同時,如果輸入資料行包含連續數值資料,此資料表也列出離散值與離散化的值。

[相對影響]資料行中的值為機率,以百分比表示。 加上陰影的資料格則是以視覺方式表示這個值對於結果的影響。

屬性 相對影響
Marital Status Married 0
Marital Status Single 71
性別 Female 13
性別 Male 0

您可以將這些因數解譯如下:

  • 已婚不影響客戶對於購買腳踏車的可能性。

  • 不過,單身是客戶可能購買腳踏車的強烈指標 (70%)。

  • 如果客戶是女性,則客戶的性別對於預測的腳踏車購買行為僅有極小的影響 (13%),而如果客戶是男性,則對於預測的腳踏車購買行為沒有任何影響。

累積錯誤分類成本的圖表

報表右下方的區域圖表示各種分數臨界值的累積錯誤分類成本。 此圖表也會使用您針對誤判、真肯定、誤否定與誤判輸入的成本和收益數字。

不像報表右上方的圖表著重在最大的收益,此圖表併入了預測錯誤的成本。 此圖表在諸如預防的狀況下特別實用,其中錯誤決策的成本可能會明顯超過猜測正確的成本。

例如,雖然第一個圖表建議鎖定模型預測的前 500 個客戶是達到最高收益的方式,但是您在查看過這個圖表後判定錯誤鎖定客戶的成本太大,而可能決定改為在前 400 個客戶後中斷行銷活動。

互動式預測計算器

預測計算器工具所建立的第二個工作表標題為預測計算器,以取得 < 目標屬性 > 的目標狀態 ><。 這是一個您可以用於計算個別分數的互動式工作表。 這個工作表使用存放在模型中的模式與統計資料,因此您可以試驗不同的值,並查看這些值如何影響預測的分數。 此報表也包含兩個區段:一個是互動式的區段,而另一個則為參考。

第一個資料表

您可以在資料表的 [值 ] 資料行中選取或輸入新值,以查看變更值如何影響分數。

例如,如果報表包含下列值,您可能會將 [Cars] 的值減少為 1,然後再減少為 0,就可以查看該值如何影響客戶的購買行為。 當您將 Cars 的值變更為 0 時,底部的預測會變更為 TRUE。

屬性 相對影響
Marital Status Married 0
性別 Male 0
Income 39050 - 71062 117
Children 0 157
教育訓練 Bachelors 22
Occupation Skilled Manual 33
Home Owner Yes 8
Cars 2 50
Commute Distance 0-1 Miles 99
區域 北美洲 0
年齡 37 - 46 5
總計 491
Prediction for 'Yes' false

當您輸入新值時,資料格中顯示的分數[是預測]、變更為 TRUE,以及各種屬性的 相對影響 分數也會更新。

注意

即使您只改變一個值 (例如,Cars 的數目),其他屬性的值和影響可能也會在您改變時變更。 這是因為資料採礦模型通常會尋找資料間的複雜關係,而且,變更任何一個變數都可能會有預料之外的結果。 因此,建議您使用互動式預測計算器來試驗不同的值,或瀏覽採礦模型,讓您更佳了解其互動。 如需詳細資訊,請參閱 流覽模型

分數分解

此資料表針對輸入資料行的每個可能狀態顯示個別的分數,以及該分數對於結果的相對影響。 此資料表是靜態的,而且僅供參考。

可列印預測計算器

預測計算器工具所建立的第三張工作表標題為PrintablePrediction Calculator,以取得 < 目標屬性 > 的目標狀態 ><。 這個計分卡可以列印出來,讓您在不使用電腦時,能夠手動計算分數。

列印與使用預測計算器產生的計分報表
  1. 按一下標題為[可列印預測計算器] 屬性的 <> 索引卷標。

  2. 在 [Excel 檔案] 功能表上,選取 [ 預覽列印]。

  3. 變更頁面方向、邊界以及其他列印選項,直到計分卡符合您需要在頁面上呈現的方式為止。

    此計分卡不是動態的,而且無法以任何方式連接到模型,因此,您可以移動資料行或資料列來改善格式,而不會影響基礎資料。

  4. 列印計分卡。

  5. 每個屬性只能選擇一個值。 針對您選擇的值,將核取記號放在方塊中,然後在 [ 分數 ] 資料行中寫入對應的數位。

  6. 盡可能填入多個屬性以確保精確度。

  7. 計算每個屬性的分數總和,並在 [總計 ] 資料列中輸入該數位。

  8. 使用工作表上緊接在 [總計 ] 資料列之後列印的準則,將分數轉換為預測結果。

Analysis Services 提供 Microsoft 羅吉斯回歸演算法,以用於這種類型的分析。 如果您已經熟悉羅吉斯回歸,您可以使用適用于 Excel 的資料採礦用戶端的 [ 進階 ] 選項,輕鬆地建立羅吉斯回歸模型。 如需詳細資訊,請參閱 適用于 Excel) 的進階模型化 (資料採礦載入 宏。 For more information about the options and parameters for logistic regression models, see the topic "Microsoft Logistic Regression Algorithm" in SQL Server Books Online.

另請參閱

適用於 Excel 的資料表分析工具