如何:建立交叉驗證報表
若要在 SQL ServerAnalysis Services 中建立交叉驗證報表,您必須完成與其他精確度圖表類型之程序稍微不同的步驟。這是因為交叉驗證報表不使用外部資料,而只會使用之前用來定型模型的原始資料。因此,您不需要選取資料來源,或是將資料來源中的資料行對應到採礦模型中的資料行。
下列程序描述設定及產生交叉驗證報表的步驟。如需有關交叉驗證的一般資訊,請參閱<交叉驗證 (Analysis Services - 資料採礦)>。
如需有關如何建立其他精確度圖表類型的詳細資訊,請參閱<如何:建立採礦模型的精確度圖表>。
[!附註]
只有與目前選定結構有關的模型才可供交叉驗證使用。如果此結構支援具有不同可預測屬性的模型,或是此結構支援群集與非群集模型的組合,您就必須針對每一個可預測輸出建立個別的報表,或是針對群集與非群集模型建立個別的報表。
選取採礦結構進行交叉驗證
在 Business Intelligence Development Studio 中開啟資料採礦設計師。
在 [方案總管] 中,開啟包含您想要建立報表之結構或模型的資料庫。
按兩下此採礦結構,在資料採礦設計師中開啟此結構以及其相關的模型。
按一下 [採礦精確度圖表] 索引標籤。
按一下 [交叉驗證] 索引標籤。
設定交叉驗證選項
在 [交叉驗證] 索引標籤上,針對 [摺疊計數] 按一下向下箭頭,選取 1 到 10 之間的數字。預設值是 10。
[摺疊計數] 表示將會在原始資料集內建立的資料分割數目。如果您將 [摺疊計數] 設定為 1,將會使用定型集而不加以分割。
針對 [目標屬性] 按一下向下箭頭,然後從清單中選取資料行。如果此模型為群集模型,請選取 [#Cluster] 來指示此模型沒有可預測屬性。
每一個報表只能選取一個可預測屬性。根據預設,具有相同可預測屬性的所有相關模型都會包含在報表中。
在 [最大案例數] 中,輸入一個夠大的數字來提供當資料分割成指定的摺疊數時的代表性資料樣本。如果此數字大於模型定型集內的案例計數,將會使用所有的案例。
如果訓練資料集非常大,則設定 [最大案例數] 的值會限制處理的總案例數,並讓報表更快完成。但是,您不應該將 [最大案例數] 設定為太低的值,否則將不會有足夠的資料來進行交叉驗證。
選擇性地針對 [目標狀態] 輸入您想要模型化之可預測屬性的值。例如,如果 Bike Buyer 資料行有兩個可能的值:1 (是) 和 2 (否),您可以輸入 1 的值,為自行車買主評估此模型的精確度。
[!附註]
如果您不輸入值,[目標臨界值] 選項將無法使用,而且將會針對可預測屬性的所有可能值來評估此模型。
選擇性地針對 [目標臨界值] 輸入一個介於 0 和 1 之間的小數值,以指定要將預測算為精確時,所必須擁有的最小機率。
如需有關設定機率臨界值的詳細資訊,請參閱<交叉驗證報表 (Analysis Services - 資料採礦)>。
按一下 [取得結果]。
列印報表
在 [交叉驗證] 索引標籤上,以滑鼠右鍵按一下完成的報表。
在快速鍵功能表中,選取 [列印],或選取 [預覽列印] 先檢閱報表。
在 Microsoft Excel 中建立報表的複本
在 [交叉驗證] 索引標籤上,以滑鼠右鍵按一下完成的報表。
在快速鍵功能表中,選取 [全選]。
以滑鼠右鍵按一下選取的文字,然後選取 [複製]。
將選取範圍貼到開啟的 Excel 活頁簿中。如果您使用 [貼上] 選項,報表將會以 HTML 格式貼到 Excel 中,這樣會保留資料列和資料行的格式設定。如果您針對文字或 Unicode 文字使用 [選擇性貼上] 選項來貼上報表,報表將會使用資料列分隔的格式貼上。