測試和驗證模型是數據採礦程式中的重要步驟。 在將模型部署到生產環境之前,您必須先知道採礦模型對實際數據執行得有多好。
數據採礦載入巨集包含的工具可協助您測試您所建置的模型,以及使用模型建立預測和建議。
精確度圖表
精確度圖表精靈可協助您建立預測查詢,並藉由建立增益圖或散佈圖來評估數據採礦模型的效能。 增益圖有助於區分結構中幾乎相同的模型,以協助您判斷哪一個模型提供最佳預測。
分類矩陣
分類矩陣精靈可協助您建立預測查詢,以評估分類模型的效能。 輸出是一個圖表,其摘要說明模型的準確和不正確預測。 矩陣是一個有價值的工具,因為它不僅顯示模型正確預測一個值的頻率,還顯示模型最常錯誤預測哪些值。
收益圖
利潤圖表精靈可協助您權衡使用數據採礦模型的優點,並評估偽陽性和偽陰性的成本
此圖表類型會測量模型的預測精確度,併入您指定的單位和整體成本。
交叉驗證
交叉驗證是在數據採礦社群中建立的技術,可用來評估數據集的有效性,以及該數據集上採礦模型的精確度。 它會將一組數據分割成子集,然後反覆地在每個子集上建立、定型和測試模型。
交叉驗證精靈可讓您指定要分割數據的折疊數目,然後提供交叉驗證報告,以統計方式描述這些交叉區段之間的差異。 您可以從此判斷模型對所有訓練數據的表現是否良好,或可能偏向某個特定子集。
查詢精靈
[ 查詢 精靈] 是一種互動式工具,可協助您建置預測查詢。 查詢是您產生建議、未來預測等等的方式。
在 [ 查詢 精靈] 中,您可以挑選模型,然後提供輸入數據做為單一值,或從數據表或範圍提供輸入數據,而精靈可協助您選取要輸出的數據行。 您也可以將函式新增至查詢,以產生機率分數和其他有用的統計數據。
進階查詢編輯器
進 階查詢編輯器 是一組互動式對話框,可協助您建置各種 DMX 語句,從執行自定義查詢到建立和定型新模型、刪除模型或建立新的數據集。