共用方式為


自訂及處理預測模型 (中繼資料採礦教學課程)

 

適用於: SQL Server 2016 Preview

Microsoft 時間序列演算法提供會影響模型建立方式以及時間資料分析方式的參數。 變更這些屬性會對採礦模型如何進行預測造成重大的影響。

在本教學課程的這項工作中,您將執行下列工作以修改模型:

  1. 您要自訂您的模型處理時間週期所加入的新值的方式 PERIODICITY_HINT 參數。

  2. 您將學習 Microsoft 時間序列演算法的兩個其他重要參數:FORECAST_METHOD 和 PREDICTION_SMOOTHING。前者讓您控制用於預測的方法,後者則讓您自訂長期和短期預測的混合。

  3. 您可以選擇告知演算法要如何計算遺漏值。

  4. 進行完所有變更之後,您將部署及處理模型。

設定時間序列參數

週期性提示

PERIODICITY_HINT 參數提供的演算法,您會看到資料中的其他時間週期的相關資訊。 根據預設,時間序列模型會嘗試自動在資料中偵測模式。 不過,如果您已經知道預期的時間循環,提供週期性提示可能會改進模型的精確度。 提供錯誤的週期性提示則可能會降低精確度;因此,如果您不確定應該使用哪個值,最好使用預設值。

例如,此模型所用的檢視每月會從 Adventure Works DW Multidimensional 2012 彙總銷售資料。 因此,模型所用的每個時間配量表示一個月,所有預測也是以月為單位。 因為一年有 12 個月,而且您預期的銷售型態增加或減少重複為期一年,您將設定 PERIODICITY_HINT 參數 12, ,以表示 12 個時間配量 (月) 構成一個完整的銷售循環。

預測方法

FORECAST_METHOD 參數會控制是否最佳化短期或長期預測的時間序列演算法。 根據預設, FORECAST_METHOD 參數設為 MIXED,表示兩個不同的演算法會混合並平衡短期和長期預測提供良好的結果。

但是,如果您知道要使用特定的演算法,可以將值變更為 ARIMA 或 ARTXP。

長期與短期預測加權

您也可以使用 PREDICTION_SMOOTHING 參數來自訂長期和短期預測的混合方式。 依預設,此參數設為 0.5,一般而言可以提供整體精確度的最佳平衡。

若要變更演算法參數

  1. 採礦模型 索引標籤上,以滑鼠右鍵按一下 預測, ,然後選取 設定演算法參數

  2. PERIODICITY_HINT 的資料列 演算法參數 對話方塊中,按一下 [ 資料行,然後輸入 {12}, ,包含大括號。

    根據預設,此演算法也會加入值 {1 }。

  3. FORECAST_METHOD 資料列中,確認 文字方塊為空白或設定要 混合。 如果已輸入不同的值,輸入 混合 ,將參數變更回預設值。

  4. PREDICTION_SMOOTHING 資料列中,確認 文字方塊為空白或設為 0.5。 如果已輸入不同的值,按一下 [ 和型別 0.5 ,將參數變更回預設值。

    注意


    PREDICTION_SMOOTHING 參數只適用於 SQL Server Enterprise。 因此,您無法在 SQL Server Standard 之中檢視或變更 PREDICTION_SMOOTHING 參數的值。 不過,預設行為是使用兩種演算法並且平均分配其權重。

  5. 按一下 [確定]

處理遺漏資料 (選擇性)

在許多情況下,您的銷售資料可能有填滿 Null 的間距,或可能有某分店錯過了報告期限,導致序列結尾處出現空白資料格。 在這種情況下,Analysis Services 會發出下列錯誤,而且不處理模型。

「 錯誤 (資料採礦)︰ 時間戳記並未同步處理的系列 , ,採礦模型的 。 所有時間序列都必須在同一個時間標示結束,且不能有任意遺漏資料點。 將 MISSING_VALUE_SUBSTITUTION 參數設定為 Previous 或數值常數,即可在適用時自動修補遺漏的資料點。」

若要避免這個錯誤,您可以指定 Analysis Services 使用下列任何一個方法,自動提供新值以填滿間距:

  • 使用平均值。 平均值是使用相同資料序列中的全部有效值來計算。

  • 使用上一個值。 您可以將多個遺漏的資料格取代為上一個值,但是不可以填入起始值。

  • 使用您套用的常數值。

若要指定以平均值填滿間距

  1. 採礦模型 索引標籤上,以滑鼠右鍵按一下 預測 欄位,然後選取 設定演算法參數

  2. 演算法參數 對話方塊中,於 MISSING_VALUE_SUBSTITUTION 資料列中,按一下 [ 資料行,然後輸入 表示

建立模型

若要使用模型,您必須將它部署至伺服器,然後透過演算法執行定型資料來處理模型。

若要處理預測模型

  1. 採礦模型 功能表 SQL Server Data Tools, ,請選取 處理採礦結構和所有模型

  2. 警告訊息,詢問您是否要建置和部署專案,按一下 [

  3. 處理採礦結構 – 預測 對話方塊中,按一下 [ 執行

    處理進度 對話方塊會開啟並顯示處理模型的相關資訊。 處理模型可能需要花一些時間。

  4. 處理完成後,按一下 [ 關閉 結束 處理進度 對話方塊。

  5. 按一下 [ 關閉 結束 處理採礦結構 – 預測 對話方塊。

本課程的下一項工作

探索預測模型 #40; 中繼資料採礦教學課程 )

另請參閱

Microsoft 時間序列演算法技術參考
Microsoft 時間序列演算法
處理需求和考量 (資料採礦)