共用方式為


探索撥接中心模型 (中繼資料採礦教學課程)

 

適用於: SQL Server 2016 Preview

現在您已經建立了探勘模型,您可以使用 SQL Server Data Tools (SSDT) 所提供的下列工具深入了解您的資料。

  • Microsoft 類神經網路檢視器**:** 這個檢視器可用於 採礦模型檢視器 ] 索引標籤的資料採礦設計師,旨在協助您試驗資料中的互動性。

  • Microsoft 一般內容樹狀檢視器**:** 這個標準的檢視器提供深入的詳細資料的模式和統計資料的演算法產生時,發現此模型。

Microsoft 類神經網路檢視器

檢視器有三個窗格︰ 輸入, ,輸出, ,和 變數

使用 輸出 ] 窗格中,您可以選取不同的可預測屬性或相依變數的值。 如果您的模型包含多個可預測屬性,您可以選取該屬性從 輸出屬性 清單。

變數 窗格會比較兩個選擇方面提供之屬性或變數的結果。 彩色列以視覺方式表示變數影響目標結果的強度。 您也可以檢視變數的增益分數。 增益分數會根據您所使用的採礦模型類型而有不同的計算方式,但在使用此屬性進行預測時,通常會告訴您模型的增進部分。

輸入 窗格可讓您將影響因數加入嘗試各種假設狀況模型。

使用輸出窗格

在此初始模型中,您可能有興趣想要查看各種因數如何影響服務等級。 若要這樣做,您可以從輸出屬性的清單中選取服務等級,然後從下拉式清單中選取範圍,藉以比較不同的服務等級 值 1值 2

若要比較最低和最高的服務等級
  1. 值 1, ,選取具有最低值的範圍。 例如,範圍 0-0-0.7 表示最低的放棄率,因此是最佳的服務等級。

    注意


    在此範圍中的實際值可能會隨著您設定模型的方式而有所不同。

  2. 值 2, ,選取具有最高值範圍。 例如,值為 >=0.12 的範圍表示最高的放棄率,因此是最差的服務等級。 換句話說,在此排班期間打電話的客戶之中,有 12% 的客戶在與服務人員通話前,就會掛斷電話。

    內容 變數 窗格會更新並比較影響結果值的屬性。 因此,左側資料行會顯示與最佳服務等級相關聯的屬性,而右側資料行則顯示與最差服務等級相關聯的屬性。

使用變數窗格

在此模型中,它會出現, 每個問題的平均時間 是重要的因素。 此變數表示回應通話所需的平均時間,無論通話類型為何。

若要檢視與複製屬性的機率和增益分數
  1. 變數 ] 窗格中,滑鼠停留在第一個資料列的彩色列。

    這個彩色的列會顯示如何強 每個問題的平均時間 影響服務等級。 工具提示會針對變數和目標結果的每個組合,顯示整體分數、機率,以及增益分數。

  2. 變數 ] 窗格中,以滑鼠右鍵按一下任何彩色列,然後選取 複製

  3. 在 Excel 工作表,以滑鼠右鍵按一下任何資料格,然後選取 貼上

    此報表就會貼上為 HTML 表格,並僅顯示每列的分數。

  4. 在不同的 Excel 工作表,以滑鼠右鍵按一下任何資料格,然後選取

    此報表會以文字格式貼上,並包含下節所描述的相關統計資料。

使用輸入窗格

假設您有興趣查看特定因數的效果,例如排班或操作員數目。 您可以使用,以選取特定變數 輸入 ] 窗格中,而 變數 窗格會自動更新來比較兩個先前選取的群組提供指定的變數。

若要變更輸入屬性來檢閱對於服務等級的效果
  1. 輸入 ] 窗格中,如 屬性, ,選取 [排班。

  2. , ,請選取 上午

    變數 窗格會更新以顯示時排班為模型的影響 上午。 其他所有選項則維持相同,也就是說,您仍是比較最低和最高服務等級。

  3. , ,請選取 PM1

    變數 窗格會更新以顯示時排班變更模型的影響。

  4. 輸入 ] 窗格中,按一下 [下一個空白列於下的 屬性, ,然後選取 [通話。 如 , ,選取範圍,指出呼叫的最大數目。

    新的輸入條件就會加入至清單中。 變數 窗格會更新以顯示時呼叫的磁碟區是最高的特定排班之模型的影響。

  5. 繼續變更 [排班] 和 [通話] 的值,以尋找排班、通話量,以及服務等級之間任何有趣的相互關聯。

    注意


    若要清除 輸入 窗格並讓您可以使用不同的屬性,請按一下 重新整理檢視器內容

解譯檢視器中所提供的統計資料

較長的等待時間是一項代表高放棄率的準確預測指標,同時也意味著較差的服務等級。 這似乎是一個明顯的結論,不過,採礦模型會提供您一些額外的統計資料以協助您解譯這些趨勢。

  • 分數︰ 值,指出此變數對於區別不同結果的整體重要性。 分數越高,表示變數對於結果的效果越強。

  • 值 1 的機率︰ 表示此值,此結果的機率百分比。

  • 值 2 的機率︰ 表示此值,此結果的機率百分比。

  • 值 1 的增益值 2 的增益︰ 分數表示使用這個特定變數來預測值 1] 和 [值 2 結果的影響。 分數越高,表示變數越能預測結果。

下表包含最重要之影響因數的一些範例值。 例如, 值 1 的機率 為 60.6%和 值 2 的機率 為 8.30%,也就是說,當每個問題的平均時間是 44-70 分鐘的時間範圍內,60.6%的案例中具有最高的服務等級 (值 1),shift 而 8.30%的案例是班差服務等級 (值 2) 中。

從這個資訊中,您可以得到一些結論。 較短的通話回應時間 (範圍是 44-70) 對於較佳的服務等級 (範圍是 0.00-0.07) 有強大的影響。 此分數 (92.35) 表示這個變數非常重要。

不過,當您向下查看影響的因數清單時,可以看到一些其他的因數,以及比較不容易理解也比較難解譯的效果。 例如,排班似乎會影響服務,但是增益分數和相對機率卻指出排班不是主要的因數。

Attribute Value 喜好 < 0.07 喜好 >= 0.12
每個問題的平均時間 89.087 - 120.000 分數︰ 100

Value1 的機率︰ 4.45%

機率 Value2: 51.94%

Value1 的增益︰ 0.19

Value2 的增益︰ 1.94
每個問題的平均時間 44.000 - 70.597 分數:92.35

值 1 的機率:60.06 %

值 2 的機率:8.30 %

值 1 的增益:2.61

值 2 的增益:0.31

回到頁首

Microsoft 一般內容樹狀檢視器

此檢視器可用於在處理模型時,檢視由演算法所建立的更詳細資訊。 MicrosoftGeneric 內容樹狀檢視器 採礦模型表示為一系列節點,其中每個節點代表所學習到有關定型資料的知識。 此檢視器可以搭配所有模型使用,但是節點的內容會隨著模型類型而有所不同。

類神經網路模型或羅吉斯迴歸模型,您可能會發現 臨界統計資料節點 特別有用。 此節點包含關於資料中值分佈的衍生統計資料。 如果您想要得到資料的摘要,但是不想撰寫許多 T-SQL 查詢,此資訊就非常有幫助。 在前一個主題中分類收納值的圖表便是衍生自臨界統計資料節點。

若要從採礦模型取得資料值的摘要

  1. 在 [資料採礦設計工具中 採礦模型檢視器 索引標籤上,選取 。

  2. 檢視器 清單中,選取 Microsoft 一般內容樹狀檢視器

    採礦模型的檢視會重新整理,在左窗格中顯示節點階層,並在右窗格中顯示 HTML 表格。

  3. 節點標題 ] 窗格中,按一下名稱為 10000000000000000 的節點。

    模型中任何最頂部的節點永遠是模型根節點。 在類神經網路或羅吉斯迴歸模型中,位於該節點正下方的節點是臨界統計資料節點。

  4. 節點詳細資料 ] 窗格中,向下捲動直到您找到資料列 NODE_DISTRIBUTION。

  5. 向下捲動到 NODE_DISTRIBUTION 資料表以檢視如類神經網路演算法所計算的值分佈。

若要在報表中使用這個資料,您可以選取然後複製特定資料列的資訊,或者也可以使用下列資料採礦延伸模組 (DMX) 查詢來擷取節點的完整內容。

SELECT *   
FROM [Call Center EQ4].CONTENT  
WHERE NODE_NAME = '10000000000000000'  

您也可以使用 NODE_DISTRIBUTION 資料表中的節點階層與詳細資料來周遊類神經網路中的個別路徑,並檢視隱藏層的統計資料。 如需詳細資訊,請參閱 類神經網路模型查詢範例

回到頁首

本課程的下一項工作

將羅吉斯迴歸模型加入到撥接中心結構 #40; 中繼資料採礦教學課程 )

另請參閱

類神經網路模型的採礦模型內容 (Analysis Services - 資料採礦)
類神經網路模型查詢範例
Microsoft 類神經網路演算法技術參考
變更採礦模型中的資料行離散化