共用方式為


變更採礦模型中欄位的離散化處理

Analysis Services 會自動將值進行離散化,也就是說,在特定情況下,它會將數值列中的數據進行分箱。 例如,如果您的數據包含連續數值數據,而且您建立決策樹模型,則根據數據的分佈,連續數據的每一列都將自動分箱。 如果您想要控制數據的離散化方式,您必須變更採礦結構數據行上的屬性,以控制數據在模型中的使用方式。

如需如何在採礦模型中設定屬性的一般資訊,請參閱 採礦模型數據行

顯示採礦模型欄的屬性

  1. 在數據採礦設計師的 [ 採礦模型 ] 索引標籤中,以滑鼠右鍵按兩下包含採礦模型名稱的數據行標頭,或包含採礦演算法名稱之方格中的數據列,然後選取 [ 屬性]。

    [ 屬性 ] 視窗會顯示與整個採礦模型相關聯的屬性。

  2. 在螢幕靠左的 [結構] 欄中,點選包含您要離散化之連續數值數據的欄。

    [ 屬性 ] 視窗會變更為只顯示與該數據行相關聯的屬性。

變更離散化方法

  1. 在 [ 採礦屬性] 視窗中,按兩下 [內容] 旁的文字框,然後從下拉式清單中選取 Discretized

    DiscretizationBucketCountDiscretizationMethod 屬性現在已啟用。

  2. 在 [ 屬性 ] 視窗中,按兩下 旁邊的 DiscretizationMethod 文字框,然後選取下列其中一個值: AutomaticEqualAreasCluster

    備註

    如果資料行使用量設定為 Ignore,則數據行的 [屬性 ] 視窗是空白的。

    當您在設計工具中選取不同的元素時,新的值將會生效。

  3. 在 [ 屬性] 視窗中,按兩下旁邊的 DiscretizationBucketCount 文字框,然後輸入數值。

    備註

    如果您變更這些屬性,就必須重新處理 結構,以及您想要使用新設定的任何模型。

另請參閱

資料挖掘模型任務和操作指導