變更採礦模型中欄位的離散化處理

Analysis Services 會自動將值進行離散化，也就是說，在特定情況下，它會將數值列中的數據進行分箱。例如，如果您的數據包含連續數值數據，而且您建立決策樹模型，則根據數據的分佈，連續數據的每一列都將自動分箱。如果您想要控制數據的離散化方式，您必須變更採礦結構數據行上的屬性，以控制數據在模型中的使用方式。

如需如何在採礦模型中設定屬性的一般資訊，請參閱採礦模型數據行。

顯示採礦模型欄的屬性

在數據採礦設計師的 [ 採礦模型 ] 索引標籤中，以滑鼠右鍵按兩下包含採礦模型名稱的數據行標頭，或包含採礦演算法名稱之方格中的數據列，然後選取 [ 屬性]。

[ 屬性 ] 視窗會顯示與整個採礦模型相關聯的屬性。
在螢幕靠左的 [結構] 欄中，點選包含您要離散化之連續數值數據的欄。

[ 屬性 ] 視窗會變更為只顯示與該數據行相關聯的屬性。

變更離散化方法

在 [ 採礦屬性] 視窗中，按兩下 [內容] 旁的文字框，然後從下拉式清單中選取 Discretized 。

和 DiscretizationBucketCount DiscretizationMethod 屬性現在已啟用。
在 [ 屬性 ] 視窗中，按兩下旁邊的 DiscretizationMethod 文字框，然後選取下列其中一個值： Automatic、 EqualAreas或 Cluster。

備註

如果資料行使用量設定為 Ignore，則數據行的 [屬性 ] 視窗是空白的。

當您在設計工具中選取不同的元素時，新的值將會生效。
在 [ 屬性] 視窗中，按兩下旁邊的 DiscretizationBucketCount 文字框，然後輸入數值。

備註

如果您變更這些屬性，就必須重新處理結構，以及您想要使用新設定的任何模型。

另請參閱

資料挖掘模型任務和操作指導

Last updated on 2017-06-13