可以使用数据挖掘设计器的 “挖掘结构 ”选项卡设置或更改挖掘结构及其关联的列和嵌套表的属性。 在此选项卡中设置的属性将传播到与结构关联的每个挖掘模型。
注释
如果更改挖掘结构中任何属性的值(即使是名称或说明等元数据),则必须重新处理挖掘结构及其模型,然后才能查看或查询模型。
数据挖掘结构和数据挖掘结构列的属性
下表描述了挖掘结构和特定于数据挖掘的挖掘结构列的属性,以及可以在 “挖掘结构 ”选项卡中查看或配置的挖掘结构列。若要查看或配置这些属性,请右键单击树视图中的元素,然后单击“ 属性”。
若要查看结构的属性,请单击挖掘结构标题。
若要查看列或嵌套表的属性,请单击列名。
挖掘结构的属性
| 资产 | DESCRIPTION |
|---|---|
| CacheMode | 指定在训练完成后应缓存或丢弃训练中使用的事例。 注意:此属性必须设置为 KeepTrainingCases 才能启用钻取和保留功能。 |
| 排序规则 | 指定列的默认排序规则。 如果未指定排序规则,则使用服务器的排序规则。 |
| 说明 | 描述挖掘结构。 最佳做法是,说明应说明结构中数据的用途和构成。 |
| ErrorConfiguration (默认值) | 指定用于特殊处理错误(如果有)的选项。 |
| HoldoutMaxCases | 指定可以保留为测试数据集的最大结构事例数。 如果同时为 HoldoutMaxCases 和 HoldoutPercent 指定了值,则条件将组合在一起。 注意:若要设置此属性, CacheMode 必须设置为 KeepTrainingCases。 |
| HoldoutPercent | 指定要保留为测试数据集的结构事例的百分比。 如果同时为 HoldoutMaxCases 和 HoldoutPercent 指定了值,则条件将组合在一起。 注意:若要设置此属性, CacheMode 必须设置为 KeepTrainingCases。 |
| HoldoutSeed | 指定一个种子以初始化保留测试集的分区,确保可以重新创建测试数据集。 注意:若要设置此属性, CacheMode 必须设置为 KeepTrainingCases。 |
| ID | 显示挖掘结构的唯一标识符。 创建结构时为挖掘结构指定的名称将用作 ID。 如果以后通过键入属性的新值 Name 来更改名称,则新名称仅用作别名;ID 不会更改。 |
| 语言 | 指定挖掘结构中标题的语言。 |
Name |
指定挖掘结构的名称或别名。 如果更改 Name 属性的值,则新名称仅用作标题或别名;挖掘结构的标识符不会更改。 |
| 来源 | 显示数据源的名称和数据源的类型。 |
数据挖掘结构列的属性
| 资产 | DESCRIPTION |
|---|---|
| ClassifiedColumns | 标识分类列所指的列。 |
| 内容 | 该列的内容类型。 |
| 说明 | 描述列。 良好的实践是,在列说明中提供关于如何派生或更改其中的数据以进行数据挖掘的信息。 |
| DiscretizationBucketCount | 显示离散化列中的存储桶数。 只有在内容类型设置为 Discretized 时才启用。此属性为只读。 |
| 离散化方法 | 显示用于离散化列的方法。 仅当内容类型设置为 Discretized 时才启用。此属性为只读。 |
| 发运 | 指定列中内容的分布。 |
| ID | 显示列的标识符。 如果更改列的 Name 属性的值,则不会影响 ID 属性的值。 |
| IsKey | 指示列是否为键列。 |
| KeyColumns | 包含列的定义,该列作为某个属性的主键或部分主键。 |
| ModelingFlags | 设置算法提供的其他参数。 |
Name |
列的名称。 |
| NameColumn | 标识提供父元素名称的列。 |
| 来源 | 显示列的源。 对于关系数据源,该值始终为 “无”。 对于基于 OLAP 多维数据集的结构,该值是 MDX 语句,用于定义作为嵌套表来源的子集。 |
| SourceMeasureGroup | 显示度量值组的源。 对于关系数据源,该值始终为 “无”。 对于基于 OLAP 多维数据集的结构,该值是 MDX 语句,定义了用作嵌套表源的切片。 |
| 类型 | 列中内容的数据类型。 |
有关设置或更改属性的详细信息,请参阅 挖掘结构任务和操作指南。