共用方式為


值包含概要請求選項(資料探勘任務)

使用 [配置檔要求] 頁面的 [要求屬性] 窗格,設定要求窗格中所選取的 [值包含配置檔要求] 的選項。 值整合設定檔會計算兩個數據行或一組數據行之間的值重複部分。 因此,它也可以判斷數據行或一組數據行是否適合做為所選數據表之間的外鍵。 此設定檔也可協助您識別數據中的問題,例如無效的值。 例如,您可以使用值包含分析來分析 Sales 資料表中的 ProductID 資料行。 分析結果發現該數據列包含的值在 Products 表中的 ProductID 列中找不到。

備註

本主題所述的選項會出現在數據分析工作編輯器的 [配置檔要求] 頁面上。 如需編輯器此頁面的詳細資訊,請參閱數據分析工作編輯器(配置檔要求頁面)。

如需如何使用數據分析工作的詳細資訊,請參閱 設定數據分析工作。 如需如何使用數據配置檔查看器來分析數據分析工作的輸出的詳細資訊,請參閱 數據配置檔查看器

瞭解 InclusionColumns 屬性的數據行選取範圍

值包含概況請求會計算子集中的所有值是否存在於超集。 超集通常是查閱或參考數據表。 例如,地址數據表中的狀態數據行是子集數據表。 此數據行中的每個雙字元狀態代碼也應該位於美國郵政服務狀態代碼的數據表中,也就是超集數據表。

當您使用 \ 通配符做為子集數據行或超集數據行的值時,數據分析工作會將該端的每一個數據行與另一端指定的數據行進行比較。

備註

如果您選取 \,此選項可能會導致大量的計算,並降低工作的效能。

了解臨界值設定

您可以使用兩個不同的臨界值設定來優化值包含設定檔請求的輸出。

當您為 InclusionThresholdSetting 指定 None 以外的值時,配置檔只會在下列其中一個條件下報告超集中子集的包含強度:

  • 當包含強度超過 InclusionStrengthThreshold 中指定的臨界值時。

  • 當包含強度的值為 1.0 且 InclusionStrengthThreshold 設定為 Exact 時。

您可以透過篩選掉在超集表中作為索引鍵不合適的組合(因為具有非唯一值),來進一步精緻化輸出。 當您為 SupersetColumnsKeyThresholdSetting 指定 None 以外的值時,配置檔只會在下列其中一個條件下報告超集中子集的包含強度:

  • 當超集數據表中超集數據行作為索引鍵的適用性超過 SupersetColumnsKeyThreshold 中指定的臨界值時

  • 當包含強度具有值或 1.0 且 SupersetColumnsKeyThreshold 設定為 Exact 時。

請求屬性選項

針對值包含剖面文件請求請求屬性窗格會顯示下列選項群組:

  • 數據,其中包含 SubsetTableOrViewSupersetTableOrViewIncludeColumns 選項

  • 一般

  • 選項

數據選項

ConnectionManager
選取使用 .NET Data Provider for SQL Server (SqlClient) 的現有 ADO.NET 連接管理員,以連線到包含要分析之數據表或檢視表的 SQL Server 資料庫。

SubsetTableOrView
選取要分析的現有數據表或檢視表。

如需詳細資訊,請參閱本主題中的一節。

SupersetTableOrView
請選擇要分析的現有資料表或視圖。

如需詳細資訊,請參閱本主題中的一節。

InclusionColumns
從子集和超集數據表中選取數據行或數據行集合。

如需詳細資訊,請參閱本主題中的「瞭解 InclusionColumns 屬性的欄位選擇」和「InclusionColumns 選項」一節。

SubsetTableOrView 和 SupersetTableOrView 選項

架構
指定所選取資料表所屬的架構。 此選項是唯讀的。

TableOrView
顯示選取資料表的名稱。 此選項是唯讀的。

InclusionColumns 選項

為分析選取的每個欄位集合提供下列選項於InclusionColumns中。

如需詳細資訊,請參閱本主題稍早的<瞭解 InclusionColumns 屬性的數據行選取範圍>一節。

IsWildcard
指定是否已選取萬用字元(*)。 如果您已選取 (*) 來分析所有欄位,此選項會設定為 True。 如果您已選取要分析的個別數據行,則為 False 。 此選項是唯讀的。

ColumnName
顯示所選取資料行的名稱。 如果您已選取 \ 來分析所有資料行,此選項會是空白的。 此選項是唯讀的。

StringCompareOptions
選取比較字串值的選項。 這個屬性具有下表中所列的選項。 此選項的預設值為 Default

備註

當您使用 (*) 通配符ColumnName時,CompareOptions 是只讀的,而且設定為 Default 設定。

價值觀 說明
預設值 根據源數據表中的數據行定序來排序和比較數據。
BinarySort 根據針對每個字元定義的位模式來排序和比較數據。 二進位排序順序區分大小寫和重音。 二進位也是最快的排序順序。
DictionarySort 根據關聯語言或字母字典中所定義的排序和比較規則來排序和比較數據。

如果您選取 [DictionarySort],也可以選取下表所列選項的任何組合。 根據預設,不會選取這些其他選項。

價值觀 說明
IgnoreCase 指定比較是否區分大寫和小寫字母。 如果設定此選項,字串比較會忽略大小寫。 例如,“ABC” 會變得與 “abc” 相同。
IgnoreNonSpace 指定比較是否區分間距字元和變音符號。 如果已設定此選項,比較會忽略變音符號。 例如,“å” 等於 “a”。
IgnoreKanaType 是否在比較時區分兩種類型的日文字母:平假名和片假名。 如果設定此選項,字串比較會忽略假名類型。
IgnoreWidth 指定比較是否區分單一位元組字元和以雙位元組字元表示的相同字元。 如果設定此選項,則字串比較會將相同字元的單一位元組和雙位元組表示視為相同。

一般選項

RequestID
輸入描述性名稱,以識別此設定檔要求。 一般而言,您不需要變更自動產生的值。

選項

InclusionThresholdSetting
選取臨界值設定以優化設定檔的輸出。 此屬性的預設值為 Specified。 如需詳細資訊,請參閱本主題稍早的一節「了解門檻設定」。

價值觀 說明
沒有 未指定臨界值。 不論其價值如何,仍會報告其關鍵的強度。
已指定 使用 InclusionStrengthThreshold 中指定的臨界值。 只有在大於臨界值時,才會報告包含強度。
精確 未指定臨界值。 只有在子集值完全包含在 upserset 值中時,才會報告包含強度。

InclusionStrengthThreshold
定義臨界值,使用介於 0 到 1 之間的值,此範圍之上的包含強度應該被報告。 此屬性的預設值為 0.95。 只有在選取 [指定 ] 做為 InclusionThresholdSetting 時,才會啟用此選項。

如需詳細資訊,請參閱本主題稍早的一節,"了解閾值設定"。

SupersetColumnsKeyThresholdSetting
指定超集臨界值。 此屬性的預設值為 Specified。 如需詳細資訊,請參閱本主題稍早的“了解閾值設定”一節。

價值觀 說明
沒有 未指定臨界值。 不論超集欄位的關鍵強度如何,都會報告包含強度。
已指定 使用 SupersetColumnsKeyThreshold 中指定的臨界值。 只有在超集數據行的關鍵強度大於臨界值時,才會報告包含強度。
精確 未指定臨界值。 只有當 supserset 數據行是超集數據表中的確切索引鍵時,才會報告包含強度。

SupersetColumnsKeyThreshold
指定臨界值(介於 0 到 1 之間的值),超過臨界值時應報告包含強度。 此屬性的預設值為 0.95。 當 指定 被選為 SupersetColumnsKeyThresholdSetting 時,此選項才會被啟用。

如需詳細資訊,請參閱本主題稍早的一節「瞭解閾值設置」。

最大违规次数
指定要在輸出中報告的最大包含違規數目。 這個屬性的預設值為 100。 當 Exact 選取為 InclusionThresholdSetting 時,會停用此選項。

另請參閱

資料分析工作編輯器 (一般頁面)
單一資料表快速分析表單 (資料分析工作)