共用方式為


詞彙擷取轉換編輯器 (進階索引標籤)

使用 [詞彙擷取轉換編輯器] 對話方塊的 [進階] 索引卷標來指定擷取的屬性,例如頻率、長度,以及是否擷取單字或詞組。

若要深入瞭解詞彙擷取轉換,請參閱 詞彙擷取轉換

選項

名詞
指定轉換只會擷取個別名詞。

名詞片語
指定轉換只會擷取名詞片語。

名詞和名詞詞組
指定轉換會擷取名詞和名詞詞組。

頻率
指出分數代表字詞的頻率。

TFIDF
指定分數是字詞的 TFIDF 值。 TFIDF 分數是詞頻和文檔頻率反比的乘積,定義為:詞 T 的 TFIDF = (T 的頻率) * log(輸入中的 #rows / 包含 T 的 #rows)

頻率臨界值
指定單字或片語必須出現多少次才可以擷取。 預設值為 2。

字詞長度上限
以單字指定片語的最大長度。 此選項只會影響名詞詞組。 預設值為 12。

使用區分大小寫的詞彙擷取
指定是否要讓擷取區分大小寫。 預設值為 False

設定錯誤輸出
使用 [ 設定錯誤輸出 ] 對話框來指定造成錯誤之數據列的錯誤處理。

另請參閱

Integration Services 錯誤和訊息參考
詞彙擷取轉換編輯器(詞彙擷取索引標籤)
詞彙擷取轉換編輯器 (排除索引標籤)
詞彙查找轉換