數據列取樣轉換可用來取得輸入數據集的隨機選取子集。 您可以指定輸出樣本的確切大小,並指定隨機數產生器的種子。
有許多應用程式可用於隨機取樣。 例如,想要隨機選取 50 名員工,以在彩票中接收獎品的公司,可以使用員工資料庫中的數據列取樣轉換來產生確切的優勝者數目。
數據列取樣轉換在套件開發期間也很有用,可用來建立小型但代表性的數據集。 您可以使用豐富的代表性數據來測試套件執行和數據轉換,但更快速地,因為會使用隨機樣本,而不是完整的數據集。 由於測試套件所使用的範例數據集大小一律相同,因此使用範例子集也可讓您更輕鬆地識別封裝中的效能問題。
此轉換類似於百分比取樣轉換,它會選取輸入數據列的百分比來建立取樣數據集。 請參閱 百分比取樣轉換。
設定數據列取樣轉換
數據列取樣轉換會選取指定的轉換輸入數據列數目來建立範例數據集。 由於從轉換輸入選取數據列是隨機的,因此結果樣本代表輸入。 您也可以指定隨機數產生器所使用的種子,以影響轉換選取數據列的方式。
在相同的轉換輸入上使用相同的隨機種子總是會建立相同的樣本輸出。 如果未指定任何種子,轉換會使用作業系統的時間刻度計數來建立隨機數。 因此,您可以在測試期間使用相同的種子,在封裝開發和測試期間驗證轉換結果,然後在封裝移至生產環境時變更為隨機種子。
數據列取樣轉換包含 SamplingValue 自定義屬性。 載入封裝時,可以透過屬性表達式來更新這個屬性。 如需詳細資訊,請參閱 Integration Services (SSIS) 運算式、在套件中使用屬性運算式和轉換自訂屬性。
此轉換有一個輸入和兩個輸出。 它沒有錯誤輸出。
您可以透過 SSIS 設計師或以程式設計方式設定屬性。
如需您可以在 [數據列取樣轉換編輯器] 對話框中設定之屬性的詳細資訊,請參閱數據列取樣轉換編輯器(取樣頁面)。
[進階編輯器] 對話方塊會反映能以程式設計的方式設定之屬性。 如需有關可以在 [進階編輯器] 對話方塊中或以程式設計方式設定之屬性的詳細資訊,請按下列其中一個主題: