LocationClosestSelector 類別
使用最接近球面距離的準則,定義客戶數據的聯結與公用數據。
使用位置粒度初始化。
建構函式
LocationClosestSelector(_granularity: LocationClosestGranularity, enable_telemetry: bool = True)
參數
| 名稱 | Description |
|---|---|
|
_granularity
必要
|
用於聯結數據的位置粒度。 |
|
enable_telemetry
|
指出是否要啟用遙測。 預設值: True
|
備註
靜態方法 process(self, env, customer_data, public_data, aggregator, join_keys, debug) 是用來根據這個選取器來聯結數據,其中:
customer_data是 azureml.opendatasets.accessories.location_data的實例。LocationDatapublic_data是 azureml.opendatasets.accessories.location_data的實例。LocationDataaggregator是 azureml.opendatasets.aggregators.aggregator.Aggregator 之一join_keys是聯結金鑰組的清單debug指出是否要列印偵錯記錄。
這個方法會傳回的 Tuple:已改變的客戶數據類別實例、改變的公用數據類別實例,以及聯結密鑰組的清單。
方法
| process |
使用指定的匯總工具聯結客戶數據和公用數據。 |
process
使用指定的匯總工具聯結客戶數據和公用數據。
process(env: SparkEnv | PandasEnv, customer_data: LocationData, public_data: LocationData, aggregator: Aggregator, join_keys: list, debug: bool)
參數
| 名稱 | Description |
|---|---|
|
env
必要
|
運行時間環境。 |
|
customer_data
必要
|
LocationData 衍生類別的實例。 |
|
public_data
必要
|
LocationData 衍生類別的實例。 |
|
aggregator
必要
|
匯總工具。 |
|
join_keys
必要
|
聯結金鑰組的清單。 |
|
debug
必要
|
指出是否要列印偵錯記錄。 |
傳回
| 類型 | Description |
|---|---|
|
Tuple:已改變的客戶數據類別實例、已改變的公用數據類別實例,以及聯結密鑰組的清單。 |