PublicData 類別
定義公用數據的基類。
公用數據類別包含每個開放數據集的通用屬性和方法。
使用數據行初始化。
建構函式
PublicData(cols: List[str] | None, enable_telemetry: bool = True)
參數
| 名稱 | Description |
|---|---|
|
cols
必要
|
要擴充的數據行名稱清單。 |
|
enable_telemetry
|
指出是否要傳送遙測。 預設值: True
|
|
cols
必要
|
使用者想要擴充的數據行名稱清單 |
|
enable_telemetry
必要
|
是否要傳送遙測 |
方法
| get_enricher |
取得擴充器。 |
| to_pandas_dataframe |
Pandas 數據框架。 |
| to_spark_dataframe |
若要引發數據框架。 |
get_enricher
取得擴充器。
get_enricher()
to_pandas_dataframe
Pandas 數據框架。
to_pandas_dataframe()
to_spark_dataframe
若要引發數據框架。
to_spark_dataframe()
屬性
cols
取得要擷取的數據行名稱清單。
env
傳回運行時間環境。
id
取得開啟數據的位置標識碼。
registry_id
取得在後端註冊之此公用數據集的登錄標識碼。
Azure 會使用此登錄標識碼來取得最新的元數據,例如記憶體位置。 您應該預期所有公用數據子類別都會指派_registry_id。
傳回
| 類型 | Description |
|---|---|
|
登錄標識碼。 |
logger
logger = <Logger azureml.opendatasets (DEBUG)>
mandatory_columns
mandatory_columns = []