適用於:
Databricks 執行環境 18.0 及以後版本
建立 KLL (K-Linear-Logarithmic) 草圖,以可配置的精度對整數資料進行近似分位數估計。
語法
kll_sketch_agg_bigint ( expr [, k] )
Arguments
-
expr:一個用於聚合的整數數值表達式。 -
k:用於控制草圖精確度的可選INTEGER參數。 必須介於8到65535之間。 預設值為 200。 較高的數值能提供更好的準確度,但會佔用更多記憶體。
退貨
包含 BINARY 序列化的 KLL 草圖,用於整數資料。
註釋
-
NULLexpr 中的值在彙總時會被忽略。 - 該草圖提供了近似分位數,信賴水準約為99%。
- 草圖可合併,允許分散式聚合。
- 記憶體使用量約為 O(k) 個項目,無論輸入大小如何。
範例
-- Create sketch with default k=200
> SELECT kll_sketch_agg_bigint(value) FROM VALUES (1), (2), (3), (4), (5) AS T(value)
[binary data]
-- Create sketch with custom k=400 for higher accuracy
> SELECT kll_sketch_agg_bigint(value, 400) FROM VALUES (10), (20), (30) AS T(value)
[binary data]