共用方式為


kll_sketch_agg_bigint 聚合函數

適用於:勾選是 Databricks 執行環境 18.0 及以後版本

建立 KLL (K-Linear-Logarithmic) 草圖,以可配置的精度對整數資料進行近似分位數估計。

語法

kll_sketch_agg_bigint ( expr [, k] )

Arguments

  • expr:一個用於聚合的整數數值表達式。
  • k:用於控制草圖精確度的可選INTEGER參數。 必須介於8到65535之間。 預設值為 200。 較高的數值能提供更好的準確度,但會佔用更多記憶體。

退貨

包含 BINARY 序列化的 KLL 草圖,用於整數資料。

註釋

  • NULL expr 中的值在彙總時會被忽略。
  • 該草圖提供了近似分位數,信賴水準約為99%。
  • 草圖可合併,允許分散式聚合。
  • 記憶體使用量約為 O(k) 個項目,無論輸入大小如何。

範例

-- Create sketch with default k=200
> SELECT kll_sketch_agg_bigint(value) FROM VALUES (1), (2), (3), (4), (5) AS T(value)
  [binary data]

-- Create sketch with custom k=400 for higher accuracy
> SELECT kll_sketch_agg_bigint(value, 400) FROM VALUES (10), (20), (30) AS T(value)
  [binary data]