Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função de agregação
Aplica-se a:
SQL do Databricks
Databricks Runtime 13.3 LTS e superior
Retorna o bitwise OR de todos os valores nas posições de bits entre 0 e 32767 em um grupo como um BINARY.
A função é comumente usada para contar o número de um conjunto denso de números integrais distintos em combinação com as funções bitmap_bucket_number(), bitmap_count() e bitmap_bit_position().
Para agregar bitmaps em forma de numéricos integrais, use a função de agregação bit_or().
Sintaxe
bitmap_construct_agg(expr) [FILTER ( WHERE cond ) ]
Essa função também pode ser invocada como uma função de janela usando a cláusula OVER.
Argumentos
-
expr: uma expressão numérica integral entre 0 e 32767 que representa uma posição de bit em uma cadeia de caracteresBINARY. -
cond: uma expressão booliana opcional que filtra as linhas usadas para agregação.
Retornos
Um BINARY de comprimento 4096.
Exemplos
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(0) AS T(val);
01
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val))) FROM VALUES(15) AS T(val);
0080
> SELECT hex(trim(TRAILING X'00' FROM bitmap_construct_agg(val)))
FROM VALUES(1), (3), (7), (15), (31) AS T(val);
8A800080
-- Count the number of distinct values
> SELECT sum(num_distinct) AS num_distinct
FROM (SELECT bitmap_bucket_number(val),
bitmap_count(bitmap_construct_agg(bitmap_bit_position(val)))
FROM VALUES(1), (2), (1), (-1), (5), (0), (5) AS t(val)
GROUP BY ALL) AS distinct_vals_by_bucket(bucket, num_distinct)
5