Partilhar via


hll_merge()

Aplica-se a: ✅Microsoft FabricAzure Data ExplorerAzure MonitorMicrosoft Sentinel

Mescla os resultados do HLL. Esta é a versão escalar da versão agregada hll_merge().

Leia sobre o algoritmo subjacente (HyperLogLog) e precisão de estimativa.

Importante

Os resultados de hll(), hll_if() e hll_merge() podem ser armazenados e posteriormente recuperados. Por exemplo, talvez você queira criar um resumo diário de usuários exclusivos, que pode ser usado para calcular contagens semanais. No entanto, a representação binária precisa desses resultados pode mudar ao longo do tempo. Não há garantia de que essas funções produzam resultados idênticos para entradas idênticas e, portanto, não aconselhamos confiar nelas.

Sintaxe

hll_merge( hll,hll2, [ hll3, ... ])

Saiba mais sobre convenções de sintaxe.

Parâmetros

Designação Tipo Necessário Descrição
hll, hll2, ... string ✔️ Os nomes das colunas que contêm valores HLL a serem mesclados. A função espera entre 2-64 argumentos.

Devoluções

Retorna um valor HLL. O valor é o resultado da fusão das colunas hll, hll2, ... hllN.

Exemplos

Este exemplo mostra o valor das colunas mescladas.

range x from 1 to 10 step 1 
| extend y = x + 10
| summarize hll_x = hll(x), hll_y = hll(y)
| project merged = hll_merge(hll_x, hll_y)
| project dcount_hll(merged)

Output

dcount_hll_merged
20

Precisão da estimativa

Esta função usa uma variante do algoritmo HyperLogLog (HLL), que faz uma estimativa estocástica da cardinalidade do conjunto. O algoritmo fornece um "botão" que pode ser usado para equilibrar a precisão e o tempo de execução por tamanho de memória:

Exatidão Erro (%) Contagem de entradas
0 1.6 212
1 0.8 214
2 0.4 216
3 0.28 217
4 0.2 218

Observação

A coluna "contagem de entradas" é o número de contadores de 1 byte na implementação HLL.

O algoritmo inclui algumas provisões para fazer uma contagem perfeita (erro zero), se a cardinalidade definida for pequena o suficiente:

  • Quando o nível de precisão é 1, 1000 valores são retornados
  • Quando o nível de precisão é 2, 8000 valores são retornados

O limite de erro é probabilístico, não um limite teórico. O valor é o desvio padrão da distribuição de erro (sigma), e 99,7% das estimativas terão um erro relativo inferior a 3 x sigma.

A imagem a seguir mostra a função de distribuição de probabilidade do erro relativo de estimativa, em porcentagens, para todas as configurações de precisão suportadas:

Gráfico mostrando a distribuição de erro hll.