Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Função de agregação
Aplica-se a:
SQL do Databricks
Runtime do Databricks
Retorna o percentil aproximado de expr dentro do grupo. Essa função é um sinônimo para approx_percentile a função de agregação.
Sintaxe
percentile_approx ( [ALL | DISTINCT ] expr, percentile [, accuracy] ) [FILTER ( WHERE cond ) ]
Essa função também pode ser invocada como uma função de janela usando a cláusula OVER.
Argumentos
-
expr: uma expressão numérica. -
percentile: um literal numérico entre 0 e 1 ou uma matriz literal de valores numéricos, cada um entre 0 e 1. -
accuracy: um literal INTEGER maior que 0. Se a precisão for omitida, ela será definida como10000. -
cond: uma expressão booliana opcional que filtra as linhas usadas para agregação.
Retornos
A função de agregação retorna a expressão que é o menor valor no grupo ordenado (classificado do menor para o maior), de modo que não mais que percentile de expr valores seja menor ou igual a esse valor.
Se percentile for um percentile_approx de matriz, retornará a matriz percentil aproximada de expr no percentil especificado.
O parâmetro accuracy controla a precisão da aproximação no custo da memória.
O valor mais alto de precisão gera uma melhor precisão, 1.0/accuracy é o erro relativo da aproximação.
Se DISTINCT for especificado, a função só vai operar em um conjunto exclusivo de valores expr.
Exemplos
> SELECT percentile_approx(col, array(0.5, 0.4, 0.1), 100)
FROM VALUES (0), (1), (2), (10) AS tab(col);
[1,1,0]
> SELECT percentile_approx(col, 0.5, 100)
FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
9
> SELECT percentile_approx(DISTINCT col, 0.5, 100)
FROM VALUES (0), (6), (7), (9), (10), (10), (10) AS tab(col);
7