Compartilhar via


Funções de agregação em fluxos de dados de mapeamento

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise completa para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis em pipelines do Azure Data Factory e pipelines do Azure Synapse Analytics. Este artigo se aplica ao fluxo de dados de mapeamento. Se você for novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Este artigo fornece detalhes sobre as funções de agregação com suporte do Azure Data Factory e do Azure Synapse Analytics no mapeamento de fluxos de dados.

Somente lista de funções

As funções a seguir estão disponíveis somente em transformações agregadas, dinâmicas, não dinâmicas e de janela.

Função de agregação Tarefa
approxDistinctCount Obtém a contagem de agregação aproximada de valores distintos para uma coluna. O segundo parâmetro opcional é controlar o erro de estimativa.
avg Obtém a média dos valores de uma coluna.
avgIf Obtém a média de valores de uma coluna, com base em critérios.
collect Coleta todos os valores da expressão no grupo agregado em uma matriz. Durante esse processo, você pode coletar e transformar estruturas em estruturas alternativas. O número de itens é igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens coletados deve ser pequeno.
collectUnique Coleta todos os valores da expressão no grupo agregado em uma matriz exclusiva. Durante esse processo, você pode coletar e transformar estruturas em estruturas alternativas. O número de itens é menor ou igual ao número de linhas nesse grupo e pode conter valores nulos. O número de itens coletados deve ser pequeno.
contagem Obtém a contagem agregada de valores. Se as colunas opcionais forem especificadas, ignorará NULL valores na contagem.
countAll Obtém a contagem agregada de valores, incluindo NULL.
countDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas.
countAllDistinct Obtém a contagem agregada de valores distintos de um conjunto de colunas, incluindo os valores NULL.
countIf Obtém a contagem agregada de valores, com base nos critérios. Se a coluna opcional for especificada, valores NULL serão ignorados na contagem.
covariancePopulation Obtém a covariância de população entre duas colunas.
covariancePopulationIf Obtém a covariância populacional de duas colunas, com base em critérios.
covarianceSample Obtém a covariância de amostra de duas colunas.
covarianceSampleIf Obtém a covariância amostral de duas colunas, com base em critérios.
first Obtém o primeiro valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se "falso".
isDistinct Localiza se uma coluna ou conjunto de colunas for diferente. Ele não conta nulo como um valor distinto.
kurtosis Obtém a curtose de uma coluna.
kurtosisIf Obtém a curtose de uma coluna com base em critérios.
last Obtém o último valor de um grupo de colunas. Se o segundo parâmetro ignoreNulls for omitido, assume-se falso.
max Obtém o valor máximo de uma coluna.
maxIf Obtém o valor máximo de uma coluna, com base nos critérios.
média Obtém a média dos valores de uma coluna. O mesmo que AVG.
meanIf Obtém a média dos valores de uma coluna, com base em critérios. O mesmo que avgIf.
min Obtém o valor mínimo de uma coluna.
minIf Obtém o valor mínimo de uma coluna, com base nos critérios.
skewness Obtém a distorção de uma coluna.
skewnessIf Obtém a distorção de uma coluna, com base em critérios.
stddev Obtém o desvio padrão de uma coluna.
stddevIf Obtém o desvio padrão de uma coluna, com base em critérios.
stddevPopulation Obtém o desvio padrão de população de uma coluna.
stddevPopulationIf Obtém o desvio padrão de população de uma coluna, com base em critérios.
stddevSample Obtém o desvio padrão de amostra de uma coluna.
stddevSampleIf Obtém o desvio padrão de exemplo de uma coluna, com base nos critérios.
sum Obtém a soma agregada de uma coluna numérica.
sumDistinct Obtém a soma agregada de valores distintos de uma coluna numérica.
sumDistinctIf Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
sumIf Obtém a soma agregada de uma coluna numérica, com base nos critérios. A condição pode ser baseada em qualquer coluna.
topN Obtém os principais N valores desta coluna.
variance Obtém a variação de uma coluna.
varianceIf Obtém a variação de uma coluna, com base em critérios.
variancePopulation Obtém a variação de população de uma coluna.
variancePopulationIf Obtém a variação da população de uma coluna, com base em critérios.
varianceSample Obtém a variação não polarizada de uma coluna.
varianceSampleIf Obtém a variação imparcial de uma coluna, com base em critérios.