Partilhar via


Funções janela no mapeamento de fluxos de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e no Azure Synapse Analytics. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

Este artigo fornece detalhes sobre as funções de janela suportadas pelo Azure Data Factory e pelo Azure Synapse Analytics no mapeamento de fluxos de dados.

Lista de funções da janela

As seguintes funções estão disponíveis apenas em transformações de janela.

Função janela Task
cumeDist Calcula a posição de um valor relativamente a todos os valores na partição. O resultado é o número de linhas anteriores ou iguais à linha atual na ordenação da partição dividido pelo número total de linhas na partição da janela. Quaisquer valores empatados na ordenação são avaliados para a mesma posição.
denseRank Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores não produzem lacunas na sequência. A denseRank função funciona mesmo quando os dados não estão organizados e procura alterações nos valores.
Atraso Obtém o valor do primeiro parâmetro avaliado n linhas antes da linha atual. O segundo parâmetro é o número de linhas a consultar para trás, e o valor padrão é 1. Se não houver tantas linhas, é devolvido um valor de null a menos que seja especificado um valor padrão.
Chumbo Obtém o valor do primeiro parâmetro avaliado n nas linhas após a linha atual. O segundo parâmetro é o número de linhas a avançar, e o valor padrão é 1. Se não houver tantas linhas, é devolvido um valor de null a menos que seja especificado um valor padrão.
nTile Divide as linhas de cada partição de janela em n baldes que variam de 1 até no máximo n. Os valores dos baldes diferem em no máximo 1. Se o número de linhas na partição não se dividir igualmente no número de baldes, os valores restantes são distribuídos um por balde, começando pelo primeiro balde. A NTile função é útil para o cálculo de tertiles, quartis, decilis e outras estatísticas resumidas comuns.

A função calcula duas variáveis durante a inicialização. O tamanho de um balde normal inclui uma fila adicional. Ambas as variáveis são baseadas no tamanho da partição atual. Durante o processo de cálculo, a função acompanha o número da linha atual, o número do compartimento atual e o número da linha em que o compartimento muda (bucketThreshold). Quando o número da linha atual atinge o limiar do balde, o valor do balde aumenta em uma unidade. O limiar aumenta com o tamanho do balde (mais um extra se o balde atual estiver acolchoado).
Posição Calcula a classificação de um valor em um grupo de valores especificados na ordem de uma janela por cláusula. O resultado é um mais o número de linhas anteriores ou iguais à linha atual na ordem da partição. Os valores produzem lacunas na sequência. A rank função funciona mesmo quando os dados não estão organizados e procura alterações nos valores.
número de linha Atribui uma numeração sequencial de linhas para linhas numa janela que começa por 1.