Partilhar via


Transformação de janela no mapeamento do fluxo de dados

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange tudo, desde a movimentação de dados até ciência de dados, análises em tempo real, business intelligence e relatórios. Saiba como iniciar uma nova avaliação gratuitamente!

Os fluxos de dados estão disponíveis nos pipelines do Azure Data Factory e no Azure Synapse Analytics. Este artigo aplica-se ao mapeamento de fluxos de dados. Se você é novo em transformações, consulte o artigo introdutório Transformar dados usando fluxos de dados de mapeamento.

A transformação Janela é onde você define agregações de colunas baseadas em janela em seus fluxos de dados. No Construtor de Expressões, você pode definir diferentes tipos de agregações baseadas em janelas de dados ou de tempo (cláusula SQL OVER), como LEAD, LAG, NTILE, CUMEDIST e RANK. Um novo campo é gerado em sua saída que inclui essas agregações. Você também pode incluir campos opcionais agrupados.

A captura de tela mostra

Mais de

Defina o particionamento de dados de coluna para a transformação da janela. O equivalente SQL é o Partition By na cláusula Over em SQL. Se desejar criar um cálculo ou uma expressão para usar no particionamento, você pode fazer isso passando o mouse sobre o nome da coluna e selecionando Coluna computada.

A captura de tela mostra as Configurações de Janela com a guia Over selecionada.

Ordenar

Outra parte da cláusula Over é definir o Order By. Esta cláusula define a ordem de classificação de dados. Você também pode criar uma expressão para calcular um valor neste campo de coluna para classificação.

A captura de ecrã mostra as Configurações de Janelas com o separador Organizar selecionado.

Intervalo por

Em seguida, defina o quadro da janela como Ilimitado ou Limitado. Para definir uma moldura de janela não limitada, defina o controle deslizante como Sem limites em ambas as extremidades. Se você escolher uma configuração entre Unbounded e Current Row, deverá definir os valores Offset start e end. Ambos os valores são inteiros positivos. Você pode usar números relativos ou valores de seus dados.

O controle deslizante da janela tem dois valores para definir: os valores antes da linha atual e os valores após a linha atual. O deslocamento entre o início e o fim alinha-se com os dois seletores do controle deslizante.

A captura de tela mostra as Configurações de Janela com a guia 'Intervalo por' selecionada.

Colunas de janela

Por fim, use o Construtor de Expressões para definir as agregações que deseja usar com as janelas de dados, como RANK, COUNT, MIN, MAX, DENSE RANK, LEAD, LAG, etc.

A lista completa de funções analíticas e de agregação disponíveis para uso na linguagem de expressão de fluxo de dados por meio do Construtor de expressões está listada em Expressões de transformação de dados no mapeamento de fluxo de dados.

Se você estiver procurando por uma agregação simples por grupo, use a transformação Agregar