Partager via


Fonctions de fenêtre dans les flux de données de mappage

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, l’aide à la décision et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Les flux de données sont disponibles dans les pipelines Azure Data Factory et les pipelines Azure Synapse Analytics. Cet article s’applique aux flux de données de mappage. Si vous débutez avec les transformations, reportez-vous à l’article d’introduction Transformer des données à l’aide de flux de données de mappage.

Cet article fournit des détails sur les fonctions de fenêtre prises en charge par Azure Data Factory et Azure Synapse Analytics dans les flux de données de mappage.

Liste des fonctions de fenêtre

Les fonctions suivantes sont disponibles uniquement dans les transformations de fenêtre.

Fonction de fenêtre Tâche
cumeDist Calcule la position d’une valeur par rapport à toutes les valeurs de la partition. Le résultat correspond au nombre de lignes précédant ou correspondant à la ligne actuelle dans l’ordre de la partition, divisé par le nombre total de lignes de la partition de fenêtre. Toutes les valeurs identiques dans le classement occupent la même position.
denseRank Calcule le rang d’une valeur dans un groupe de valeurs spécifiées dans la clause ORDER BY d’une fenêtre. Le résultat est égal à 1 plus le nombre de lignes précédant ou correspondant à la ligne actuelle dans l’ordre de la partition. Les valeurs ne produisent pas d’écarts dans la séquence. La denseRank fonction fonctionne même lorsque les données ne sont pas triées et recherchent la modification des valeurs.
lag Obtient la valeur du premier paramètre évalué n les lignes avant la ligne actuelle. Le deuxième paramètre est le nombre de lignes à examiner et la valeur par défaut est 1. S'il n'y a pas autant de lignes, une valeur null est retournée, sauf si une valeur par défaut est spécifiée.
lead Obtient la valeur du premier paramètre évalué après n lignes suivant la ligne actuelle. Le deuxième paramètre est le nombre de lignes à regarder vers l’avant, et la valeur par défaut est 1. S'il n'y a pas autant de lignes, une valeur de null est retournée, sauf si une valeur par défaut est spécifiée.
nTile Divise les lignes pour chaque partition de fenêtre en n compartiments allant de 1 à n au maximum. Les valeurs des compartiments diffèrent au maximum de 1. Si le nombre de lignes de la partition ne se divise pas uniformément en nombre de compartiments, les valeurs restantes sont distribuées un par compartiment, en commençant par le premier compartiment. La fonction NTile est utile pour le calcul des tertiles, quartiles, déciles et autres statistiques de synthèse courantes.

La fonction calcule deux variables pendant l’initialisation. La taille d’un compartiment standard comporte une rangée supplémentaire. Les deux variables sont basées sur la taille de la partition actuelle. Pendant le processus de calcul, la fonction effectue le suivi du numéro de ligne actuel, du numéro de compartiment actuel et du numéro de ligne auquel le compartiment change (bucketThreshold). Lorsque le numéro de ligne courant atteint le seuil du compartiment, la valeur du compartiment augmente d’une unité. Le seuil augmente par la taille du compartiment (plus un supplémentaire si le compartiment actuel est rembourré).
rank Calcule le rang d’une valeur dans un groupe de valeurs spécifiées dans la clause ORDER BY d’une fenêtre. Le résultat est égal à 1 plus le nombre de lignes précédant ou correspondant à la ligne actuelle dans l’ordre de la partition. Les valeurs produisent des écarts dans la séquence. La rank fonction fonctionne même lorsque les données ne sont pas triées et recherchent la modification des valeurs.
rowNumber Affecte une numérotation séquentielle de lignes pour les lignes d’une fenêtre commençant par 1.