Udostępnij przez


Funkcje okna w przepływach danych mapowania

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Tip

Wypróbuj Data Factory in Microsoft Fabric, kompleksowe rozwiązanie analityczne dla przedsiębiorstw. Microsoft Fabric obejmuje wszystko od przemieszczania danych po naukę o danych, analitykę w czasie rzeczywistym, inteligencję biznesową i raportowanie. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !

Przepływy danych są dostępne zarówno w potokach usługi Azure Data Factory, jak i w potokach usługi Azure Synapse Analytics. Ten artykuł dotyczy przepływów danych mapowania. Jeśli dopiero zaczynasz z przekształceń danych, zapoznaj się z artykułem wprowadzającym Przekształcanie danych przy użyciu przepływów mapowania danych.

Ten artykuł zawiera szczegółowe informacje o funkcjach okienkowych obsługiwanych przez Azure Data Factory i Azure Synapse Analytics w przepływach danych mapujących.

Lista funkcji okna

Następujące funkcje są dostępne tylko w przekształceniach okien.

Funkcja Window Task
cumeDist Oblicza położenie wartości względem wszystkich wartości w partycji. Wynikiem jest liczba wierszy poprzedzających lub równych bieżącemu wierszowi w kolejności partycji podzielonej przez łączną liczbę wierszy w partycji okna. Wszystkie równorzędne wartości w uporządkowaniu są oceniane na tej samej pozycji.
denseRank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik to jeden plus liczba wierszy poprzedzających lub równych bieżącemu wierszowi w porządku partycji. Wartości nie generują luk w sekwencji. Funkcja denseRank działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
lag Pobiera wartość pierwszego parametru, który był oceniany n wierszy przed bieżącym wierszem. Drugi parametr to liczba wierszy do przeszukania wstecz, a wartość domyślna to 1. Jeśli nie ma tak wielu wierszy, wartość null zostanie zwrócona, chyba że zostanie określona wartość domyślna.
lead Pobiera wartość pierwszego parametru obliczanego n wierszy po bieżącym wierszu. Drugi parametr to liczba wierszy, którą należy przesunąć do przodu, a wartość domyślna to 1. Jeśli nie ma tylu wierszy, zostanie zwrócona wartość null, chyba że zostanie określona wartość domyślna.
nTile Dzieli wiersze dla każdej partycji okna na n grupy w zakresie od 1 do maksymalnie n. Wartości wiadra różnią się co najwyżej 1. Jeśli liczba wierszy w partycji nie jest równomiernie podzielona na liczbę zasobników, pozostałe wartości są rozdzielane pojedynczo na zasobnik, począwszy od pierwszego zasobnika. Funkcja NTile jest przydatna do obliczania tertiles, kwartylów, decyli i innych typowych statystyk podsumowujących.

Funkcja oblicza dwie zmienne podczas inicjowania. Rozmiar zwykłego zasobnika zawiera jeden dodatkowy wiersz dodany do niego. Obie zmienne są oparte na rozmiarze bieżącej partycji. Podczas procesu obliczania funkcja śledzi bieżący numer wiersza, bieżący numer zasobnika i numer wiersza, w którym zmienia się zasobnik (bucketThreshold). Gdy bieżąca liczba wierszy osiągnie próg zasobnika, wartość zasobnika zwiększa się o jeden. Próg zwiększa się o rozmiar wiadra (plus jeden dodatkowy, jeśli bieżące wiadro jest wypełnione).
rank Oblicza rangę wartości w grupie wartości określonych w kolejności okna według klauzuli. Wynik to jeden plus liczba wierszy poprzedzających lub równych bieżącemu wierszowi w sekwencji partycji. Wartości generują luki w sekwencji. Funkcja rank działa nawet wtedy, gdy dane nie są sortowane i szukają zmian w wartościach.
rowNumber Przypisuje sekwencyjne numerowanie wierszy dla wierszy w oknie rozpoczynającym się od 1.