Udostępnij przez


Grupowanie lub podsumowywanie wierszy

W dodatku Power Query można grupować wartości w różnych wierszach w jedną wartość, grupując wiersze według wartości w co najmniej jednej kolumnie. Można wybrać spośród dwóch typów operacji grupowania:

  • Grupowania kolumn.

  • Grupowanie wierszy.

Na potrzeby tego samouczka używasz poniższej przykładowej tabeli.

Przykładowa tabela początkowa.

Zrzut ekranu przedstawiający tabelę z kolumnami Year (2020), Country (USA, Panama lub Canada), Product (Shirt lub Shorts), Sales channel (Online lub Reseller) i Units (różne wartości z zakresu od 55 do 7500)

Gdzie znaleźć przycisk Grupuj według

Przycisk Grupuj według można znaleźć w trzech miejscach:

  • Na karcie Narzędzia główne w grupie Przekształć.

    Zrzut ekranu przedstawiający wstążkę Power Query z opcją Grupuj według na karcie Narzędzia główne.

  • Na karcie Przekształć w grupie Tabela.

    Zrzut ekranu przedstawiający wstążkę Power Query z uwydatnioną opcją Grupuj według na karcie Przekształć.

  • Na menu kontekstowym, po kliknięciu prawym przyciskiem myszy, wybierz kolumny.

    Zrzut ekranu przedstawiający tabelę z opcją Grupuj według podkreślonej w menu skrótów.

Używanie funkcji agregującej do grupowania według co najmniej jednej kolumny

W tym przykładzie twoim celem jest podsumowanie łącznej liczby sprzedanych jednostek na poziomie kraju i kanału sprzedaży. Kolumny Country (Kraj ) i Sales Channel (Kanał sprzedaży ) służą do wykonywania operacji grupowania według.

  1. Wybierz Grupuj według na karcie Start.
  2. Wybierz opcję Zaawansowane , aby wybrać wiele kolumn do grupowania.
  3. Wybierz kolumnę Country (Kraj ).
  4. Wybierz pozycję Dodaj grupowanie.
  5. Wybierz kolumnę Sales Channel (Kanał sprzedaży ).
  6. W Nazwa nowej kolumny wprowadź Całkowita liczba jednostek, w obszarze Operacja, wybierz pozycję Suma i w polu Kolumna wybierz pozycję Jednostki.
  7. Wybierz OK

Zrzut ekranu przedstawiający okno dialogowe Grupuj według z wypełnionymi zagregowanymi kolumnami.

Ta operacja daje poniższą tabelę.

Zrzut ekranu przedstawiający przykładową tabelę danych wyjściowych z kolumnami Country (Kraj), Sales Channel (Kanał sprzedaży) i Total units (Łączna liczba jednostek).

Dostępne operacje

Dzięki funkcji Grupuj według dostępne operacje można podzielić na dwa sposoby:

  • Operacja na poziomie wiersza
  • Operacja na poziomie kolumny

W poniższej tabeli opisano każdą z tych operacji.

Nazwa operacji Kategoria Description
Suma Operacja na kolumnie Sumuje wszystkie wartości z kolumny
średnia Operacja na kolumnie Oblicza średnią wartość z kolumny
Mediana Operacje na kolumnie Oblicza medianę z kolumny
Minimum Operacje na kolumnie Oblicza minimalną wartość z kolumny
Maksimum Operacja kolumny Oblicza maksymalną wartość z kolumny
Percentyl Operacja kolumny Oblicza percentyl przy użyciu wartości wejściowej od 0 do 100 z kolumny
Zlicz unikatowe wartości Operacja kolumny Oblicza liczbę unikatowych wartości z kolumny
Zlicz wiersze Operacja wiersza Oblicza liczbę całkowitą wierszy z danej grupy
Zlicz odrębne wiersze Operacja wiersza Oblicza liczbę odrębnych wierszy z danej grupy
Wszystkie wiersze Operacja wiersza Zwraca wszystkie zgrupowane wiersze w formie tabelarycznej bez agregacji

Uwaga / Notatka

Liczba unikatowych wartości i operacje percentylowe są dostępne tylko w usłudze Power Query Online.

Wykonywanie operacji grupowania według co najmniej jednej kolumny

Począwszy od oryginalnego przykładu, w tym przykładzie utworzysz kolumnę zawierającą łączną liczbę jednostek i dwie inne kolumny, które dają nazwę i jednostki sprzedawane dla produktu o najwyższej wydajności, podsumowane na poziomie kraju i kanału sprzedaży.

Zrzut ekranu przedstawiający przykładową tabelę danych wyjściowych z operacjami.

  1. Użyj następujących kolumn jako Grupuj według kolumn:

    • Country
    • Kanał sprzedaży
  2. Utwórz dwie nowe kolumny, wykonując następujące kroki:

    1. Agreguj kolumnę Units przy użyciu operacji Sum. Nadaj tej kolumnie nazwę Total units (Całkowita liczba jednostek).
    2. Dodaj nową kolumnę Products przy użyciu operacji Wszystkie wiersze .

    Zrzut ekranu okna dialogowego 'Grupuj według' z kolumną nieagregowaną.

Po zakończeniu tej operacji zwróć uwagę, że kolumna Products zawiera wartości [Table] wewnątrz każdej komórki. Każda wartość [Tabela] zawiera wszystkie wiersze pogrupowane według kolumn Country (Kraj ) i Sales Channel (Kanał sprzedaży ) z oryginalnej tabeli. W komórce możesz wybrać białą przestrzeń, aby wyświetlić przegląd zawartości tabeli u dołu okna dialogowego.

Zrzut ekranu przedstawiający okienko podglądu szczegółów tabeli.

Uwaga / Notatka

Okienko podglądu szczegółów może nie zawierać wszystkich wierszy używanych do operacji grupowania. Możesz wybrać wartość [Tabela], aby wyświetlić wszystkie wiersze odnoszące się do odpowiedniej operacji grupowania.

Następnie należy wyodrębnić wiersz o najwyższej wartości w kolumnie Units (Jednostki ) tabel w nowej kolumnie Products (Produkty ) i wywołać tę nową kolumnę Produkt o najwyższej wydajności.

Wyodrębnij informacje o najlepiej sprzedającym się produkcie.

Dzięki nowej kolumnie Products (Produkty) z wartościami [Table], możesz utworzyć nową kolumnę niestandardową, przechodząc do karty Dodaj kolumnę na wstążce i wybierając Kolumna niestandardowa z grupy Ogólne.

Zrzut ekranu przedstawiający wstążkę Power Query z wyróżnioną opcją Kolumna niestandardowa na karcie Dodawanie kolumny.

Nadaj nowej kolumnie nazwę top performer product. Wprowadź formułę Table.Max([Products], "Units" ) w obszarze Formuła kolumny niestandardowej.

Zrzut ekranu przedstawiający okno dialogowe Kolumna niestandardowa z wprowadzoną formułą Table.Max.

Wynik tej formuły tworzy nową kolumnę z wartościami [Record]. Te wartości rekordów są zasadniczo tabelą z tylko jednym wierszem. Te rekordy zawierają wiersz z maksymalną wartością kolumny Units (Jednostki ) każdej wartości [Table] w kolumnie Products (Produkty ).

Zrzut ekranu przedstawiający wynik formuły niestandardowej kolumny z użyciem Table.Max.

Z nową kolumną Top performer product, która zawiera wartości [Record], możesz wybrać ikonę rozszerzenia, wybrać pola Produkt i Jednostki, a następnie wybrać OK.

Zrzut ekranu przedstawiający operację rozwijania wartości rekordu w kolumnie Produkt najlepiej wykonujący.

Po usunięciu kolumny Products i ustawieniu typów danych dla obu nowo rozwiniętych kolumn wynik będzie podobny do poniższego obrazu.

Zrzut ekranu przedstawiający końcową tabelę ze wszystkimi przekształceniami.

Grupowanie rozmyte

Uwaga / Notatka

Poniższa funkcja jest dostępna tylko w usłudze Power Query Online.

Aby zademonstrować sposób "grupowania rozmytego", rozważ przykładową tabelę pokazaną na poniższej ilustracji.

Zrzut ekranu przedstawiający tabelę z dziewięcioma wierszami wpisów, które zawierają różne pisownie i wielkości liter imion Miguel i William.

Celem grupowania rozmytego jest wykonanie operacji grupowania przez, która używa algorytmu dopasowania przybliżonego dla ciągów tekstowych. Dodatek Power Query używa algorytmu podobieństwa Jaccard do mierzenia podobieństwa między parami wystąpień. Następnie stosuje klastry hierarchiczne agglomeracyjne do grupowania wystąpień razem. Na poniższej ilustracji przedstawiono oczekiwane dane wyjściowe, w których tabela jest pogrupowana według kolumny Person .

Zrzut ekranu przedstawiający tabelę przedstawiającą pozycje Person jako Miguel i Mike oraz Frequency odpowiednio jako 3 i 2.

Aby wykonać grupowanie rozmyte, wykonaj te same kroki opisane wcześniej w tym artykule. Jedyną różnicą jest to, że tym razem w oknie dialogowym Grupuj według zaznacz pole wyboru Użyj grupowania rozmytego .

Zrzut ekranu przedstawiający pole wyboru Grupowanie rozmyte podkreślone w oknie dialogowym Grupuj według.

Dla każdej grupy wierszy Power Query wybiera najczęściej występujące wystąpienie jako wystąpienie "kanoniczne". Jeśli wystąpi wiele wystąpień z tą samą częstotliwością, dodatek Power Query wybierze pierwszy z nich. Po wybraniu przycisku OK w oknie dialogowym Grupuj według otrzymasz oczekiwany wynik.

Zrzut ekranu przedstawiający finalną tabelę przykładową grupowania rozmytego, bez tabeli przekształceń.

Jednak masz większą kontrolę nad operacją grupowania rozmytego, rozwijając opcje grupy rozmytej.

Zrzut ekranu przedstawiający okno dialogowe Grupuj według z wyróżnionymi opcjami grupowania rozmytego.

Dostępne są następujące opcje grupowania rozmyte.

  • Próg podobieństwa (opcjonalnie): Ta opcja wskazuje, jak podobne dwie wartości muszą być zgrupowane razem. Ustawienie minimalnej wartości zero (0) powoduje zgrupowanie wszystkich wartości. Ustawienie maksymalne 1 umożliwia grupowanie wartości, które dokładnie pasują do siebie. Wartość domyślna to 0,8.
  • Ignoruj wielkość liter: w przypadku porównywania ciągów tekstowych wielkość liter jest ignorowana. Ta opcja jest domyślnie włączona.
  • Grupowanie przez łączenie części tekstu: algorytm stara się połączyć części tekstu (jak połączenie Micro i soft w Microsoft), aby zgrupować wartości.
  • Pokaż wyniki podobieństwa: Pokaż wyniki podobieństwa między wartościami wejściowymi a obliczonymi wartościami reprezentatywnymi po grupowaniu rozmyte. Wymaga dodania operacji, takiej jak Wszystkie wiersze , aby zaprezentować te informacje na poziomie wiersza po wierszu.
  • Tabela przekształceń (opcjonalnie): możesz wybrać tabelę przekształceń, która mapuje wartości (takie jak mapowanie MSFT na Microsoft) aby je połączyć.

W tym przykładzie tabela przekształceń służy do zademonstrowania sposobu mapowania wartości. Tabela przekształceń ma dwie kolumny:

  • Od: ciąg tekstowy do wyszukania w tabeli.
  • Do: ciąg tekstowy do użycia w celu zastąpienia ciągu tekstowego w kolumnie Od .

Na poniższej ilustracji przedstawiono tabelę przekształcania użytą w tym przykładzie.

Zrzut ekranu przedstawiający tabelę z wartościami mike'a i Williama oraz Wartości Miguela i Billa.

Ważne

Ważne jest, aby tabela przekształceń miała takie same kolumny i nazwy kolumn, jak pokazano na poprzedniej ilustracji (muszą być oznaczone etykietą "Od" i "Do"). W przeciwnym razie Power Query nie rozpoznaje tabeli jako tabeli transformacji.

Wróć do okna dialogowego Grupuj według, rozwiń opcje grupy rozmyte, zmień operację z Liczba wierszy na Wszystkie wiersze, włącz opcję Pokaż wyniki podobieństw, a następnie wybierz menu rozwijane tabeli przekształceń .

Zrzut ekranu przedstawiający menu rozwijane przykładowej tabeli przekształceń grupowania rozmytego.

Po wybraniu tabeli przekształceń wybierz przycisk OK. Wynikiem tej operacji są następujące informacje:

Zrzut ekranu przedstawiający końcową tabelę przykładowego grupowania rozmytego z tabelą przekształcania.

W tym przykładzie włączono opcję Ignoruj wielkość liter, więc wartości w kolumnie Od tabeli transformacji są używane do wyszukiwania ciągu tekstowego bez uwzględniania wielkości liter. Ta operacja przekształcania następuje najpierw, a następnie wykonywana jest operacja grupowania rozmytego.

Wynik podobieństwa jest również wyświetlany jako wartość tabeli obok kolumny z nazwą osoby, co dokładnie odzwierciedla sposób grupowania wartości oraz ich odpowiednie wyniki podobieństwa. Możesz rozwinąć tę kolumnę w razie potrzeby lub użyć wartości z nowych kolumn Frequency dla innych rodzajów przekształceń.

Uwaga / Notatka

Podczas grupowania według wielu kolumn tabela przekształceń wykonuje operację zamieniania we wszystkich kolumnach, jeśli zamiana wartości zwiększa wynik podobieństwa.

Aby uzyskać więcej informacji na temat sposobu działania tabel przekształceń, przejdź do sekcji Wymagania dotyczące tabeli przekształcania.