Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Der Algorithmus zur Abtastung in Power BI verbessert visuelle Elemente, die hochdichte Daten verarbeiten. Sie können z. B. ein Liniendiagramm aus den Verkaufsergebnissen Ihrer Einzelhandelsgeschäfte erstellen, wobei jedes Geschäft mehr als 10.000 Verkaufsbestätigungen pro Jahr enthält. Ein Liniendiagramm mit solchen Verkaufsinformationen würde Daten von jedem Geschäft entnehmen und ein Linienchart mit mehreren Serien erstellen, das dann die zugrunde liegenden Daten darstellt. Stellen Sie sicher, dass Sie eine aussagekräftige Darstellung dieser Daten auswählen, um zu veranschaulichen, wie sich der Umsatz im Laufe der Zeit unterscheidet. Diese Vorgehensweise ist bei der Visualisierung von Daten mit hoher Dichte üblich. Die Details der Stichproben mit hoher Dichte werden in diesem Artikel beschrieben.
Hinweis
Der in diesem Artikel beschriebene Samplingalgorithmus mit hoher Dichte ist sowohl in Power BI Desktop als auch im Power BI-Dienst verfügbar.
Wie die Linienabtastung mit hoher Dichte funktioniert
Zuvor wählte Power BI eine Sammlung von Beispieldatenpunkten im vollständigen Bereich der zugrunde liegenden Daten in einer deterministischen Weise aus. Bei Daten mit hoher Dichte in einem visuellen Bereich eines Kalenderjahres können beispielsweise 350 Beispieldatenpunkte im visuellen Bereich angezeigt werden, die jeweils ausgewählt wurden, um sicherzustellen, dass der gesamte Datenbereich im visuellen Bereich dargestellt wurde. Um zu verstehen, wie dies geschieht, stellen Sie sich vor, einen Aktienkurs über einen Zeitraum von einem Jahr zu zeichnen und 365 Datenpunkte auszuwählen, um ein Liniendiagramm visuell zu erstellen. Das ist ein Datenpunkt für jeden Tag.
In dieser Situation gibt es viele Werte für einen Aktienkurs innerhalb eines Tages. Natürlich gibt es ein Tageshoch und ein Tief, aber die können zu jeder Zeit während des Tages auftreten, wenn der Aktienmarkt geöffnet ist. Wenn bei der Stichprobe mit hoher Dichte die zugrunde liegende Datenprobe täglich um 10:30 Uhr und 12:00 Uhr aufgenommen wurde, erhalten Sie eine repräsentative Momentaufnahme der zugrunde liegenden Daten, z. B. den Preis um 10:30 Uhr und 12:00 Uhr. Die Momentaufnahme erfasst jedoch möglicherweise nicht das tatsächliche Hoch und das Tief des Aktienkurses für diesen repräsentativen Datenpunkt an diesem Tag. In dieser Situation und anderen ist das Sampling repräsentativ für die zugrunde liegenden Daten, aber es erfasst nicht immer wichtige Punkte, die in diesem Fall tageskurshochs und Tiefstwerte sein würden.
Per Definition werden Daten mit hoher Dichte analysiert, um Visualisierungen relativ schnell zu erstellen, die auf Interaktivität reagieren. Zu viele Datenpunkte in einer Visualisierung können sie überlasten und die Sichtbarkeit von Trends beeinträchtigen. Wie die Daten analysiert werden, ist das, was die Erstellung des Samplingalgorithmus steuert, um die beste Visualisierung zu ermöglichen. In Power BI Desktop bietet der Algorithmus die beste Kombination aus Reaktionsfähigkeit, Darstellung und klarer Erhaltung wichtiger Punkte in jeder Zeitscheibe.
Funktionsweise des neuen Liniensamplingalgorithmus
Der Algorithmus für hochdichtes Linien-Sampling ist für Liniendiagramme und Flächendiagramme mit einer kontinuierlichen x-Achse verfügbar.
Bei einer visuellen Grafik mit hoher Dichte segmentiert Power BI Ihre Daten intelligent in hochauflösende Blöcke und wählt dann wichtige Punkte aus, um jeden Block darzustellen. Dieser Prozess des Schneidens von hochauflösenden Daten wird optimiert, um sicherzustellen, dass das resultierende Diagramm visuell nicht von dem Rendern aller zugrunde liegenden Datenpunkte unterscheidbar ist, jedoch schneller und interaktiver gestaltet ist.
Mindest- und Höchstwerte für visuelle Linien mit hoher Dichte
Für jede Visualisierung gelten die folgenden Einschränkungen:
3.500 ist die maximale Anzahl von Datenpunkten, die für die meisten visuellen Elemente angezeigt werden , unabhängig von der Anzahl der zugrunde liegenden Datenpunkte oder Datenreihen, siehe Ausnahmen in der folgenden Liste. Wenn Sie beispielsweise über 10 Datenreihen mit jeweils 350 Datenpunkten verfügen, hat das visuelle Element die maximale Gesamtmenge der Datenpunkte erreicht. Wenn Sie eine Serie haben, kann sie bis zu 3.500 Datenpunkte umfassen, wenn der Algorithmus dies als die beste Stichprobe für die zugrunde liegenden Daten erachtet.
Es gibt maximal 60 Datenreihen für alle visuellen Elemente. Wenn Sie mehr als 60 Datenreihen haben, trennen Sie die Daten, und erstellen Sie mehrere visuelle Elemente mit jeweils 60 oder weniger Datenreihen. Es empfiehlt sich, einen Datenschnitt zu verwenden, um nur Segmente der Daten anzuzeigen, aber nur für bestimmte Datenreihen. Wenn Sie beispielsweise alle Unterkategorien in der Legende anzeigen, können Sie einen Datenschnitt verwenden, um nach der Gesamtkategorie auf derselben Berichtsseite zu filtern.
Die maximale Anzahl von Datenlimits ist für die folgenden visuellen Typen höher, bei denen es sich um Ausnahmen vom Grenzwert von 3.500 Datenpunkten handelt:
- Maximal 150.000 Datenpunkte für R-Visualisierungen.
- 30.000 Datenpunkte für visuelle Azure Map-Elemente.
- 10.000 Datenpunkte für einige Punktdiagrammkonfigurationen (Punktdiagramme haben standardmäßig 3.500).
- 3.500 für alle anderen Visualisierungen mit hoher Dichte Sampling. Einige andere visuelle Elemente visualisieren möglicherweise mehr Daten, verwenden jedoch kein Sampling.
Diese Parameter stellen sicher, dass visuelle Elemente in Power BI Desktop schnell gerendert werden, für die Interaktion mit Benutzern reaktionsfähig sind und nicht zu einem unnötigen Rechenaufwand auf dem Computer führen, der das visuelle Rendering ausführt.
Auswerten repräsentativer Datenpunkte für visuelle Linien mit hoher Dichte
Wenn die Anzahl der zugrunde liegenden Datenpunkte die maximalen Datenpunkte überschreitet, die im visuellen Element dargestellt werden können, beginnt ein Prozess, der als Binning bezeichnet wird. Durch das Binning werden die zugrunde liegenden Daten in Gruppen zusammengefasst, die als Bins bezeichnet werden, und diese Bins werden dann iterativ verfeinert.
Der Algorithmus erstellt so viele Container wie möglich, um die größtmögliche Granularität für das Visuelle zu schaffen. Innerhalb jedes Bins findet der Algorithmus den minimalen und maximalen Datenwert, um sicherzustellen, dass wichtige und signifikante Werte, z. B. Ausreißer, erfasst und im Visuellen angezeigt werden. Basierend auf den Ergebnissen des Binnings und der nachfolgenden Auswertung der Daten durch Power BI wird die Mindestauflösung für die x-Achse für die visuelle Darstellung bestimmt, um die maximale Granularität für die visuale Darstellung sicherzustellen.
Wie bereits erwähnt, beträgt die minimale Granularität für jede Datenreihe 350 Punkt, und das Maximum beträgt 3.500 für die meisten visuellen Elemente. Die Ausnahmen werden in den vorherigen Absätzen aufgeführt.
Jeder Behälter wird durch zwei Datenpunkte dargestellt, die zu den repräsentativen Datenpunkten des Behälters im visuellen Element werden. Die Datenpunkte sind der hohe und niedrige Wert für diesen Bin. Durch die Auswahl hoher und niedriger Werte im Binningprozess wird sichergestellt, dass alle wichtigen hohen oder signifikanten niedrigen Werte erfasst und in der Visualisierung gerendert werden.
Wenn das nach viel Analyse klingt, um sicherzustellen, dass ein gelegentlicher Ausreißer erfasst und ordnungsgemäß in der Darstellung angezeigt wird, haben Sie recht. Das ist der genaue Grund für den Algorithmus und den Binning-Prozess.
Tooltips und Zeilenproben mit hoher Dichte
Es ist wichtig zu beachten, dass dieser Binning-Prozess, der den minimalen und maximalen Wert eines bestimmten Bins erfasst und anzeigt, möglicherweise die Darstellung der Daten in QuickInfos beeinflusst, wenn Sie mit dem Mauszeiger über die Datenpunkte fahren. Um zu erklären, wie und warum dies geschieht, schauen wir uns unser Beispiel zu Aktienkursen erneut an.
Angenommen, Sie erstellen ein visuelles Element auf der Grundlage des Aktienkurses und vergleichen zwei verschiedene Aktien, die beide eine Stichprobe mit hoher Dichte verwenden. Die zugrunde liegenden Daten für jede Datenreihe weisen viele Datenpunkte auf. Zum Beispiel können Sie den Aktienkurs jede Sekunde des Tages erfassen. Der Samplingalgorithmus mit hoher Dichte führt die Binning für jede Datenreihe unabhängig vom anderen durch.
Nehmen wir nun an, dass die erste Aktie um 12:02 Uhr nach oben springt und dann 10 Sekunden später schnell zurückgeht. Das ist ein wichtiger Datenpunkt. Wenn für diese Aktie ein Binning auftritt, ist das Hoch bei 12:02 ein repräsentativer Datenpunkt für diesen Bin.
Für die zweite Aktie war 12:02 jedoch kein Hoch noch ein Tief in dem Zeitraum, der diese Zeit beinhaltete. Vielleicht ist das Hoch und Tief für das Intervall, das 12:02 enthält, erst drei Minuten später aufgetreten. In dieser Situation, wenn das Liniendiagramm bereits erstellt ist und Sie mit dem Mauszeiger über 12:02 fahren, wird ein Wert in der QuickInfo für die erste Aktie angezeigt. Dies liegt daran, dass der Wert um 12:02 Uhr gestiegen ist und dieser Wert als höchster Datenpunkt dieses Datenbehälters ausgewählt wurde. Für die zweite Aktie wird jedoch um 12:02 kein Wert in der QuickInfo angezeigt. Das liegt daran, dass die zweite Aktie für das Zeitfenster, das 12:02 beinhaltete, kein Hoch oder Tief hatte. Da es keine Daten gibt, die für die zweite Aktie um 12:02 angezeigt werden, werden auch keine Tooltip-Daten dargestellt.
Diese Situation tritt häufig mit QuickInfos auf. Die hohen und niedrigen Werte für einen bestimmten Container stimmen wahrscheinlich nicht perfekt mit den gleichmäßig skalierten X-Achsenwertpunkten überein, und die QuickInfo zeigt den Wert nicht an.
So aktivieren Sie das Sampling von Linien mit hoher Dichte
Standardmäßig ist der Algorithmus aktiviert. Um diese Einstellung zu ändern, wechseln Sie zum Bereich "Formatierung ", in der Karte " Allgemein " und unten sehen Sie den Schieberegler für das Sampling mit hoher Dichte . Wählen Sie den Schieberegler aus, um ein- oder auszuschalten.
Überlegungen und Einschränkungen
Der Algorithmus für das Sampling mit hoher Dichte ist eine wichtige Verbesserung von Power BI, aber es gibt einige Überlegungen, die Sie beim Arbeiten mit Werten und Daten mit hoher Dichte wissen müssen.
Aufgrund der erhöhten Granularität und des Binningprozesses zeigen QuickInfos möglicherweise nur einen Wert an, wenn die repräsentativen Daten mit dem Cursor ausgerichtet sind. Weitere Informationen finden Sie im Abschnitt "QuickInfos und Stichproben mit hoher Dichte" in diesem Artikel.
Wenn die Größe einer gesamtdatenquelle zu groß ist, beseitigt der Algorithmus Datenreihen (Legendenelemente), um die maximale Einschränkung des Datenimports zu berücksichtigen.
- In diesem Fall sortiert der Algorithmus legendenreihen alphabetisch, beginnend mit der Liste der Legendenelemente in alphabetischer Reihenfolge, bis das Datenimport-Maximum erreicht ist, und importiert keine weiteren Datenreihen.
Wenn ein zugrunde liegendes Dataset über mehr als 60 Datenreihen verfügt, sortiert der Algorithmus die Datenreihe alphabetisch und entfernt Datenreihen außerhalb der 60. alphabetisch sortierten Datenreihe.
Wenn die Werte in den Daten nicht vom Typ "numerisch" oder " Datum/Uhrzeit" sind, verwendet Power BI nicht den Algorithmus und wird auf den vorherigen Algorithmus zurückgesetzt, der nicht mit hoher Dichte ist.
Die Elemente ohne Dateneinstellung anzeigen werden mit dem Algorithmus nicht unterstützt.
Der Algorithmus wird nicht unterstützt, wenn eine Liveverbindung mit einem modell verwendet wird, das in SQL Server Analysis Services, Version 2016 oder früher, gehostet wird. Es wird in Modellen unterstützt, die in Power BI oder Azure Analysis Services gehostet werden.