Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Artikel wird erläutert, wie Sie Dashboard-Datasets mithilfe des Dataset-Editors in einem KI/BI-Dashboard erstellen und verwalten.
Definieren von Datasets
Um vorhandene Datasets zu definieren oder auf sie zuzugreifen, klicken Sie in der oberen linken Ecke des Dashboards auf die Registerkarte Daten. Informationen zur Anzahl der Datasets, die jedes Dashboard enthalten kann, finden Sie unter Dashboardgrenzwerte.
Hinweis
Dashboard-Abfragen sind schreibgeschützt. Befehle wie DESCRIBE, EXPLAIN, , CREATE TABLE, INSERToder DELETE werden nicht zum Definieren von Datasets unterstützt. Nur Abfragen, die in zusätzliche SQL umschlossen werden können, sind gültig.
Dataset definieren:
Klicken Sie auf die Daten-Registerkarte in der oberen linken Ecke Ihres Dashboards.
Wählen Sie eine der folgenden Optionen aus:
- Aus SQL erstellen: Verwenden Sie diese Option, um eine neue SQL-Abfrage auf einer beliebigen Datenquelle zu schreiben.
-
Datenquelle hinzufügen: Verwenden Sie diese Option, um eine Unity-Katalogtabelle oder -Ansicht auszuwählen, auf der Ihr Dataset basieren soll. Für die meisten Tabellen und Ansichten werden Datasets durch eine Standardabfrage
SELECT *definiert, die Sie ändern können, um das Dataset zu verfeinern. Ändern Sie die Abfrage, um verfügbare Felder im Dashboard-Dataset zu entfernen oder zu transformieren. Gemäß der Definition in der Metrikansicht zeigt das Dataset die Ergebnistabelle und das Schema an, wenn Sie eine Metrikansicht (Public Preview) als Datenquelle auswählen. Siehe Verwenden von Metrikansichten und Exportieren als Metrikansicht. -
Eine Datei hochladen: Verwenden Sie diese Option, um ein neues Objekt in den Unity Katalog hochzuladen. Verwenden Sie das Datei-Upload-Dialogfeld, um den Katalog, das Schema und den Tabellenname auszuwählen. Sie können ein spezifisches SQL Data Warehouse festlegen, um das Compute zuzuordnen, das mit diesem Upload verbunden ist. Sie können auch auswählen, eine neue Tabelle zu erstellen oder eine bestehende Tabelle zu überschreiben. Sie müssen
MANAGEBerechtigungen auf dem ausgewählten Schema haben, um eine bestehende Tabelle zu überschreiben.
Erstellen eines Datasets aus SQL
Sie können ein Dataset definieren, das von jeder verfügbaren Datenquelle abgerufen wird. Identifizieren Sie in der Abfrage eine Datenquelle mithilfe eines vollqualifizierten Tabellennamens in der Abfrage selbst oder indem Sie eine Kombination aus Katalog und Schema aus den Dropdownselektoren zusammen mit dem Tabellennamen in der Abfrage auswählen. Ein vollqualifizierter Tabellenname in der Abfrage setzt den Katalog und die Schemaselektoren im Editor außer Kraft. Wenn ein Tabellen- oder Spaltenname Leerzeichen enthält, schließen Sie diese Bezeichner in Ihren SQL-Abfragen in Backticks ein.
Einschränken von Datasetergebnissen mithilfe von SQL
Dashboard-Viewer können auf alle Daten in einem Dataset zugreifen, auch wenn sie nicht in Visualisierungen angezeigt werden. Um zu verhindern, dass vertrauliche Daten im Browser verfügbar gemacht werden, schränken Sie die Spalten in der SQL-Abfrage ein, die das Dataset definiert. Statt beispielsweise alle Spalten aus einer Tabelle auszuwählen, schließen Sie nur die spezifischen Felder ein, die für Visualisierungen erforderlich sind.
Databricks empfiehlt Folgendes:
- Vermeiden Sie
SELECT *. Wählen Sie stattdessen explizit nur die erforderlichen Spalten aus. - Verwenden Sie
WHEREKlauseln oder andere Abfragelogik, um sicherzustellen, dass nur die benötigten Zeilen enthalten sind. - Beachten Sie, wie Parameter beim Erstellen von Abfragen den Datasetzugriff erweitern können.
- Überprüfen Sie das Schema in der Ergebnistabelle , um zu bestätigen, dass nur beabsichtigte Felder verfügbar sind.
Verwenden Sie Metrik-Ansichten
Sie können Metrikansichten in Dashboards verwenden, indem Sie entweder eine Metrikansicht als Datenquelle auswählen oder in einer SQL-Abfrage darauf verweisen.
Wählen Sie eine Metrikansicht als Datenquelle aus: Wenn Sie eine Metrikansicht direkt auswählen, enthält das Dataset alle definierten Dimensionen und Measures. Sie können die Datasetabfrage nicht ändern, um Spalten auszuschließen oder Filter anzuwenden. Sie können benutzerdefinierte Berechnungen hinzufügen, um zusätzliche Measures oder Dimensionen für die Visualisierung zu erstellen. Sehen Sie sich an, was benutzerdefinierte Berechnungen sind?.
Verweisen Sie in einer Abfrage auf eine Metrikansicht: Sie können auf eine Metrikansicht in einer SQL-Abfrage wie jede andere Ansicht verweisen. Verwenden Sie diese Methode, wenn Sie das Dataset filtern oder neu gestalten möchten. Auf alle Metrikansicht-Measure muss mit der
MEASURE-Aggregatfunktion zugegriffen werden. SiehemeasureAggregatfunktion.
Informationen zum Erstellen einer neuen Metrikansicht beim Erstellen Ihres Dashboards finden Sie unter "Exportieren als Metrikansicht".
Verwalten von Datasets
Verwenden Sie nach dem Definieren eines Datasets das Kebab-Menü rechts neben dem Datasetnamen, um auf die folgenden Optionen zuzugreifen:
Umbenennen: Geben Sie Ihrem Dataset einen aussagekräftigen Namen, damit Sie und Ihr Team schnell die Abfragen identifizieren können, die Sie bearbeiten oder prüfen möchten.
Vorgeschlagener Name: Generieren Sie basierend auf der Abfrage einen vorgeschlagenen Namen automatisch. Sie können diesen Namen nach dem Generieren bearbeiten.
Klonen: Erstellen Sie eine direkte Kopie Ihrer Abfrage. Sie können die Abfrage bearbeiten, nachdem sie geklont wurde.
Löschen: Datensatz löschen. Diese Option ist nicht verfügbar, wenn das Dataset am Zeichenbereich verwendet wird.
Herunterladen: Sie können das Dataset als CSV-, TSV- oder Excel-Datei herunterladen.
Hinweis
Datensätze, die derzeit auf der Arbeitsfläche verwendet werden, erscheinen fett gedruckt mit einem blauen Symbol, während nicht verwendete Datensätze ein graues Symbol und nicht fett gedruckte Namen haben.
Anzeigen der Ergebnistabelle
Wenn Sie ein Dataset erstellen, wird die Abfrage automatisch ausgeführt, und die Ergebnisse werden als Tabelle im Bereich unterhalb des Editors angezeigt. Jede Spalte enthält ein Symbol, das den Datentyp angibt.
So werden Spaltenwerte sortiert:
- Fahren Sie mit der Maus über jede Spalte, um das
anzuzeigen. - Klicken Sie auf das Symbol, um die Werte in aufsteigender oder absteigender Reihenfolge zu sortieren.
Anzeigen des Schemas für Abfrageergebnisse
Um das Schema des definierten Datasets anzuzeigen, klicken Sie auf Schema rechts neben Ergebnistabelle. Auf der Registerkarte Schema werden alle Felder aus dem definierten Dataset aufgelistet. Jedes Feld wird mit einem Symbol beschriftet, das den Datentyp der Spalte angibt. Wenn die zugrundeliegenden Tabellen oder Ansichten Kommentare enthalten, werden sie auf der Registerkarte Schema angezeigt.
Generieren von Ansichten aus Datasets
Sie können materialisierte Ansichten und Metrikansichten aus Ihren Datasets generieren, um Konsistenz im gesamten Arbeitsbereich zu gewährleisten.
Exportieren eines Datasets als materialisierte Ansicht
Sie können jedes Dataset als materialisierte Ansicht exportieren. Materialisierte Ansichten speichern Abfrageergebnisse zwischen und aktualisieren sie in einem bestimmten Zeitplan, wodurch die Abfrageausführungszeit reduziert werden kann, wenn wiederholt auf dieselben Daten zugegriffen wird. Siehe Materialisierte Ansichten.
So exportieren Sie ein Dataset als materialisierte Ansicht:
- Klicken Sie auf das
Rechts neben dem Dataset, das Sie exportieren möchten.
- Wählen Sie "In Materialisierte Ansicht exportieren" aus.
- Verwenden Sie im Bereich "In Materialisierte Ansicht exportieren " die Dropdownselektoren "Katalog" und "Schema", um auszuwählen, wo die materialisierte Ansicht gespeichert ist. Dies wirkt sich darauf aus, wer auf die materialisierte Ansicht zugreifen und diese verwenden kann. Weitere Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.
- (Optional) Geben Sie einen Namen für die materialisierte Ansicht ein. Standardmäßig wird der Datensatztitel zu einem gültigen materialisierten Ansichtsnamen konvertiert.
- (Optional) Konfigurieren Sie den Aktualisierungszeitplan und andere materialisierte Ansichtseinstellungen.
- Klicken Sie auf "Erstellen".
Die materialisierte Ansicht wird am angegebenen Speicherort des Unity-Katalogs erstellt und kann von anderen Dashboards und Abfragen in Ihrem Arbeitsbereich verwendet werden.
Hinweis
Standardmäßig wird die materialisierte Ansicht dem Dashboard hinzugefügt, wenn Sie sie erstellen. Um eine materialisierte Ansicht zu erstellen, die nicht zum Dashboard hinzugefügt wird, deaktivieren Sie 'Materialisierte Ansicht zum Dashboard hinzufügen' am unteren Rand des Bereichs 'In materialisierte Ansicht exportieren'.
Exportieren als Metrikansicht
Von Bedeutung
Dieses Feature befindet sich in der Public Preview.
Metrikansichten abstrahieren komplexe Geschäftslogik in einer zentralisierten Definition, sodass Organisationen wichtige Leistungsindikatoren einmal definieren und einheitlich auf verschiedenen Berichtsoberflächen verwenden können. Siehe Metrikansichten des Unity-Katalogs. Sie können ein Dataset als Metrikansicht exportieren oder den Assistenten verwenden, um eine Metrikansicht zu erstellen. Wenn Messgrößen und Dimensionen für den bestehenden Datensatz definiert wurden, werden sie automatisch in der generierten Definition der metrischen Ansicht angezeigt.
Exportieren eines Datasets als Metrikansicht
So exportieren Sie ein Dataset als Metrikansicht:
- Klicken Sie auf das
Rechts neben dem Dataset, das Sie als Metrikansicht exportieren möchten.
- Verwenden Sie im Bereich " Metrische Ansicht erstellen" die Dropdownauswahl für Katalog und Schema, um das Schema und den Katalog auszuwählen, in dem die Metrikansicht gespeichert ist. Dies wirkt sich darauf aus, wer auf die Metrikansicht zugreifen und diese verwenden kann. Weitere Informationen finden Sie unter Unity Catalog-Berechtigungen und sicherungsfähige Objekte.
- (Optional) Geben Sie einen Namen für die Metrikansicht ein. Standardmäßig wird der Datensatz-Titel basierend auf den Benennungsanforderungen in einen gültigen Namen für die Metrikansicht umgewandelt.
- (Optional) Bearbeiten Sie die Metrikansicht, indem Sie den generierten Inhalt im YAML-Definitionsabschnitt anpassen.
- Klicken Sie auf "Speichern".
Hinweis
Standardmäßig wird die Metrikansicht dem Dashboard hinzugefügt, wenn Sie sie erstellen. Um eine Metrikansicht zu erstellen, die nicht zum Dashboard hinzugefügt wird, deaktivieren Sie die Option "Metrikansicht zum Dashboard hinzufügen " am unteren Rand des Bereichs " Metrische Ansicht erstellen ".
Erstellen einer Metrikansicht mithilfe des Databricks-Assistenten
Erstellen Einer Metrikansicht aus einem Dataset mithilfe des Databricks-Assistenten:
- Klicken Sie auf das Symbol
Assistent in der linken Seitenleiste des Dataset-Editors. Klicken Sie dann auf " In Metrikansicht exportieren".
- Geben Sie eine Beschreibung der Metrikansicht ein, die Sie erstellen möchten.
- Der Assistent gibt eine Beispieldefinition für die Metrikansicht zurück und erläutert kurz die darin definierten Dimensionen und Measures.
- Klicken Sie auf " metrischen Ansichts-Editor öffnen", um die Metrikansicht zu bearbeiten und zu speichern.
Weitere Informationen zum Erstellen einer Metrikansicht finden Sie unter Erstellen einer Metrikansicht.
Benutzerdefinierte Berechnungen
Benutzerdefinierte Berechnungen bieten eine Möglichkeit, Berechnungen auf ein vorhandenes Dataset anzuwenden, ohne die SQL zu ändern, die das Dataset erstellt. Weitere Informationen zum Erstellen und Verwenden von benutzerdefinierten Berechnungen finden Sie unter Was sind benutzerdefinierte Berechnungen?.
Schreiben von Abfragen mit mehreren Anweisungen
Manchmal möchten Sie möglicherweise ein Dataset mit mehreren SQL-Anweisungen erstellen. Um mehrere Anweisungen auszuführen, beenden Sie jede Anweisung mit einem Strichpunkt (;). Wenn Sie diese Befehle zum Erstellen des Datasets ausführen, zeigt die Ausgabe die Ergebnisse der letzten Anweisung im Editor an. Dieses Dataset wird für alle verwandten Visualisierungen am Zeichenbereich verwendet.
Aussagen sind lokal in dem Dataset vorhanden, in dem sie ausgegeben werden. Wenn Sie beispielsweise ein Dataset mit einer USE-Anweisung zum Festlegen des Katalogs oder Schemas erstellen, gilt diese Einstellung nur für dieses Dataset.
Examples
Die folgenden Beispiele veranschaulichen allgemeine Verwendungsmöglichkeiten für Abfragen mit mehreren Anweisungen.
Festlegen des Katalogs und des Schemas
Sie können eine USE-Anweisung schreiben, um den Katalog und das Schema für die Tabelle in Ihrer Abfrage zu deklarieren. Die folgende Abfrage enthält drei Anweisungen. Die erste legt den Katalognamen fest. Die zweite legt das Schema fest. Die SELECT-Anweisung verweist nur auf den Tabellennamen, da der Katalog und das Schema festgelegt wurden. Siehe USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
Festlegen des ANSI-Modus
Sie können eine Abfrage ausführen, bei der ANSI_MODE auf TRUE oder FALSEfestgelegt ist. Für Databricks SQL ist der Systemstandardwert für ANSI_MODETRUE. Siehe ANSI_MODE.
Die folgende Abfrage legt ANSI_MODE auf FALSE fest, sodass ungültige Datentypeingaben NULL zurückgeben, anstatt einen Fehler auszulösen.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Parametrisieren komplexer Abfragen
Sie können mehrere Anweisungen verwenden, um den Ansichtsnamen für einen allgemeinen Tabellenausdruck oder eine andere komplexe Abfrage zu parametrisieren.
Die folgende Abfrage erstellt zwei temporäre Ansichten. Die SELECT-Anweisung verwendet die IDENTIFIER-Klausel, um die Eingabezeichenfolge als Tabellennamen zu interpretieren. Siehe IDENTIFIER Klausel.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Festlegen von Variablen
Die folgende Abfrage deklariert eine Variable und einen Wert in der ersten Anweisung. Die zweite Anweisung ändert den Wert der Variablen. Die dritte Anweisung zeigt, dass der Endwert der Variable 5 ist. Ausführliche Informationen und vollständige Syntax für die Verwendung temporärer Variablen finden Sie unter SET Variable .
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);