Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article explique comment créer et gérer des jeux de données de tableau de bord à l’aide de l’éditeur de jeu de données dans un tableau de bord IA/BI.
Définir les jeux de données
Pour définir ou accéder à des jeux de données existants, cliquez sur l’onglet Données près du coin supérieur gauche de votre tableau de bord. Pour plus d’informations sur le nombre de jeux de données que chaque tableau de bord peut inclure, consultez les limites du tableau de bord.
Note
Les requêtes de tableau de bord sont en lecture seule. Les commandes telles que DESCRIBE, , EXPLAINCREATE TABLE, INSERTou DELETE ne sont pas prises en charge pour définir des jeux de données. Seules les requêtes qui peuvent être encapsulées dans sql supplémentaire sont valides.
Pour définir un jeu de données :
Cliquez sur l’onglet Données dans le coin supérieur gauche de votre tableau de bord.
Choisissez l’une des options suivantes :
- Créer à partir de SQL : Utilisez cette option pour écrire une nouvelle requête SQL sur n’importe quelle source de données.
-
Ajouter une source de données : Utilisez cette option pour choisir une table de catalogue Unity ou une vue sur laquelle baser votre jeu de données. Pour la plupart des tables et vues, les jeux de données sont définis par une requête par défaut
SELECT *, que vous pouvez modifier pour affiner le jeu de données. Modifiez la requête pour supprimer ou transformer les champs disponibles dans le jeu de données du tableau de bord. Lorsque vous choisissez une vue métrique en aperçu public comme source de données, le jeu de données affiche la table de résultats et le schéma tels que définis dans la vue métrique. Consultez Utiliser les vues de métriques et Exporter en tant que vue de métriques. -
Chargez un fichier : Utilisez cette option pour charger une nouvelle ressource dans le catalogue Unity. Utilisez la boîte de dialogue de chargement de fichiers pour sélectionner le nom du catalogue, du schéma et de la table. Vous pouvez définir un entrepôt SQL spécifique pour gérer le calcul associé à ce chargement. Vous pouvez également choisir de créer une table ou remplacer une table existante. Vous devez disposer
MANAGEde privilèges sur le schéma sélectionné pour remplacer une table existante.
Créer un jeu de données à partir de SQL
Vous pouvez définir un jeu de données qui extrait de n’importe quelle source de données disponible. Dans la requête, identifiez une source de données à l’aide d’un nom de table complet dans la requête elle-même ou en sélectionnant une combinaison de catalogue et de schéma dans les sélecteurs de liste déroulante, ainsi que le nom de la table dans la requête. Un nom de table complet dans la requête remplace les sélecteurs de catalogue et de schéma dans l’éditeur. Si un nom de table ou de colonne contient des espaces, entourez ces identifiants d’accent grave dans vos requêtes SQL.
Restreindre les résultats du jeu de données à l’aide de SQL
Les visionneuses de tableaux de bord peuvent accéder à toutes les données d’un jeu de données, même si elles ne sont pas affichées dans les visualisations. Pour empêcher l’exposition des données sensibles dans le navigateur, limitez les colonnes de la requête SQL qui définit le jeu de données. Par exemple, au lieu de sélectionner toutes les colonnes d’une table, incluez uniquement les champs spécifiques requis pour les visualisations.
Databricks vous recommande :
- Évitez
SELECT *. Au lieu de cela, sélectionnez explicitement uniquement les colonnes requises. - Utilisez
WHEREdes clauses ou une autre logique de requête pour vous assurer que seules les lignes nécessaires sont incluses. - Tenez compte de la façon dont les paramètres peuvent développer l’accès au jeu de données lors de la construction de requêtes.
- Passez en revue le schéma dans la table de résultats pour confirmer que seuls les champs prévus sont disponibles.
Utiliser des vues de mesures
Vous pouvez utiliser des vues de métriques dans les tableaux de bord en sélectionnant une vue de métrique comme source de données ou en le référençant dans une requête SQL.
Sélectionnez une vue de métrique en tant que source de données : Lorsque vous choisissez directement une vue de métrique, le jeu de données inclut toutes les dimensions et mesures définies. Vous ne pouvez pas modifier la requête de jeu de données pour exclure des colonnes ou appliquer des filtres. Vous pouvez ajouter des calculs personnalisés pour créer des mesures ou des dimensions supplémentaires pour la visualisation. Voir Qu’est-ce que les calculs personnalisés ?.
Référencez une vue de métrique dans une requête : Vous pouvez référencer une vue de métrique dans une requête SQL comme n’importe quelle autre vue. Utilisez cette méthode si vous souhaitez filtrer ou remodeler le jeu de données. Toutes les mesures d’affichage des métriques doivent être accessibles à l’aide de la fonction d’agrégation
MEASURE. Voirmeasurela fonction d’agrégation.
Pour créer une nouvelle vue de métadonnée lorsque vous concevez votre tableau de bord, consultez Exporter en tant que vue de métriques.
Gérer les jeux de données
Après avoir défini un jeu de données, utilisez à droite du nom du jeu de données pour accéder aux options suivantes :
Renommer : donnez à votre ensemble de données un nom descriptif permettant à votre équipe et à vous-même d'identifier rapidement les requêtes que vous souhaitez modifier ou réviser.
Nom de suggestion : générez automatiquement un nom suggéré en fonction de la requête. Vous pouvez modifier ce nom après sa génération.
Clone : créez une copie sur place de votre requête. Vous pouvez modifier la requête après son clonage.
Supprimer : Supprimez un jeu de données. Cette option n’est pas disponible si le jeu de données est utilisé sur le canevas.
Télécharger : vous pouvez télécharger le jeu de données en tant que fichier CSV, TSV ou Excel.
Note
Les jeux de données actuellement utilisés sur le canevas apparaissent en gras avec une icône bleue, tandis que les jeux de données inutilisés ont une icône grise et des noms non gras.
Afficher la table des résultats
Lorsque vous créez un jeu de données, la requête s’exécute automatiquement et les résultats apparaissent sous la forme d’une table dans le volet sous l’éditeur. Chaque colonne inclut une icône indiquant son type de données.
Pour trier les valeurs de colonne :
- Pointez sur chaque colonne pour afficher l'icône de tri
. - Cliquez sur l’icône pour trier les valeurs dans l’ordre croissant ou décroissant.
Afficher le schéma de résultat de la requête
Pour afficher le schéma de votre jeu de données défini, cliquez sur Schéma à droite de la table de résultats. L’onglet Schéma répertorie tous les champs du jeu de données défini. Chaque champ est étiqueté avec une icône indiquant le type de données de la colonne. Si les tables ou vues sous-jacentes incluent des commentaires, ils apparaissent sous l’onglet Schéma.
Générer des vues à partir de jeux de données
Vous pouvez générer des vues matérialisées et des vues de métriques à partir de vos jeux de données pour maintenir la cohérence dans votre espace de travail.
Exporter un jeu de données en tant qu’affichage matérialisé
Vous pouvez exporter n’importe quel jeu de données en tant qu’affichage matérialisé. Les vues matérialisées mettent en cache les résultats des requêtes et les actualisent selon un horaire spécifié, ce qui peut réduire le temps d'exécution des requêtes lorsque les mêmes données sont consultées à plusieurs reprises. Consultez Vues matérialisées.
Pour exporter un jeu de données en tant qu’affichage matérialisé :
- Cliquez sur l’
à droite du jeu de données que vous souhaitez exporter.
- Sélectionnez Exporter vers une vue matérialisée.
- Dans le panneau Exporter vers la vue matérialisée , utilisez le catalogue et les sélecteurs de liste déroulante de schéma pour choisir l’emplacement où la vue matérialisée est stockée. Cela affecte qui peut accéder à la vue matérialisée et l’utiliser. Consultez Privilèges Unity Catalog et objets sécurisables.
- (Facultatif) Entrez un nom pour la vue matérialisée. Par défaut, le titre du jeu de données est converti en nom de vue matérialisé valide.
- (Facultatif) Configurez la planification d’actualisation et d’autres paramètres de vue matérialisés.
- Cliquez sur Créer.
La vue matérialisée est créée à l’emplacement du catalogue Unity spécifié et peut être utilisée par d’autres tableaux de bord et requêtes dans votre espace de travail.
Note
Par défaut, la vue matérialisée est ajoutée au tableau de bord lorsque vous le créez. Pour créer une vue matérialisée qui n’est pas ajoutée au tableau de bord, désactivez l’option Ajouter une vue matérialisée au tableau de bord en bas du panneau Exporter vers la vue matérialisée .
Exporter en tant que vue de métrique
Important
Cette fonctionnalité est disponible en préversion publique.
Les vues de métriques résument une logique métier complexe dans une définition centralisée, ce qui permet aux organisations de définir des indicateurs de performances clés une fois et de les utiliser de manière cohérente sur différentes surfaces de création de rapports. Consultez les vues métriques du catalogue Unity. Vous pouvez exporter un jeu de données en tant qu’affichage de métrique ou utiliser l’Assistant pour créer une vue de métrique. Si des mesures et des dimensions ont été définies pour le jeu de données existant, elles apparaissent automatiquement dans la définition de vue de métrique générée.
Exporter un jeu de données en tant que vue de métrique
Pour exporter un jeu de données sous forme de vue métrique :
- Cliquez sur l'icône du
à droite du jeu de données que vous souhaitez exporter en tant que vue de métrique.
- Dans le panneau Créer un affichage de métrique , utilisez le catalogue et les sélecteurs de liste déroulante de schéma pour choisir le schéma et le catalogue où la vue de métrique est stockée. Cela affecte les personnes pouvant accéder à la vue des métriques et les utiliser. Consultez Privilèges Unity Catalog et objets sécurisables.
- (Facultatif) Entrez un nom pour l’affichage des métriques. Par défaut, le titre de l’ensemble de données est converti en un nom de vue de mesure valide en fonction des exigences de nommage.
- (Facultatif) Modifiez l’affichage des métriques en ajustant le contenu généré dans la section de définition YAML .
- Cliquez sur Enregistrer.
Note
Par défaut, l’affichage des métriques est ajouté au tableau de bord lorsque vous le créez. Pour créer une vue de métrique qui n’est pas ajoutée au tableau de bord, désactivez l’option Ajouter un affichage métrique au tableau de bord en bas du panneau Créer une vue métrique .
Créer une vue de métriques à l’aide de l’Assistant Databricks
Créez une vue de métrique à partir d’un jeu de données à l’aide de l’Assistant Databricks :
- Cliquez sur l'icône de couleur de l'assistant d'aide
située dans la barre latérale gauche de l’éditeur de jeu de données. Cliquez ensuite sur Exporter en mode métrique.
- Entrez une description de la vue métrique que vous souhaitez créer.
- L’Assistant retourne un exemple de définition de vue de métrique et explique brièvement les dimensions et les mesures définies dans celui-ci.
- Cliquez sur Ouvrir l’éditeur d’affichage de métrique pour modifier et enregistrer l’affichage des métriques.
Pour plus d’informations sur la création d’une vue de métrique, consultez Créer une vue de métrique .
Calculs personnalisés
Les calculs personnalisés offrent un moyen d’appliquer des calculs à un jeu de données existant sans modifier le code SQL qui crée le jeu de données. Pour en savoir plus sur la création et l’utilisation de calculs personnalisés, consultez Qu’est-ce que les calculs personnalisés ?.
Écrire des requêtes à plusieurs instructions
Parfois, vous souhaiterez peut-être construire un jeu de données à l’aide de plusieurs instructions SQL. Pour exécuter plusieurs instructions, terminez chaque instruction par un point-virgule (;). Lorsque vous exécutez ces commandes pour créer le jeu de données, la sortie affiche les résultats de la dernière instruction dans l’éditeur. Ce jeu de données est utilisé pour toutes les visualisations associées sur le canevas.
Les déclarations sont locales au jeu de données où elles sont émises. Par exemple, si vous créez un jeu de données avec une instruction USE pour définir le catalogue ou le schéma, ce paramètre s’applique uniquement à ce jeu de données.
Examples
Les exemples suivants illustrent des utilisations courantes pour les requêtes à plusieurs instructions.
Définir le catalogue et le schéma
Vous pouvez écrire une instruction USE pour déclarer le catalogue et le schéma de la table dans votre requête. La requête suivante contient trois déclarations. Le premier définit le nom du catalogue. Le deuxième définit le schéma. L’instruction SELECT fait référence uniquement au nom de la table, car le catalogue et le schéma ont été définis. Voir USE CATALOG.
USE CATALOG samples;
USE SCHEMA tpch;
SELECT * FROM customer;
Définir le mode ANSI
Vous pouvez paramétrer une requête à exécuter avec ANSI_MODE réglé sur TRUE ou FALSE. Pour Databricks SQL, la valeur par défaut du système pour ANSI_MODE est TRUE. Voir ANSI_MODE.
La requête suivante définit ANSI_MODE sur FALSE afin que les entrées de type de données non valides retournent NULL plutôt que de provoquer une erreur.
SET ANSI_MODE = FALSE;
SELECT cast('a' AS INTEGER);
Paramétrer des requêtes complexes
Vous pouvez utiliser plusieurs instructions pour paramétrer le nom de la vue pour une expression de table commune ou une autre requête complexe.
La requête suivante crée deux vues temporaires. L’instruction SELECT utilise la clause IDENTIFIER pour interpréter la chaîne d’entrée en tant que nom de table. Consultez la clause IDENTIFIER.
CREATE TEMPORARY VIEW v1 AS SELECT 1;
CREATE TEMPORARY VIEW v2 AS SELECT 2;
SELECT * FROM IDENTIFIER(:view_name)
Définition des variables
La requête suivante déclare une variable et une valeur dans la première instruction. La deuxième instruction modifie la valeur de la variable. La troisième instruction indique que la valeur finale de la variable est 5. Consultez SET la variable pour plus d’informations et la syntaxe complète pour l’utilisation de variables temporaires.
DECLARE VARIABLE myvar1 INT DEFAULT 7;
SET VAR myvar1 = 5;
VALUES (myvar1);