Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cette page explique le modèle de données et les considérations utilisées dans les exemples montrant comment créer une vue de métrique à l’aide de SQL ou de l’interface utilisateur.
Vue d’ensemble de l’exemple de jeu de données
Les exemples fournis dans Utiliser SQL pour créer et gérer des vues de métriques et créer une vue de métrique à l’aide de l’interface utilisateur de l’Explorateur de catalogues utilisent le jeu de données TPC-H, disponible par défaut dans les jeux de données catalogue Unity.
Le jeu de données TPC-H est un jeu de données de référence standard utilisé pour évaluer les systèmes de prise de décision et les performances des requêtes. Il modélise une entreprise de chaîne d’approvisionnement en gros et est structuré autour d’opérations commerciales courantes telles que les commandes, les clients, les fournisseurs et les pièces. Il représente un environnement de vente et de distribution, où les clients passent des commandes pour les pièces fournies par différents fournisseurs dans différentes nations et régions.
Le schéma comporte 8 tables :
REGIONetNATION: ces tables définissent l’emplacement.CUSTOMERetSUPPLIER: Ces tables décrivent les entités métier.PARTetPARTSUPP: Ces tables capturent les informations sur les produits et la disponibilité des fournisseurs.ORDERSetLINEITEM: Ces tables représentent des transactions, avec des articles de ligne détaillant les produits dans les commandes.
TPC-H jeu de données ERD
Le diagramme suivant explique les relations entre les tables.
Légende :
- Les parenthèses qui suivent chaque nom de table contiennent le préfixe des noms de colonnes pour cette table ;
- Les flèches pointent dans la direction des relations un-à-plusieurs entre les tables ;
- Le nombre/formule sous chaque nom de table représente la cardinalité (nombre de lignes) de la table. Certains sont pris en compte par SF, le facteur d’échelle, pour obtenir la taille de base de données choisie. La cardinalité de la table LINEITEM est approximative (voir la clause 4.2.5).
(source : Spécification TPC Benchmark H Standard)
Définir une vue de métrique
Vous pouvez définir une vue de métrique à l’aide de SQL DDL ou de l’interface utilisateur de l’Explorateur de catalogues. L’Assistant Databricks peut également vous aider à commencer à créer votre vue de métriques. Ensuite, vous pouvez modifier la DDL SQL fournie ou utiliser l’éditeur de vue de métrique dans l’interface utilisateur pour affiner la définition suggérée.
L’affichage des métriques défini pour les exemples de cette section est conçu pour un analyste commercial ou financier afin de surveiller les indicateurs de performance clés (KPI) liés aux commandes de l’entreprise. Il peut vous aider à répondre à des questions telles que :
- Comment notre chiffre d’affaires total a-t-il tendance au fil du temps ?
- Quelle est la répartition actuelle de nos commandes par état (Ouvert, Traitement, Rempli) ?
- Quelles priorités d’ordre génèrent le plus de revenus ?
- Quel est le chiffre d’affaires actuellement « à risque » ou en attente (c’est-à-dire, à partir des commandes Open) ?
- Quel est le chiffre d’affaires moyen généré par client unique ?
Les composants nécessaires sont décrits dans le tableau suivant :
| Composant | Champ/expression YAML | Sens commercial |
|---|---|---|
| Table source | samples.tpch.orders |
Données brutes contenant les enregistrements de commande client. |
| Filter | o_orderdate > '1990-01-01' |
Concentre l’analyse uniquement sur les commandes passées après le 1er janvier 1990, probablement à l’exclusion des données historiques ou archivées. |
| Dimension : Mois de commande | (DATE_TRUNC('MONTH', o_orderdate)) |
Active l’analyse des tendances (mois sur mois/année sur année), suivi de la façon dont les performances changent au fil du temps. |
| Dimension : État de la commande |
CASE instruction qui traduit l’état en Open, Processingou Fulfilled |
Permet la segmentation par phase de cycle de vie, utile pour la gestion du traitement et du backlog. |
| Dimension : Priorité de commande |
SPLIT instruction qui met en forme la priorité de l’ordre en tant que nombre |
Utilisé pour regrouper les performances par l’importance stratégique ou l’urgence de l’ordre. |
| Mesure : Nombre de commandes | COUNT(1) |
Mesure l’activité des ventes en volume |
| Mesure : Chiffre d’affaires total | SUM(o_totalprice) |
Valeur brute des ventes de toutes les commandes |
| Mesure : Chiffre d’affaires total par client | SUM(o_totalprice) / COUNT(DISTINCT o_custkey) |
Métrique de valeur client utile pour évaluer la qualité des transactions client. |
| Mesure : Revenu total pour les commandes ouvertes | SUM(o_totalprice) FILTER (WHERE o_orderstatus='O') |
Valeur du chiffre d’affaires non gagné ou du carnet de commandes actuel des ventes. Utilisé pour la prévision et l’évaluation des risques. |
Interroger l’Assistant Databricks
L’Assistant Databricks peut vous aider à commencer à définir une vue de métrique.
- Cliquez sur
icône de l’Assistant dans le coin supérieur droit de votre espace de travail Databricks pour ouvrir l’Assistant.
- Tapez une description de la vue métrique que vous souhaitez créer. L’Assistant retourne SQL DDL qui tente de correspondre à votre requête.
- Copiez le code SQL fourni et collez-le dans l’éditeur SQL. Cliquez ensuite sur Exécuter.
- Modifiez sql ou ouvrez l’éditeur de vue de métrique pour effectuer des ajustements.
Créer une vue de métrique
Utilisez l’un des exemples suivants pour créer une vue de métrique :