Partager via


Aide-mémoire Power BI

Cette page fournit des instructions claires et avisées pour gérer efficacement vos données dans Power BI et Azure Databricks afin d’optimiser les performances des requêtes et de créer des tableaux de bord efficaces.

Connecter Azure Databricks et Power BI

Meilleure pratique Impact Docs
Utiliser des paramètres Power BI lors de la connexion à différents environnements Azure Databricks Permet une flexibilité lors de la connexion à différents espaces de travail Azure Databricks ou à différents entrepôts AZURE Databricks SQL.
Utiliser la fonctionnalité de publication d'Azure Databricks vers le service Power BI Permet l’intégration transparente du catalogue et la synchronisation des modèles de données sans quitter l’interface utilisateur Azure Databricks.
Utiliser la publication automatique Azure Databricks dans Power BI Publiez des jeux de données à partir du catalogue Unity sur Power BI directement à partir de pipelines de données.

Choisir le mode de stockage le plus approprié

Meilleure pratique Impact Docs
Utiliser DirectQuery pour les tables de faits et Dual pour les tables de dimension (et non pas Importer) Générez des requêtes SQL plus efficaces à l’aide du mode de stockage le plus approprié.
Préférer DirectQuery à l’importation dans la mesure du possible Vous permet de maintenir la gouvernance et l’audibilité.
Utiliser des modèles composites pour les modes de stockage mixtes Permet une utilisation mixte des tables DirectQuery, Dual, Import, et des tables d'agrégation et hybrides.
Utiliser des tables hybrides pour les données historiques agrégées avec des données en temps réel Active des requêtes en mémoire efficaces.

Optimiser l’accès aux données

Meilleure pratique Impact Docs
Utiliser des agrégations définies par l’utilisateur Améliore les performances des requêtes sur les modèles sémantiques DirectQuery volumineux en mettant en cache des données pré-agrégées.
Utiliser des agrégations automatiques Optimise en permanence les modèles sémantiques DirectQuery en créant des agrégations basées sur l’historique des requêtes pour optimiser les performances des rapports.
Utiliser le partitionnement de table ou l’actualisation incrémentielle Permet d’importer des données plus rapidement et de gérer des jeux de données plus volumineux, en particulier pour les rapports très petits, statiques et sensibles aux performances (moins de 2 secondes).
Ajouter des boutons Appliquer tous les segments et Effacer tous les segments Empêche les requêtes inutiles en tirant parti des paramètres de réduction des requêtes lorsque les utilisateurs interagissent avec des filtres de rapport.
Utiliser Supposer l’intégrité référentielle lors de la définition des relations de table si l’intégrité référentielle a été validée dans l’ingestion en amont. Permet des stratégies de jointure plus efficaces dans les requêtes SQL.

Ajuster votre modèle de données

Meilleure pratique Impact Docs
Transformations « Déplacement à gauche » Les vues SQL tirent parti de la puissance du moteur SQL Databricks pour une exécution de rapport plus efficace par rapport aux transformations PowerQuery et aux formules DAX.
Si vous devez utiliser des formules DAX, optimisez les formules DAX et évitez les jeux de résultats volumineux. Empêche les calculs inefficaces qui entraînent une détérioration des performances
Évitez les colonnes calculées DAX et les tables calculées dans les modèles sémantiques et définissez ces données directement dans vos tables Gold Les mesures précomputées fonctionnent le mieux dans la couche Or
Pour DirectQuery, recherchez les paramètres de configuration de la parallélisation des requêtes Améliore la parallélisation des requêtes et optimise l’utilisation de SQL Warehouse pour améliorer les performances globales.
Pour DirectQuery, vérifiez le nombre de requêtes que Power BI peut envoyer en parallèle à Azure Databricks Garantit que l’entrepôt SQL Databricks est dimensionné en conséquence pour gérer le niveau de parallélisme requis pour éviter que les requêtes soient mises en file d’attente, ce qui entraîne un rapport lent.

Surveiller les performances et les métriques

Meilleure pratique Impact Docs
Utiliser Power BI Performance Analyzer pour examiner les performances des éléments de rapport Identifie la visualisation qui prend le plus de temps à charger et où se trouve le goulot d’étranglement.
Évaluez les propriétés suivantes des modèles sémantiques Power BI :
  • Nombre maximal de connexions par source de données
  • Nombre maximal d’évaluations simultanées
  • Nombre maximal de travaux simultanés
  • MaxParallelismPerQuery
Ajuste finement les performances du modèle.