Partilhar via


Folha de truques do Power BI

Esta página fornece orientações claras e opinativas para gerir eficientemente os seus dados no Power BI e no Azure Databricks para otimizar o desempenho da consulta e criar dashboards eficientes.

Conectar o Azure Databricks e o Power BI

Melhores práticas Impacto Docs
Usar parâmetros do Power BI ao se conectar a diferentes ambientes do Azure Databricks Permite flexibilidade ao conectar-se a diferentes espaços de trabalho do Azure Databricks ou diferentes armazéns SQL do Azure Databricks.
Usar a funcionalidade do Azure Databricks para publicar no serviço Power BI Permite a integração perfeita do catálogo e a sincronização do modelo de dados sem sair da interface do usuário do Azure Databricks.
Usar a Publicação Automática do Azure Databricks no Power BI Publique conjuntos de dados do Unity Catalog no Power BI diretamente de pipelines de dados.

Escolha o modo de armazenamento mais apropriado

Melhores práticas Impacto Docs
Usar DirectQuery para tabelas de fatos e Dual para tabelas de dimensão (não importar) Gere consultas SQL mais eficientes usando o modo de armazenamento mais adequado.
Prefira o DirectQuery ao Import sempre que possível Permite manter a governança e a auditabilidade.
Usar modelos compostos para modos de armazenamento mistos Permite o uso misto de tabelas DirectQuery, Dual, modo de importação e tabelas de agregação e híbridas.
Use tabelas híbridas para dados históricos agregados com dados em tempo real Permite consultas eficientes na memória.

Otimize o acesso aos dados

Melhores práticas Impacto Docs
Usar agregações definidas pelo usuário Melhora o desempenho da consulta em modelos semânticos grandes do DirectQuery armazenando em cache dados pré-agregados.
Usar agregações automáticas Otimiza continuamente os modelos semânticos do DirectQuery criando agregações com base no Histórico de Consultas para obter o máximo desempenho do relatório.
Usar particionamento de tabela ou atualização incremental Permite importar dados mais rapidamente e gerenciar conjuntos de dados maiores, especialmente para relatórios muito pequenos, estáticos e sensíveis ao desempenho (menos de 2 segundos).
Adicionar Aplicar todas as segmentações e Limpar todas as segmentações botões Evita consultas desnecessárias aproveitando as configurações de redução de consultas quando os usuários interagem com filtros de relatório.
Use Assumir integridade referencial ao definir relações de tabela se a integridade referencial tiver sido validada na ingestão upstream Permite estratégias de junção mais eficientes em consultas SQL.

Ajuste seu modelo de dados

Melhores práticas Impacto Docs
Transformações "Mover para a esquerda" As visões SQL utilizam o poder do mecanismo Databricks SQL para execução mais eficiente de relatórios em comparação com as transformações do PowerQuery e as fórmulas DAX.
Se você precisar usar fórmulas DAX, otimize as fórmulas DAX e evite grandes conjuntos de resultados. Evita cálculos ineficientes que levam a um desempenho deteriorado
Evite colunas calculadas DAX e tabelas calculadas em modelos semânticos e defina esses dados diretamente em suas tabelas Gold As medidas pré-calculadas têm melhor desempenho na camada Gold
Para DirectQuery, verifique as definições de configuração de paralelização de consulta Melhora a paralelização de consultas e maximiza a utilização do SQL warehouse para melhorar o desempenho geral.
Para DirectQuery, verifique quantas consultas o Power BI pode enviar em paralelo ao Azure Databricks Garante que o armazém SQL do Databricks seja dimensionado apropriadamente para lidar com o nível necessário de paralelismo, evitando que as consultas sejam enfileiradas, resultando num relatório lento.

Monitore o desempenho e as métricas

Melhores práticas Impacto Docs
Usar o Power BI Performance Analyzer para examinar o desempenho do elemento de relatório Identifica a visualização que leva mais tempo para carregar e onde está o gargalo.
Avalie as seguintes propriedades dos modelos semânticos do Power BI:
  • Máximo de conexões por fonte de dados
  • Número máximo de avaliações simultâneas
  • Número máximo de trabalhos simultâneos
  • MaxParallelismPerQuery
Ajusta o desempenho do modelo.