Compartilhar via


Gerenciar a linhagem de vistas materializadas do lago no Fabric

As visões materializadas de lago de dados do Fabric são uma maneira eficiente de gerenciar e consultar grandes conjuntos de dados, pré-computando e armazenando os resultados de uma consulta. Em um ambiente de rede, gerenciar essas exibições de forma eficaz pode melhorar significativamente o desempenho e reduzir o tempo de consulta.

Este documento se aprofunda nos vários aspectos do gerenciamento de MLVs do Fabric, incluindo a compreensão da linhagem, o agendamento das execuções de MLV, a exploração do histórico de MLVs e o detalhamento das especificidades da execução operacional.

Exibir linhagem

Uma linhagem é uma estrutura fundamental para gerenciar dependências e agendar tarefas. No contexto de MLVs, a linhagem representa a sequência de MLV que precisa ser executada para atualizar o MLV quando novos dados estiverem disponíveis.

Depois de criar o MLV, selecione Gerenciar exibições de lago materializadas para navegar até a linhagem MLV.

Linhagem de vistas materializadas do lago

O fluxo de linhagem ou MLV é definido de acordo com o código escrito pelo usuário no notebook. Ele é criado depois que o fluxo de ponta a ponta do MLV é criado.

Importante

Todos os atalhos são tratados como entidades de origem na visualização de linhagem. Todas as tabelas ou exibições de lago materializado em um esquema de atalho são tratadas como entidades de origem na exibição de linhagem.

Captura de tela mostrando um grafo de trabalho em linhagem.

Para executar a linhagem, agende-a de acordo com suas necessidades. Depois que o grafo de tarefas estiver agendado, navegue até a execução atual e examine a visualização de linhagem.

Captura de tela mostrando uma exibição de linhagem executada.

Entender a visão de linhagem

A linhagem de um MLV garante que os dados sejam processados na ordem correta, respeitando todas as dependências. Cada nó na linhagem representa uma operação específica, como a leitura de uma tabela de origem ou a execução de uma transformação. Setas entre nós indicam as dependências, ditando a sequência de execução. Você pode selecionar um nó específico para entender o fluxo diretamente das tabelas de origem e dos nós pai para os nós dependentes também.

A interface do usuário de linhagem também tem as seguintes funcionalidades:

  • Atualizar: Essa opção permite atualizar a interface do usuário de linhagem para refletir as alterações recentes no status.

    Observação

    • Trata-se apenas de uma atualização de interface do usuário de linhagem e não uma atualização de dados.
    • A interface de usuário do Lineage é atualizada automaticamente a cada 2 minutos quando há uma execução em andamento ou se a guia do navegador do usuário estiver ativa.

    Captura de tela mostrando como atualizar uma interface do usuário de linhagem.

  • Nova vista materializada do lago: Você pode abrir um bloco de anotações para fazer alterações nos MLVs de acordo com seus requisitos.

    Observação

    Esses notebooks não estão diretamente vinculados a uma linha de linhagem e são usados para criar um MLV.

    Captura de tela mostrando uma nova exibição materializada do lago.

  • Horário: Você pode agendar uma execução de acordo com seus requisitos de negócios e atualizar os MLVs quando novos dados estiverem presentes.

Captura de tela mostrando o botão agendar.

  • Modo de Exibição de Alternância: Agora você pode alternar a exibição para a exibição Retrato ou Paisagem , dependendo do tamanho da linhagem.

  • Redefinir linha de dados Você pode ajustar a interface de linha de dados de acordo com o tamanho da tela usando esta opção.

    Captura de tela mostrando como alternar o layout do modo de exibição de linhagem.

Usar o ambiente personalizado

A capacidade de anexar um ambiente spark personalizado à linhagem MLV no Microsoft Fabric permite que os usuários otimizem o desempenho e o uso de recursos durante as atualizações de linhagem. Por padrão, a linhagem usa o ambiente do espaço de trabalho. No entanto, os usuários podem associar um ambiente específico à linhagem para adaptar as configurações de computação adequadas para cargas de trabalho diferentes. Somente os ambientes aos quais o usuário tem acesso podem ser selecionados e as alterações no ambiente entrarão em vigor na próxima atualização. Se o usuário não tiver acesso ao ambiente selecionado, ele poderá não ver o nome do ambiente ou detalhes específicos do workspace do ambiente e opções como "Agendar" ou "Executar" serão desabilitadas para o usuário. Nos casos em que o ambiente associado foi excluído, um erro é mostrado na lista suspensa, solicitando que o usuário escolha um ambiente acessível para continuar.