Partilhar via


Configurar e gerir definições de engenharia de dados e ciência de dados para capacidades do Fabric

Aplica-se a:✅ Engenharia de Dados e Ciência de Dados no Microsoft Fabric

Quando se cria o Fabric da Microsoft a partir do portal do Azure, ele é adicionado automaticamente ao tenant do Fabric associado à assinatura usada para criar a capacidade correspondente. Com a configuração simplificada no Microsoft Fabric, não há necessidade de vincular a capacidade ao locatário do Fabric. Porque a capacidade recém-criada será listada no painel de configurações de administrador. Essa configuração fornece uma experiência mais rápida para os administradores começarem a configurar a capacidade para suas equipes de análise corporativa.

Para fazer alterações nas configurações de Engenharia/Ciência de Dados em uma capacidade, você deve ter uma função de administrador para essa capacidade. Para saber mais sobre as funções que você pode atribuir aos usuários em uma capacidade, consulte Funções em capacidades.

Use as seguintes etapas para gerenciar as configurações de Engenharia/Ciência de Dados para a capacidade do Microsoft Fabric:

  1. Selecione a opção Configurações para abrir o painel de configuração da sua conta do Fabric. Selecione Portal de administração na seção Governança e informações.

    Captura de tela mostrando onde selecionar as configurações do Portal de Administração.

  2. Escolha a opção Configurações de capacidade para expandir o menu e selecione a guia Capacidade da infraestrutura. Aqui, deverá ver as capacidades que criou no seu ambiente. Escolha a capacidade que deseja configurar.

    Captura de tela mostrando onde selecionar Configurações de capacidade.

  3. Você é direcionado para o painel de detalhes de capacidade, onde pode ver o uso e outros controles administrativos da sua capacidade. Navegue até a seção Configurações de Engenharia/Ciência de Dados e selecione Abrir Computação do Spark. Configure os seguintes parâmetros:

Nota

Pelo menos um espaço de trabalho deve estar associado ao Fabric Capacity para explorar as Configurações de Engenharia/Ciência de Dados no Portal de Administração de Capacidade do Fabric.


Controle de administrador: Desativar o uso do Starter Pool

Os administradores de capacidade agora podem optar por desativar o uso do Starter Pool em espaços de trabalho anexados à capacidade. Quando desativado, os usuários e administradores do espaço de trabalho não verão mais o Starter Pool como uma opção de computação. Em vez disso, eles devem usar pools personalizados explicitamente criados e gerenciados pelo administrador de capacidade.

Esse recurso fornece governança centralizada para uso de computação, garantindo um controle mais rígido sobre o dimensionamento, o custo e o comportamento de agendamento da computação.

Sugestão

Essa configuração é especialmente útil em grandes organizações que desejam padronizar padrões de computação e evitar o consumo arbitrário por meio de pools iniciais padrão.


Controle de administrador: Interruptor de bursting no nível do trabalho

O Microsoft Fabric dá suporte ao bursting de 3× para o Spark VCores, permitindo que um único trabalho use temporariamente mais núcleos de computação do que a capacidade base fornece. Isso melhora o desempenho do trabalho durante picos de atividade, permitindo a utilização total da capacidade.

Como administrador de capacidade, agora você pode controlar esse comportamento usando a opção "Desativar intermitência no nível de trabalho" disponível no Portal de Administração:

  • Localização:
    Admin Portal → Capacity Settings → [Select Capacity] → Data Engineering/Science Settings → Spark Compute

  • Comportamento:

    • Ativado (padrão): um único trabalho do Spark pode consumir o limite máximo de explosão (até 3× VCores do Spark).
    • Desativado: Os trabalhos individuais do Spark são limitados à alocação de capacidade base, preservando a simultaneidade e evitando a monopolização.

Nota

Esta opção só está disponível ao executar tarefas do Spark em Fabric Capacity. Se a opção Autoscale Billing estiver ativada, esta opção é automaticamente desativada porque:

  • O Autoscale Billing segue um modelo puro de pagamento conforme o uso.
  • Não há janela de suavização para permitir picos de uso e equilibrá-los ao longo de 24 horas.
  • Bursting é um recurso de capacidade reservada, não computação de escala automática sob demanda.

Casos de utilização e exemplos

Cenário Configurações Comportamento
Carga de trabalho de ETL pesada Bursting ativado (padrão) O trabalho pode usar toda a capacidade de burst (por exemplo, 384 Spark VCores em F64).
Blocos de notas interativos multiutilizador Bursting desativado O uso de tarefas é limitado (por exemplo, 128 Spark VCores no F64), melhorando a concorrência.
A Faturação de Dimensionamento Automático está ativada Controle de explosão indisponível Todo o uso do Spark é cobrado conforme a utilização; sem aumento da capacidade básica.

Sugestão

Use esta opção para otimizar a taxa de transferência ou simultaneidade:

  • Mantenha o bursting ativado para grandes trabalhos e pipelines.
  • Desative-o para ambientes interativos ou compartilhados com muitos usuários.

Pools de capacidade para engenharia de dados e ciência de dados no Microsoft Fabric

  1. Na seção Lista de Pools das Configurações do Spark, clique em Adicionar para criar um Pool Personalizado para a sua Capacidade de Fabric.

    Captura de ecrã a mostrar a secção da lista de grupos nas definições do Portal de Administração.

    Você é direcionado para a página de criação de pool, onde pode:

    • Especifique o nome do pool
    • Selecione a família de nós e o tamanho do nó
    • Definir nós Mínimo e Máximo
    • Ativar/desativar o dimensionamento automático e a alocação dinâmica de executores

    Captura de tela mostrando a seção de criação de pool nas configurações do Portal de Administração.

  2. Selecione Criar para salvar suas configurações.

    Captura de tela mostrando os pools de capacidade salvos nas configurações do Portal de Administração.

Nota

Os pools personalizados de nível de capacidade têm uma latência de inicialização de 2 a 3 minutos. Para uma inicialização mais rápida da sessão do Spark (<5 segundos), use Starter Pools se ativado.

  1. Uma vez criado, o pool de capacidade fica disponível em:

    • O menu suspenso Seleção de Pool nas configurações do espaço de trabalho
    • A página Configurações de Computação do Ambiente em espaços de trabalho

    Captura de tela mostrando os pools de capacidade listados nas configurações do espaço de trabalho.

    Captura de tela mostrando os pools de capacidade listados em Configurações de ambiente.

  2. Isso permite a governança de computação centralizada. Os administradores podem criar pools padronizados e, opcionalmente, desabilitar a personalização no nível do espaço de trabalho, impedindo que os administradores nos espaços de trabalho modifiquem as configurações do pool ou criem suas próprias.