Compartilhar via


Definir e gerenciar configurações de engenharia e ciência de dados para capacidades do Fabric

Aplica-se a:✅ Engenharia e Ciência de Dados no Microsoft Fabric

Quando você cria o Microsoft Fabric no portal do Azure, ele é adicionado automaticamente ao locatário do Fabric associado à assinatura usada para criar a capacidade. Com a configuração simplificada no Microsoft Fabric, não é necessário vincular a capacidade ao locatário do Fabric. Porque a capacidade recém-criada será listada no painel de configurações do administrador. Essa configuração fornece uma experiência mais rápida para os administradores começarem a configurar a capacidade para suas equipes de análise corporativa.

Para fazer alterações nas configurações de Engenharia/Ciência de Dados em uma capacidade, você deve ter uma função de administrador para essa capacidade. Para saber mais sobre as funções que você pode atribuir aos usuários em uma capacidade, consulte Funções em capacidades.

Use as seguintes etapas para gerenciar as configurações de Engenharia/Ciência de Dados para a capacidade do Microsoft Fabric:

  1. Selecione a opção Configurações para abrir o painel de configuração da sua conta do Fabric. Selecione o portal de administração na seção Governança e insights.

    Captura de tela mostrando onde selecionar as configurações do Portal de Administração.

  2. Escolha a opção Configurações de Capacidade para expandir o menu e selecione a guia Capacidade do Fabric. Aqui você deve ver as capacidades que criou no seu tenant. Escolha a capacidade que deseja configurar.

    Captura de tela mostrando onde selecionar as configurações de capacidade.

  3. Você é levado ao painel de detalhes de capacidade, onde pode visualizar o uso e outros controles administrativos para a sua capacidade. Navegue até a seção Configurações de Engenharia/Ciência de Dados e selecione Abrir Computação do Spark. Configure os seguintes parâmetros:

Observação

Pelo menos um espaço de trabalho deve ser vinculado à Capacidade da Fabric para explorar as Configurações de Ciência/Engenharia de Dados no Portal de Administração da Capacidade da Fabric.


Controle de administrador: desabilitar o uso do Pool de Inicialização

Os administradores de capacidade agora podem optar por desabilitar o uso do Starter Pool nos workspaces anexados à capacidade. Quando desabilitados, os usuários e os administradores do workspace não verão mais o Pool inicial como uma opção de computação. Em vez disso, eles devem usar pools personalizados explicitamente criados e gerenciados pelo administrador de capacidade.

Esse recurso fornece governança centralizada para uso de computação, garantindo um controle mais rígido sobre o dimensionamento de computação, o custo e o comportamento de agendamento.

Dica

Essa configuração é especialmente útil em grandes organizações que desejam padronizar padrões de computação e evitar o consumo arbitrário por meio de pools de inicialização padrão.


Controle de administrador: comutador de intermitência no nível do trabalho

O Microsoft Fabric dá suporte ao bursting de 3× para VCores Spark, permitindo que um único trabalho use temporariamente mais núcleos de computação do que a capacidade base disponível. Isso melhora o desempenho do trabalho durante intermitências de atividade, permitindo a utilização total da capacidade.

Como administrador de capacidade, agora você pode controlar esse comportamento usando a opção "Desabilitar intermitência no nível do trabalho" disponível no Portal de Administração:

  • Local:
    Admin Portal → Capacity Settings → [Select Capacity] → Data Engineering/Science Settings → Spark Compute

  • Comportamento:

    • Habilitado (Padrão): um único job do Spark pode consumir o limite de explosão total (até 3× VCores Spark).
    • Desabilitado: os trabalhos individuais do Spark são limitados à alocação de capacidade base, preservando a simultaneidade e evitando a monopolização.

Observação

Essa opção só está disponível ao executar trabalhos do Spark na Capacidade do Fabric. Se a opção de Cobrança de Escalonamento Automático estiver habilitada, esse alternador será desativado automaticamente porque:

  • O dimensionamento automático de cobrança segue estritamente um modelo de pagamento conforme o uso.
  • Não há janela de suavização para permitir picos de uso e balanceá-los durante 24 horas.
  • O estouro de capacidade é um recurso de capacidade reservada, não de computação de escalonamento automático sob demanda.

Casos de uso e exemplos

Cenário Configurações Comportamento
Carga de trabalho de ETL pesada Bursting habilitado (padrão) O trabalho pode usar toda a capacidade de intermitência (por exemplo, 384 VCores Spark em F64).
Notebooks interativos de vários usuários Explosão desabilitada O uso de tarefas é limitado (por exemplo, 128 VCores Spark em F64), melhorando a simultaneidade.
A cobrança por dimensionamento automático está ativada. Controle de rajadas indisponível Todo o uso do Spark é cobrado conforme o uso; sem ultrapassagem da capacidade base.

Dica

Use essa opção para otimizar a taxa de transferência ou simultaneidade:

  • Mantenha a intermitência habilitada para grandes trabalhos e pipelines.
  • Desabilite-o para ambientes interativos ou compartilhados com muitos usuários .

Pools de capacidade para engenharia de dados e ciência de dados no Microsoft Fabric

  1. Na seção Lista de Pools das Configurações do Spark, clique em Adicionar para criar um Pool Personalizado para sua Capacidade do Fabric.

    Captura de tela mostrando a seção lista de pools nas configurações do Portal de Administração.

    Você navega até a página de criação do pool, onde pode:

    • Especificar o nome do pool
    • Selecionar a família node e o tamanho do nó
    • Defina nós Min e Max
    • Habilitar/desabilitar o dimensionamento automático e a alocação dinâmica de executores

    Captura de tela mostrando a seção de criação do pool nas configurações do Portal de Administração.

  2. Selecione Criar para salvar suas configurações.

    Captura de tela mostrando os pools de capacidade salvos nas configurações do Portal de Administração.

Observação

Pools personalizados com nível de capacidade têm uma latência de inicialização de 2 a 3 minutos. Para uma inicialização de sessão Spark mais rápida (<5 segundos), use Starter Pools, se habilitado.

  1. Depois de criado, o pool de capacidade fica disponível em:

    • A lista suspensa Seleção do Pool nas configurações do espaço de trabalho
    • A página Configurações de Computação do Ambiente nos workspaces

    Captura de tela mostrando os pools de capacidade listados nas configurações do Workspace.

    Captura de tela mostrando os pools de capacidade listados nas configurações do Ambiente.

  2. Isso permite a governança de computação centralizada. Os administradores podem criar pools padronizados e, opcionalmente, desabilitar a personalização no nível do workspace, impedindo que os administradores em workspaces modifiquem as configurações do pool ou criem suas próprias.