Compartir a través de


Configuración de grupos de inicio en Microsoft Fabric

Los grupos de inicio son una manera rápida y sencilla de usar Spark en la plataforma de Microsoft Fabric en cuestión de segundos. Puede usar las sesiones de Spark de inmediato, en lugar de esperar a que Spark configure los nodos, lo que le ayuda a hacer más con los datos y obtener información más rápido.

Los grupos de inicio tienen clústeres de Spark siempre activados y listos para las solicitudes. Usan nodos de tamaño mediano y se pueden escalar verticalmente en función de los requisitos de carga de trabajo. La configuración predeterminada y los límites máximos de nodos para los grupos de inicio varían en función de la SKU de capacidad de Microsoft Fabric adquirida.

Prerrequisitos

Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.

Configuración del grupo de inicio

Puede especificar los nodos máximos para el escalado automático y establecer el límite máximo para los ejecutores en los grupos de inicio. En función de los nodos máximos que configure, el sistema adquiere y retira dinámicamente los nodos a medida que cambian los requisitos de proceso del trabajo, lo que da como resultado un escalado eficaz y un rendimiento mejorado.

Para administrar el grupo de inicio asociado al área de trabajo:

  1. Vaya al área de trabajo y elija la configuración del área de trabajo.

    Captura de pantalla que muestra dónde seleccionar Ingeniería de datos en el menú de configuración del área de trabajo.

  2. A continuación, seleccione la opción Ingeniería de datos/Ciencia para expandir el menú.

    Captura de pantalla que muestra la vista de detalles de configuración de Spark.

  3. Seleccione la opción StarterPool.

    Captura de pantalla que muestra las opciones de configuración del grupo de inicio.

  4. Puede establecer la configuración máxima de nodos para sus grupos de inicio en un número permitido basado en la capacidad adquirida o reducir la configuración máxima de nodos predeterminada a un valor menor cuando ejecute cargas de trabajo más pequeñas.

    Cada SKU de capacidad de Microsoft Fabric tiene configuraciones predeterminadas específicas y límites máximos de nodos para los grupos de inicio. Las SKU de mayor capacidad admiten más nodos para controlar cargas de trabajo más grandes, mientras que las SKU más pequeñas tienen límites más restrictivos.

    Captura de pantalla que muestra las opciones max node y max executor del grupo de inicio para el escalado automático y la asignación dinámica.

    En la tabla siguiente se muestran las configuraciones disponibles por SKU:

    Nombre de SKU Unidades de capacidad Núcleos virtuales de Spark Tamaño del nodo Nodos máximos predeterminados Número máximo de nodos
    F2 2 4 Media 1 1
    F4 4 8 Media 1 1
    F8 8 16 Media 2 2
    F16 16 32 Media 3 4
    F32 32 64 Media 8 8
    F64 64 128 Media 10 16
    (Capacidad de prueba) 64 128 Media 10 16
    F128 128 256 Media 10 32
    F256 256 512 Media 10 64
    F512 512 1024 Media 10 128
    F1024 1024 2048 Media 10 200
    F2048 2048 4096 Media 10 200