Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Los grupos de inicio son una manera rápida y sencilla de usar Spark en la plataforma de Microsoft Fabric en cuestión de segundos. Puede usar las sesiones de Spark de inmediato, en lugar de esperar a que Spark configure los nodos, lo que le ayuda a hacer más con los datos y obtener información más rápido.
Los grupos de inicio tienen clústeres de Spark siempre activados y listos para las solicitudes. Usan nodos de tamaño mediano y se pueden escalar verticalmente en función de los requisitos de carga de trabajo. La configuración predeterminada y los límites máximos de nodos para los grupos de inicio varían en función de la SKU de capacidad de Microsoft Fabric adquirida.
Prerrequisitos
Para personalizar un grupo de inicio, necesita acceso de administrador al área de trabajo.
Configuración del grupo de inicio
Puede especificar los nodos máximos para el escalado automático y establecer el límite máximo para los ejecutores en los grupos de inicio. En función de los nodos máximos que configure, el sistema adquiere y retira dinámicamente los nodos a medida que cambian los requisitos de proceso del trabajo, lo que da como resultado un escalado eficaz y un rendimiento mejorado.
Para administrar el grupo de inicio asociado al área de trabajo:
Vaya al área de trabajo y elija la configuración del área de trabajo.
A continuación, seleccione la opción Ingeniería de datos/Ciencia para expandir el menú.
Seleccione la opción StarterPool.
Puede establecer la configuración máxima de nodos para sus grupos de inicio en un número permitido basado en la capacidad adquirida o reducir la configuración máxima de nodos predeterminada a un valor menor cuando ejecute cargas de trabajo más pequeñas.
Cada SKU de capacidad de Microsoft Fabric tiene configuraciones predeterminadas específicas y límites máximos de nodos para los grupos de inicio. Las SKU de mayor capacidad admiten más nodos para controlar cargas de trabajo más grandes, mientras que las SKU más pequeñas tienen límites más restrictivos.
En la tabla siguiente se muestran las configuraciones disponibles por SKU:
Nombre de SKU Unidades de capacidad Núcleos virtuales de Spark Tamaño del nodo Nodos máximos predeterminados Número máximo de nodos F2 2 4 Media 1 1 F4 4 8 Media 1 1 F8 8 16 Media 2 2 F16 16 32 Media 3 4 F32 32 64 Media 8 8 F64 64 128 Media 10 16 (Capacidad de prueba) 64 128 Media 10 16 F128 128 256 Media 10 32 F256 256 512 Media 10 64 F512 512 1024 Media 10 128 F1024 1024 2048 Media 10 200 F2048 2048 4096 Media 10 200
Contenido relacionado
- Obtenga más información en la documentación pública de Apache Spark.
- Introducción a la configuración de administración del área de trabajo de Spark en Microsoft Fabric.