Delen via


Data engineering- en data science-instellingen configureren en beheren voor Fabric-capaciteiten

Van toepassing op:✅ Data-engineer ing en Datawetenschap in Microsoft Fabric

Wanneer u Microsoft Fabric maakt vanuit Azure Portal, wordt deze automatisch toegevoegd aan de Fabric-tenant die is gekoppeld aan het abonnement dat wordt gebruikt om de capaciteit te maken. Met de vereenvoudigde installatie in Microsoft Fabric hoeft u de capaciteit niet te koppelen aan de Fabric-tenant. Omdat de zojuist gemaakte capaciteit wordt weergegeven in het deelvenster met beheerinstellingen. Deze configuratie biedt een snellere ervaring voor beheerders om de capaciteit voor hun enterprise analytics-teams in te stellen.

Als u wijzigingen wilt aanbrengen in de Data-engineer/Science-instellingen in een capaciteit, moet u de beheerdersrol voor die capaciteit hebben. Zie Rollen in capaciteiten voor meer informatie over de rollen die u aan gebruikers in een capaciteit kunt toewijzen.

Gebruik de volgende stappen om de Data-engineer/Science-instellingen voor Microsoft Fabric-capaciteit te beheren:

  1. Selecteer de optie Instellingen om het instellingsvenster voor uw Fabric-account te openen. Selecteer de beheerportal onder de sectie Governance en inzichten.

    Schermopname die laat zien waar u instellingen voor de beheerportal selecteert.

  2. Kies de optie Capaciteitsinstellingen om het menu uit te vouwen en selecteer het tabblad Infrastructuurcapaciteit . Hier ziet u de capaciteiten die u in uw tenant hebt gemaakt. Kies de capaciteit die u wilt configureren.

    Schermopname die laat zien waar u Capaciteitsinstellingen selecteert.

  3. U gaat naar het deelvenster met capaciteitsgegevens, waar u het gebruik en andere beheerbesturingselementen voor uw capaciteit kunt bekijken. Ga naar de sectie Data-engineer ing/Science Settings en selecteer Spark Compute openen. Configureer de volgende parameters:

Notitie

Ten minste één werkruimte moet worden gekoppeld aan de infrastructuurcapaciteit om de Data Engineering/Science-instellingen te verkennen vanuit de portal voor infrastructuurcapaciteitsbeheerders.


Beheerbeheer: Gebruik van starterspool uitschakelen

Capaciteitsbeheerders kunnen er nu voor kiezen om het gebruik van Starter-pool uit te schakelen tussen werkruimten die aan de capaciteit zijn gekoppeld. Wanneer deze optie is uitgeschakeld, zien gebruikers en werkruimtebeheerders de Starter-pool niet meer als rekenoptie. In plaats daarvan moeten ze aangepaste pools gebruiken die expliciet zijn aangemaakt en beheerd door de capaciteitsbeheerder.

Deze functie biedt gecentraliseerd beheer voor rekengebruik, waardoor de rekengrootte, de kosten en het planningsgedrag strakker worden gecontroleerd.

Aanbeveling

Deze instelling is vooral handig in grote organisaties die rekenpatronen willen standaardiseren en willekeurig verbruik willen voorkomen via standaardstartgroepen.


Beheerbeheer: Bursting-switch op taakniveau

Microsoft Fabric ondersteunt 3× bursting voor Spark VCores, waardoor één taak tijdelijk meer rekenkernen kan gebruiken dan de basiscapaciteit biedt. Dit verbetert de prestaties van taken tijdens pieken in de activiteit door het volledige capaciteitsgebruik toe te staan.

Als capaciteitsbeheerder kunt u dit gedrag nu beheren met behulp van de schakeloptie Bursting op taakniveau uitschakelen die beschikbaar is in de beheerportal:

  • Locatie:
    Admin Portal → Capacity Settings → [Select Capacity] → Data Engineering/Science Settings → Spark Compute

  • Gedrag:

    • Ingeschakeld (standaard):één Spark-taak kan de volledige burstlimiet (maximaal 3× Spark-VCores) verbruiken.
    • Uitgeschakeld: individuele Spark-taken zijn beperkt tot de basiscapaciteitstoewijzing, waardoor gelijktijdigheid behouden blijft en monopolisatie wordt vermeden.

Notitie

Deze schakelaar is alleen beschikbaar bij het uitvoeren van Spark-taken op Fabric Capacity. Als de optie Facturering automatisch schalen is ingeschakeld, wordt deze schakeloptie automatisch uitgeschakeld omdat:

  • De autoschaal facturering volgt een echt betalen-per-gebruik model.
  • Er is geen afvlakkingsperiode om gebruikspieken toe te laten en deze gedurende 24 uur in balans te brengen.
  • Bursting is een functie van gereserveerde capaciteit, niet van rekenkracht op aanvraag voor automatische schaalaanpassing.

Gebruiksvoorbeelden en voorbeelden

Scenariobeschrijving Configuratie Gedrag
Zware ETL-werkbelasting Bursting ingeschakeld (standaard) Job kan de volledige burstcapaciteit gebruiken (bijvoorbeeld 384 Spark VCores in F64).
Interactieve notebooks voor meerdere gebruikers Bursting uitgeschakeld Het taakgebruik wordt beperkt (bijvoorbeeld 128 Spark-VCores in F64), waardoor gelijktijdigheid wordt verbeterd.
Facturering voor autoscaling is ingeschakeld Bursting-besturingselement niet beschikbaar Al het Spark-gebruik wordt op aanvraag gefactureerd; geen bursting van basiscapaciteit.

Aanbeveling

Gebruik deze switch om te optimaliseren voor doorvoer of gelijktijdigheid:

  • Bursting ingeschakeld houden voor grote taken en pijplijnen.
  • Schakel deze optie uit voor interactieve of gedeelde omgevingen met veel gebruikers.

Capaciteitspools voor Data Engineering en Data Science in Microsoft Fabric

  1. Klik in de sectie Poollijst van Spark-instellingen op Toevoegen om een Aangepaste Pool voor uw Fabric-capaciteit te maken.

    Schermopname van de sectie lijst met pools in de beheerportal-instellingen.

    U gaat naar de pagina voor het maken van een pool, waar u het volgende kunt doen:

    • Geef de naam van de pool op
    • Knooppuntfamilie en knooppuntgrootte selecteren
    • Min- en max-knooppunten instellen
    • Automatische schaalaanpassing en dynamische toewijzing van uitvoerders in-/uitschakelen

    Schermopname van de sectie voor het maken van een pool in de beheerportal-instellingen.

  2. Selecteer Maken om uw instellingen op te slaan.

    Schermopname van de capaciteitspools die zijn opgeslagen in de beheerportal-instellingen.

Notitie

Aangepaste pools op capaciteitsniveau hebben een opstartlatentie van 2-3 minuten. Gebruik Starterspools indien ingeschakeld voor een snellere opstartsessie (<5 seconden).

  1. Zodra de capaciteitspool is gemaakt, wordt deze beschikbaar in:

    • De vervolgkeuzelijst Poolselectie in werkruimte-instellingen
    • De pagina met instellingen voor omgevingsberekeningen in werkruimten

    Schermopname van de capaciteitspools die worden vermeld in werkruimte-instellingen.

    Schermopname van de capaciteitspools die worden vermeld in omgevingsinstellingen.

  2. Dit maakt gecentraliseerde rekenbeheer mogelijk. Beheerders kunnen gestandaardiseerde pools maken en eventueel aanpassingen op werkruimteniveau uitschakelen, zodat beheerders in werkruimten geen groepsinstellingen kunnen wijzigen of hun eigen instellingen kunnen maken.