Delen via


Cheatsheet voor het plannen van productietaken

Dit artikel heeft als doel om duidelijke en diepgaande adviezen te geven voor de planning van de productie. Het gebruik van best practices kan helpen de kosten te verlagen, de prestaties te verbeteren en de beveiliging te verbeteren.

Best practice Invloed Documenten
Taakclusters gebruiken voor geautomatiseerde werkstromen Kosten: jobclusters worden gefactureerd tegen lagere tarieven dan interactieve clusters.
Langlopende clusters opnieuw opstarten Beveiliging: start clusters opnieuw om te profiteren van patches en bugfixes voor de Databricks Runtime.
Service-principals gebruiken in plaats van gebruikersaccounts om productietaken uit te voeren Beveiliging: als taken eigendom zijn van afzonderlijke gebruikers, kunnen deze taken niet meer worden uitgevoerd wanneer deze gebruikers de organisatie verlaten.
Gebruik Lakeflow Jobs voor orkestratie waar mogelijk Kosten: u hoeft geen externe hulpprogramma's te gebruiken om te organiseren als u alleen workloads in Azure Databricks indelen.
De nieuwste LTS-versie van Databricks Runtime gebruiken Prestaties en kosten: Azure Databricks verbetert altijd Databricks Runtime voor bruikbaarheid, prestaties en beveiliging.
Productiegegevens niet opslaan in dbFS-hoofdmap Beveiliging: wanneer gegevens worden opgeslagen in de DBFS-hoofdmap, hebben alle gebruikers er toegang toe.