Compartilhar via


Guia rápido para agendamento de trabalhos de produção

Este artigo tem como objetivo fornecer diretrizes claras e opinativas para o agendamento de trabalhos de produção. O uso de melhores práticas pode ajudar a reduzir os custos, aprimorar o desempenho e reforçar a segurança.

Melhor Prática Impacto Documentos
Usar clusters de trabalhos para fluxos de trabalho automatizados Custo: os clusters de trabalhos são cobrados a taxas mais baixas do que os clusters interativos.
Reiniciar clusters de longa execução Segurança: reinicie os clusters para aproveitar os patches e as correções de bugs no Databricks Runtime.
Usar entidades de serviço em vez de contas de usuário para executar trabalhos de produção Segurança: se os trabalhos forem de propriedade de usuários individuais, quando esses usuários saírem da organização, os trabalhos poderão ter a execução interrompida.
Utilize Trabalhos do Lakeflow para orquestração sempre que possível Custo: não é necessário usar ferramentas externas para orquestrar se você estiver apenas orquestrando cargas de trabalho no Azure Databricks.
Usar a última versão LTS do Databricks Runtime Desempenho e custo: o Azure Databricks está sempre aprimorando o Databricks Runtime quanto à usabilidade, ao desempenho e à segurança.
Não armazene dados de produção na raiz do DBFS Segurança: quando os dados são armazenados na raiz do DBFS, todos os usuários podem acessá-los.