Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Este artigo tem como objetivo fornecer diretrizes claras e opinativas para o agendamento de trabalhos de produção. O uso de melhores práticas pode ajudar a reduzir os custos, aprimorar o desempenho e reforçar a segurança.
| Melhor Prática | Impacto | Documentos |
|---|---|---|
| Usar clusters de trabalhos para fluxos de trabalho automatizados | Custo: os clusters de trabalhos são cobrados a taxas mais baixas do que os clusters interativos. | |
| Reiniciar clusters de longa execução | Segurança: reinicie os clusters para aproveitar os patches e as correções de bugs no Databricks Runtime. | |
| Usar entidades de serviço em vez de contas de usuário para executar trabalhos de produção | Segurança: se os trabalhos forem de propriedade de usuários individuais, quando esses usuários saírem da organização, os trabalhos poderão ter a execução interrompida. | |
| Utilize Trabalhos do Lakeflow para orquestração sempre que possível | Custo: não é necessário usar ferramentas externas para orquestrar se você estiver apenas orquestrando cargas de trabalho no Azure Databricks. | |
| Usar a última versão LTS do Databricks Runtime | Desempenho e custo: o Azure Databricks está sempre aprimorando o Databricks Runtime quanto à usabilidade, ao desempenho e à segurança. | |
| Não armazene dados de produção na raiz do DBFS | Segurança: quando os dados são armazenados na raiz do DBFS, todos os usuários podem acessá-los. |