Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
Este artigo tem como objetivo fornecer orientações claras e opinativas para o agendamento de trabalhos de produção. O uso de práticas recomendadas pode ajudar a reduzir custos, melhorar o desempenho e reforçar a segurança.
| Best Practice (Melhores Práticas) | Impacto | Documentos |
|---|---|---|
| Usar clusters de tarefas para fluxos de trabalho automatizados | Custo: Clusters de tarefas são cobrados a tarifas mais baixas do que clusters interativos. | |
| Reiniciar clusters de longa execução | Segurança: reinicie clusters para aproveitar patches e correções de bugs no Databricks Runtime. | |
| Utilize entidades de serviço em vez de contas de utilizador para executar trabalhos de produção | Segurança: Se os trabalhos forem de propriedade de usuários individuais, quando esses usuários deixarem a organização, esses trabalhos poderão parar de ser executados. | |
| Use Lakeflow Jobs para orquestração sempre que possível | Custo: não há necessidade de usar ferramentas externas para orquestrar se você estiver apenas orquestrando cargas de trabalho no Azure Databricks. | |
| Use a versão LTS mais recente do Databricks Runtime | Desempenho e custo: o Azure Databricks está sempre melhorando o Databricks Runtime para usabilidade, desempenho e segurança. | |
| Não armazene dados de produção na raiz DBFS | Segurança: Quando os dados são armazenados na raiz DBFS, todos os usuários podem acessá-los. |