Identificar cargas de trabalho do Azure Databricks

Concluído

O Azure Databricks oferece recursos para várias cargas de trabalho, incluindo Machine Learning e Large Language Models (LLM), Ciência de Dados, Engenharia de Dados, BI e Data Warehousing e Processamento de Streaming.

Engenheria de Dados

O Azure Databricks fornece recursos para cientistas e engenheiros de dados que precisam colaborar em tarefas complexas de processamento de dados. Ele fornece um ambiente integrado com o Apache Spark para processamento de big data em um data lakehouse e suporta várias linguagens, incluindo Python, R, Scala e SQL. A plataforma facilita a exploração, visualização e desenvolvimento de pipelines de dados.

Diagrama de ingestão de dados e fontes de dados na tela do Databricks.

Machine Learning

O Azure Databricks dá suporte à criação, treinamento e implantação de modelos de aprendizado de máquina em escala. Ele inclui MLflow, uma plataforma de código aberto para gerenciar o ciclo de vida do ML, incluindo experimentação, reprodutibilidade e implantação. Ele também suporta várias estruturas de ML, como TensorFlow, PyTorch e Scikit-learn, tornando-o versátil para diferentes tarefas de ML.

Diagrama da ecrã de Machine Learning do Databricks.

SQL

Os analistas de dados que interagem principalmente com dados por meio do SQL podem usar armazéns SQL no Azure Databricks. A interface do usuário do Azure Databricks Workspace fornece um editor SQL familiar, painéis e ferramentas de visualização automática para analisar e visualizar dados diretamente no Azure Databricks. Essa carga de trabalho é ideal para executar consultas ad-hoc rápidas e criar relatórios a partir de grandes conjuntos de dados.

Diagrama da tela do Editor DatabricksSQL.

Observação

Os armazéns SQL estão incluídos na camada Premium (ou superior). O espaço de trabalho padrão não fornece armazéns SQL.