Explore as equipes de dados e o Microsoft Fabric

Concluído

A plataforma unificada de análise de dados do Microsoft Fabric facilita a colaboração de profissionais de dados em projetos. O Fabric aumenta a colaboração entre profissionais de dados removendo silos de dados e a necessidade de vários sistemas.

Papéis e desafios tradicionais

Em um processo de desenvolvimento de análise tradicional, as equipes de dados geralmente enfrentam vários desafios devido à divisão de tarefas de dados e fluxos de trabalho.

Os engenheiros de dados processam e fazem a curadoria de dados para analistas, que os usam para criar relatórios de negócios. Este processo exige uma coordenação alargada, que conduz frequentemente a atrasos e a interpretações erróneas.

Os analistas de dados geralmente precisam executar transformações de dados downstream antes de criar relatórios do Power BI. Esse processo é demorado e pode não ter o contexto necessário, dificultando a conexão direta dos analistas com os dados.

Os cientistas de dados enfrentam dificuldades para integrar técnicas nativas de ciência de dados com sistemas existentes, que muitas vezes são complexos, e tornam difícil fornecer insights orientados por dados de forma eficiente.

Evolução dos fluxos de trabalho colaborativos

O Microsoft Fabric simplifica o processo de desenvolvimento de análises unificando ferramentas em uma plataforma SaaS. O Fabric permite que diferentes funções colaborem de forma eficaz sem duplicar esforços.

Os engenheiros de dados podem ingerir, transformar e carregar dados diretamente no OneLake usando Pipelines, que automatizam fluxos de trabalho e dão suporte ao agendamento. Eles podem armazenar dados em lakehouses, utilizando o formato Delta-Parquet para um armazenamento eficaz e um controle de versão eficiente. Os blocos de anotações fornecem recursos avançados de script para transformações complexas.

Os engenheiros de análise preenchem a lacuna entre a engenharia e a análise de dados fazendo a curadoria de ativos de dados em lakehouses, garantindo a qualidade dos dados e permitindo análises de autoatendimento. Eles podem criar modelos semânticos no Power BI para organizar e apresentar dados de forma eficaz.

Os analistas de dados podem transformar dados upstream usando fluxos de dados e conectar-se diretamente ao OneLake com o modo Direct Lake, reduzindo a necessidade de transformações downstream. Eles podem criar relatórios interativos de forma mais eficiente usando o Power BI.

Os cientistas de dados podem usar notebooks integrados com suporte para Python e Spark para criar e testar modelos de aprendizado de máquina. Eles podem armazenar e acessar dados em lakehouses e integrar-se ao Azure Machine Learning para operacionalizar e implantar modelos.

Usuários de códigoto-nobaixo e desenvolvedores cidadãos podem descobrir conjuntos de dados selecionados por meio do catálogo do OneLake e usar modelos do Power BI para criar relatórios e painéis rapidamente. Eles também podem usar fluxos de dados para executar tarefas simples de ETL sem depender de engenheiros de dados.