Explorar equipes de dados e Microsoft Fabric
A plataforma unificada de análise de dados do Microsoft Fabric facilita a colaboração de profissionais de dados em projetos. O Fabric aumenta a colaboração entre profissionais de dados removendo silos de dados e a necessidade de vários sistemas.
Funções e desafios tradicionais
Em um processo de desenvolvimento de análise tradicional, as equipes de dados geralmente enfrentam vários desafios devido à divisão de tarefas de dados e fluxos de trabalho.
Os engenheiros de dados processam e coletam dados para analistas, que os usam para criar relatórios de negócios. Esse processo requer ampla coordenação, geralmente levando a atrasos e interpretações incorretas.
Os analistas de dados geralmente precisam executar transformações de dados downstream antes de criar relatórios do Power BI. Esse processo é demorado e pode não ter o contexto necessário, tornando mais difícil para os analistas se conectarem diretamente aos dados.
Os cientistas de dados enfrentam dificuldades para integrar técnicas de ciência de dados nativas a sistemas existentes, que geralmente são complexos e tornam desafiador fornecer insights baseados em dados com eficiência.
Evolução dos fluxos de trabalho colaborativos
O Microsoft Fabric simplifica o processo de desenvolvimento de análise unificando ferramentas em uma plataforma SaaS. O Fabric permite que diferentes funções colaborem efetivamente sem duplicar esforços.
Os engenheiros de dados podem ingerir, transformar e carregar dados diretamente no OneLake usando Pipelines, que automatizam fluxos de trabalho e dão suporte ao agendamento. Eles podem armazenar dados nos lakehouses, usando o formato Delta-Parquet para armazenamento e controle de versão eficientes. Os notebooks fornecem recursos avançados de script para transformações complexas.
Os Engenheiros do Analytics fazem a ponte entre a engenharia e a análise de dados pela curadoria de ativos de dados nos lakehouses, garantindo a qualidade dos dados e habilitando a análise de autoatendimento. Eles podem criar modelos semânticos no Power BI para organizar e apresentar dados com eficiência.
Os analistas de dados podem transformar dados upstream usando fluxos de dados e conectar-se diretamente ao OneLake com o modo Direct Lake, reduzindo a necessidade de transformações downstream. Eles podem criar relatórios interativos com mais eficiência usando o Power BI.
Os cientistas de dados podem usar notebooks integrados com suporte para Python e Spark para criar e testar modelos de machine learning. Eles podem armazenar e acessar dados nos lakehouses e integrarem-se ao Azure Machine Learning para operacionalizarem e implantarem modelos.
Usuários de baixo código e sem código e desenvolvedores cidadãos podem descobrir conjuntos de dados curados por meio do catálogo do OneLake e usar modelos do Power BI para criar rapidamente relatórios e dashboards. Eles também podem usar fluxos de dados para executar tarefas ETL simples sem depender de engenheiros de dados.