Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A meta da maioria das soluções de Big Data é gerar insights sobre os dados por meio de análise e relatórios. A análise e os relatórios podem incluir relatórios e visualizações pré-configurados ou exploração interativa de dados.
Opções de tecnologia de análise de dados
Há várias opções para análise, visualizações e relatórios no Azure, dependendo de suas necessidades:
Power BI
O Power BI é um conjunto de ferramentas de análise de negócios. Ele pode se conectar a centenas de fontes de dados e você pode usá-lo para análise não planejada. Use o Power BI Embedded para integrar o Power BI em seus próprios aplicativos sem exigir nenhum licenciamento extra.
As organizações podem usar o Power BI para gerar relatórios e publicá-los na organização. Todos podem criar painéis personalizados, com governança e segurança internas. O Power BI usa a ID do Microsoft Entra para autenticar os usuários que entrarem no serviço do Power BI. Ele usa as credenciais do Power BI quando um usuário tenta acessar recursos que exigem autenticação.
cadernos Jupyter
Os jupyter notebooks fornecem um shell baseado em navegador que permite que os cientistas de dados criem arquivos de notebook que contêm código Python, Scala ou R e texto markdown. Esses recursos tornam os notebooks uma maneira eficaz de colaborar compartilhando e documentando código e resultando em um único documento.
A maioria das variedades de clusters HDInsight, como Spark ou Hadoop, são pré-configuradas com notebooks Jupyter para interagir com dados e enviar trabalhos para processamento. Dependendo do tipo de cluster HDInsight que você usa, um ou mais kernels são fornecidos para interpretar e executar seu código. Por exemplo, os clusters Spark no HDInsight fornecem kernels relacionados ao Spark que você pode selecionar para executar o código Python ou Scala usando o mecanismo Spark.
Os jupyter notebooks fornecem um ambiente eficaz para analisar, visualizar e processar seus dados antes de criar visualizações mais avançadas usando uma ferramenta de relatório de BI como o Power BI.
Notebooks do Zeppelin
Os notebooks Zeppelin também fornecem um shell baseado em navegador que tem funcionalidade semelhante aos notebooks Jupyter. Alguns clusters HDInsight são pré-configurados com notebooks Zeppelin. No entanto, se você usar um cluster de Consulta Interativa do HDInsight (também chamado de APACHE Hive LLAP), o Zeppelin será o único notebook que você pode usar para executar consultas interativas do Hive. Além disso, se você usar um cluster HDInsight ingressado em um domínio, os notebooks Zeppelin serão o único tipo de notebook que permitirá atribuir diferentes logins de usuário para controlar o acesso aos notebooks e às tabelas Hive subjacentes.
Cadernos Jupyter no VS Code
O VS Code é um editor de código gratuito e plataforma de desenvolvimento que você pode usar localmente ou conectado a computadores remotos. Quando você usa o VS Code com a extensão Jupyter, ele fornece um ambiente totalmente integrado para o desenvolvimento do Jupyter que pode ser aprimorado com mais extensões de linguagem. Escolha esta opção se quiser uma experiência gratuita e melhor-da-categoria com o Jupyter e para poder usar a computação de sua preferência.
Usando o VS Code, você pode desenvolver e executar notebooks em controles remotos e contêineres. Para simplificar a transição dos notebooks do Azure, a imagem de contêiner também está disponível para você usar com o VS Code.
O Jupyter (antigo IPython Notebook) é um projeto de código aberto que permite combinar facilmente o texto do Markdown e o código-fonte Python executável em uma tela chamada notebook. O VS Code dá suporte ao trabalho com notebooks Jupyter nativamente e por meio de arquivos de código python.
Principais critérios de seleção
Comece a restringir suas opções respondendo às seguintes perguntas:
Você precisa se conectar a várias fontes de dados e fornecer um local centralizado para criar relatórios para dados espalhados por todo o seu domínio? Se você fizer isso, escolha uma opção que permita que você se conecte a centenas de fontes de dados.
Deseja inserir visualizações dinâmicas em um site ou aplicativo externo? Se você fizer isso, escolha uma opção que forneça recursos de inserção.
Você deseja criar visualizações e relatórios enquanto estiver offline? Se você fizer isso, escolha uma opção que tenha funcionalidades offline.
Você precisa de poder de processamento pesado para treinar modelos de IA grandes ou complexos ou trabalhar com grandes conjuntos de dados? Se você fizer isso, escolha uma opção que possa se conectar a um cluster de Big Data.
Matriz de funcionalidades
A tabela a seguir resume as principais diferenças de recursos.
Funcionalidades gerais
| Recurso | Power BI | cadernos Jupyter | Notebooks do Zeppelin | Cadernos Jupyter no VS Code |
|---|---|---|---|---|
| Conectar-se a clusters de Big Data para processamento avançado | Sim | Sim | Sim | Não |
| Serviço gerenciado | Sim | Sim 1 | Sim 1 | Sim |
| Conectar-se a centenas de fontes de dados | Sim | Não | Não | Não |
| Funcionalidades offline | Sim 2 | Não | Não | Não |
| Funcionalidades de inserção | Sim | Não | Não | Não |
| Atualização automática de dados | Sim | Não | Não | Não |
| Acesso a vários pacotes de software livre | Não | Sim 3 | Sim 3 | Sim 4 |
| Opções de transformação ou limpeza de dados | Power Query, R | 40 linguagens, incluindo Python, R, Julia e Scala | Mais de 20 interpretadores, incluindo Python, JDBC e R | Python, F#, R |
| Preços | Grátis para Power BI Desktop (criação). Consulte os preços do Power BI para opções de hospedagem. | Gratuito | Gratuito | Gratuito |
| Colaboração de multiusuário | Sim | Sim (por meio do compartilhamento ou com um servidor multiusuário como o JupyterHub) | Sim | Sim (por meio do compartilhamento) |
[1] Quando usado como parte de um cluster HDInsight gerenciado.
[2] Com o uso do Power BI Desktop.
[3] Você pode pesquisar o repositório Maven em busca de pacotes de contribuição da comunidade.
[4] Você pode instalar pacotes do Python usando pip ou Conda. Você pode instalar pacotes do R do CRAN ou do GitHub. Você pode instalar pacotes em F# por meio de nuget.org usando o gerenciador de dependências Paket.
Colaboradores
A Microsoft mantém este artigo. Os colaboradores a seguir escreveram este artigo.
Autor principal:
- Zoiner Tejada | CEO e arquiteto
Para ver perfis não públicos no LinkedIn, entre no LinkedIn.
Próximas etapas
- Introdução aos notebooks Databricks
- Execute notebooks do Azure Databricks com o Azure Data Factory
- Executar notebooks Jupyter em seu workspace
- O que é o Power BI?