Nota
O acesso a esta página requer autorização. Podes tentar iniciar sessão ou mudar de diretório.
O acesso a esta página requer autorização. Podes tentar mudar de diretório.
O objetivo da maioria das soluções de macrodados é proporcionar informações sobre os dados através de análises e relatórios. A análise e a geração de relatórios podem incluir relatórios e visualizações pré-configurados ou exploração interativa de dados.
Opções de tecnologia de análise de dados
Há várias opções para análise, visualizações e relatórios no Azure, dependendo das suas necessidades:
- Power BI
- Blocos de notas do Jupyter
- Blocos de notas do Zeppelin
- Blocos de anotações Jupyter no Visual Studio Code (VS Code)
Power BI
O Power BI é um conjunto de ferramentas de análise empresarial. Ele pode se conectar a centenas de fontes de dados e você pode usá-lo para análises não planejadas. Use o Power BI Embedded para integrar o Power BI em seus próprios aplicativos sem exigir nenhum licenciamento extra.
As organizações podem usar o Power BI para produzir relatórios e publicá-los na organização. Todos podem criar painéis personalizados, com governança e segurança integradas. O Power BI usa a ID do Microsoft Entra para autenticar usuários que entram no serviço do Power BI. Ele usa as credenciais do Power BI quando um usuário tenta acessar recursos que exigem autenticação.
Blocos de notas do Jupyter
Os notebooks Jupyter fornecem um shell baseado em navegador que permite que cientistas de dados criem arquivos de notebook que contenham código Python, Scala ou R e texto Markdown. Esses recursos tornam os blocos de anotações uma maneira eficaz de colaborar, compartilhando e documentando código e resultados em um único documento.
A maioria das variedades de clusters HDInsight, como Spark ou Hadoop, é pré-configurada com blocos de anotações Jupyter para interagir com dados e enviar trabalhos para processamento. Dependendo do tipo de cluster HDInsight que você usa, um ou mais kernels são fornecidos para interpretar e executar seu código. Por exemplo, os clusters do Spark no HDInsight fornecem kernels relacionados ao Spark que você pode selecionar para executar o código Python ou Scala usando o mecanismo Spark.
Os blocos de anotações Jupyter fornecem um ambiente eficaz para analisar, visualizar e processar seus dados antes de criar visualizações mais avançadas usando uma ferramenta de relatório de BI como o Power BI.
Blocos de notas Zeppelin
Os notebooks Zeppelin também fornecem um shell baseado em navegador que tem funcionalidade semelhante aos notebooks Jupyter. Alguns clusters HDInsight são pré-configurados com notebooks Zeppelin. No entanto, se você usar um cluster HDInsight Interactive Query (também chamado Apache Hive LLAP), o Zeppelin será o único bloco de anotações que você poderá usar para executar consultas interativas do Hive. Além disso, se você usar um cluster HDInsight associado a um domínio, os blocos de anotações do Zeppelin serão o único tipo de bloco de anotações que permite atribuir logins de usuário diferentes para controlar o acesso aos blocos de anotações e às tabelas Hive subjacentes.
Notebooks Jupyter no VS Code
VS Code é um editor de código gratuito e plataforma de desenvolvimento que você pode usar localmente ou conectado à computação remota. Quando você usa o VS Code com a extensão Jupyter, ele fornece um ambiente totalmente integrado para o desenvolvimento do Jupyter que pode ser aprimorado com mais extensões de linguagem. Escolha esta opção se quiser uma experiência Jupyter gratuita e de primeira classe e poder usar o seu cálculo preferido.
Usando o VS Code, você pode desenvolver e executar blocos de anotações em controles remotos e contêineres. Para simplificar a transição dos blocos de anotações do Azure, a imagem do contêiner também está disponível para você usar com o VS Code.
Jupyter (anteriormente IPython Notebook) é um projeto de código aberto que permite combinar facilmente texto Markdown e código-fonte Python executável em uma tela chamada notebook. O VS Code suporta trabalhar com notebooks Jupyter nativamente e através de arquivos de código Python.
Principais critérios de seleção
Comece a restringir as suas escolhas respondendo às seguintes perguntas:
Você precisa se conectar a várias fontes de dados e fornecer um local centralizado para criar relatórios para dados espalhados por todo o seu domínio? Se o fizer, escolha uma opção que lhe permita conectar-se a centenas de fontes de dados.
Deseja incorporar visualizações dinâmicas em um site ou aplicativo externo? Se o fizer, escolha uma opção que forneça recursos de incorporação.
Deseja projetar suas visualizações e relatórios enquanto estiver offline? Se o fizer, escolha uma opção que tenha capacidades offline.
Você precisa de poder de processamento pesado para treinar modelos de IA grandes ou complexos ou trabalhar com grandes conjuntos de dados? Se você fizer isso, escolha uma opção que possa se conectar a um cluster de big data.
Matriz de capacidades
A tabela a seguir resume as principais diferenças nos recursos.
Capacidades gerais
| Funcionalidade | Power BI | Blocos de notas do Jupyter | Blocos de notas Zeppelin | Notebooks Jupyter no VS Code |
|---|---|---|---|---|
| Conecte-se a clusters de big data para processamento avançado | Sim | Sim | Sim | Não |
| Serviço gerido | Sim | Sim 1 | Sim 1 | Sim |
| Conecte-se a centenas de fontes de dados | Sim | Não | Não | Não |
| Funcionalidades offline | Sim 2 | Não | Não | Não |
| Capacidades de incorporação | Sim | Não | Não | Não |
| Atualização automática de dados | Sim | Não | Não | Não |
| Acesso a vários pacotes de código aberto | Não | Sim 3 | Sim 3 | Sim 4 |
| Opções de transformação ou limpeza de dados | Power Query, R | 40 linguagens, incluindo Python, R, Julia e Scala | Mais de 20 intérpretes, incluindo Python, JDBC e R | Python, F#, R |
| Preços | Gratuito para o Power BI Desktop (criação). Consulte Preços do Power BI para opções de hospedagem. | Gratuito | Gratuito | Gratuito |
| Colaboração multiutilizador | Sim | Sim (via compartilhamento ou com um servidor multiusuário como o JupyterHub) | Sim | Sim (via partilha) |
[1] Quando utilizado como parte de um cluster HDInsight gerido.
[2] Com a utilização do Power BI Desktop.
[3] Você pode pesquisar no repositório Maven por pacotes contribuídos pela comunidade.
[4] Você pode instalar pacotes Python usando pip ou Conda. Você pode instalar pacotes R a partir do CRAN ou do GitHub. Você pode instalar pacotes em F# via nuget.org usando o gerenciador de dependência Paket.
Contribuidores
A Microsoft mantém este artigo. Os seguintes colaboradores escreveram este artigo.
Autor principal:
- Zoiner Tejada | CEO e Arquiteto
Para ver perfis não públicos do LinkedIn, faça login no LinkedIn.
Próximos passos
- Introdução aos notebooks Databricks
- Executar blocos de anotações do Azure Databricks com o Azure Data Factory
- Executar blocos de anotações Jupyter em seu espaço de trabalho
- O que é o Power BI?