Partilhar via


Escolha uma tecnologia de análise de dados e relatórios no Azure

O objetivo da maioria das soluções de macrodados é proporcionar informações sobre os dados através de análises e relatórios. A análise e a geração de relatórios podem incluir relatórios e visualizações pré-configurados ou exploração interativa de dados.

Opções de tecnologia de análise de dados

Há várias opções para análise, visualizações e relatórios no Azure, dependendo das suas necessidades:

Power BI

O Power BI é um conjunto de ferramentas de análise empresarial. Ele pode se conectar a centenas de fontes de dados e você pode usá-lo para análises não planejadas. Use o Power BI Embedded para integrar o Power BI em seus próprios aplicativos sem exigir nenhum licenciamento extra.

As organizações podem usar o Power BI para produzir relatórios e publicá-los na organização. Todos podem criar painéis personalizados, com governança e segurança integradas. O Power BI usa a ID do Microsoft Entra para autenticar usuários que entram no serviço do Power BI. Ele usa as credenciais do Power BI quando um usuário tenta acessar recursos que exigem autenticação.

Blocos de notas do Jupyter

Os notebooks Jupyter fornecem um shell baseado em navegador que permite que cientistas de dados criem arquivos de notebook que contenham código Python, Scala ou R e texto Markdown. Esses recursos tornam os blocos de anotações uma maneira eficaz de colaborar, compartilhando e documentando código e resultados em um único documento.

A maioria das variedades de clusters HDInsight, como Spark ou Hadoop, é pré-configurada com blocos de anotações Jupyter para interagir com dados e enviar trabalhos para processamento. Dependendo do tipo de cluster HDInsight que você usa, um ou mais kernels são fornecidos para interpretar e executar seu código. Por exemplo, os clusters do Spark no HDInsight fornecem kernels relacionados ao Spark que você pode selecionar para executar o código Python ou Scala usando o mecanismo Spark.

Os blocos de anotações Jupyter fornecem um ambiente eficaz para analisar, visualizar e processar seus dados antes de criar visualizações mais avançadas usando uma ferramenta de relatório de BI como o Power BI.

Blocos de notas Zeppelin

Os notebooks Zeppelin também fornecem um shell baseado em navegador que tem funcionalidade semelhante aos notebooks Jupyter. Alguns clusters HDInsight são pré-configurados com notebooks Zeppelin. No entanto, se você usar um cluster HDInsight Interactive Query (também chamado Apache Hive LLAP), o Zeppelin será o único bloco de anotações que você poderá usar para executar consultas interativas do Hive. Além disso, se você usar um cluster HDInsight associado a um domínio, os blocos de anotações do Zeppelin serão o único tipo de bloco de anotações que permite atribuir logins de usuário diferentes para controlar o acesso aos blocos de anotações e às tabelas Hive subjacentes.

Notebooks Jupyter no VS Code

VS Code é um editor de código gratuito e plataforma de desenvolvimento que você pode usar localmente ou conectado à computação remota. Quando você usa o VS Code com a extensão Jupyter, ele fornece um ambiente totalmente integrado para o desenvolvimento do Jupyter que pode ser aprimorado com mais extensões de linguagem. Escolha esta opção se quiser uma experiência Jupyter gratuita e de primeira classe e poder usar o seu cálculo preferido.

Usando o VS Code, você pode desenvolver e executar blocos de anotações em controles remotos e contêineres. Para simplificar a transição dos blocos de anotações do Azure, a imagem do contêiner também está disponível para você usar com o VS Code.

Jupyter (anteriormente IPython Notebook) é um projeto de código aberto que permite combinar facilmente texto Markdown e código-fonte Python executável em uma tela chamada notebook. O VS Code suporta trabalhar com notebooks Jupyter nativamente e através de arquivos de código Python.

Principais critérios de seleção

Comece a restringir as suas escolhas respondendo às seguintes perguntas:

  • Você precisa se conectar a várias fontes de dados e fornecer um local centralizado para criar relatórios para dados espalhados por todo o seu domínio? Se o fizer, escolha uma opção que lhe permita conectar-se a centenas de fontes de dados.

  • Deseja incorporar visualizações dinâmicas em um site ou aplicativo externo? Se o fizer, escolha uma opção que forneça recursos de incorporação.

  • Deseja projetar suas visualizações e relatórios enquanto estiver offline? Se o fizer, escolha uma opção que tenha capacidades offline.

  • Você precisa de poder de processamento pesado para treinar modelos de IA grandes ou complexos ou trabalhar com grandes conjuntos de dados? Se você fizer isso, escolha uma opção que possa se conectar a um cluster de big data.

Matriz de capacidades

A tabela a seguir resume as principais diferenças nos recursos.

Capacidades gerais

Funcionalidade Power BI Blocos de notas do Jupyter Blocos de notas Zeppelin Notebooks Jupyter no VS Code
Conecte-se a clusters de big data para processamento avançado Sim Sim Sim Não
Serviço gerido Sim Sim 1 Sim 1 Sim
Conecte-se a centenas de fontes de dados Sim Não Não Não
Funcionalidades offline Sim 2 Não Não Não
Capacidades de incorporação Sim Não Não Não
Atualização automática de dados Sim Não Não Não
Acesso a vários pacotes de código aberto Não Sim 3 Sim 3 Sim 4
Opções de transformação ou limpeza de dados Power Query, R 40 linguagens, incluindo Python, R, Julia e Scala Mais de 20 intérpretes, incluindo Python, JDBC e R Python, F#, R
Preços Gratuito para o Power BI Desktop (criação). Consulte Preços do Power BI para opções de hospedagem. Gratuito Gratuito Gratuito
Colaboração multiutilizador Sim Sim (via compartilhamento ou com um servidor multiusuário como o JupyterHub) Sim Sim (via partilha)

[1] Quando utilizado como parte de um cluster HDInsight gerido.

[2] Com a utilização do Power BI Desktop.

[3] Você pode pesquisar no repositório Maven por pacotes contribuídos pela comunidade.

[4] Você pode instalar pacotes Python usando pip ou Conda. Você pode instalar pacotes R a partir do CRAN ou do GitHub. Você pode instalar pacotes em F# via nuget.org usando o gerenciador de dependência Paket.

Contribuidores

A Microsoft mantém este artigo. Os seguintes colaboradores escreveram este artigo.

Autor principal:

Para ver perfis não públicos do LinkedIn, faça login no LinkedIn.

Próximos passos