Partager via


Choisir une analytique de données et une technologie de création de rapports dans Azure

La plupart des solutions Big Data ont pour but de fournir des informations sur les données par le biais de l’analyse et des rapports. L’analyse et les rapports peuvent inclure des rapports préconfigurés et des visualisations ou une exploration interactive des données.

Options de technologie d’analytique des données

Il existe plusieurs options pour l’analyse, les visualisations et la création de rapports dans Azure, selon vos besoins :

Power BI

Power BI est une suite d’outils d’analytique métier. Il peut se connecter à des centaines de sources de données et vous pouvez l’utiliser pour une analyse non planifiée. Utilisez Power BI Embedded pour intégrer Power BI dans vos propres applications sans nécessiter de licence supplémentaire.

Les organisations peuvent utiliser Power BI pour générer des rapports et les publier. Tout le monde peut créer des tableaux de bord personnalisés, avec gouvernance et sécurité intégrée. Power BI utilise l’ID Microsoft Entra pour authentifier les utilisateurs qui se connectent au service Power BI. Il utilise les informations d’identification Power BI lorsqu’un utilisateur tente d’accéder aux ressources qui nécessitent une authentification.

Notebooks Jupyter

Les notebooks Jupyter fournissent un interpréteur de commandes basé sur un navigateur qui permet aux scientifiques des données de créer des fichiers de notebook qui contiennent du code Python, Scala ou R et du texte Markdown. Ces fonctionnalités permettent aux notebooks de collaborer efficacement en partageant et en documentant du code et en créant un document unique.

La plupart des variétés de clusters HDInsight, tels que Spark ou Hadoop, sont préconfigurées avec des notebooks Jupyter pour interagir avec les données et envoyer des travaux pour le traitement. Selon le type de cluster HDInsight que vous utilisez, un ou plusieurs noyaux sont fournis pour interpréter et exécuter votre code. Par exemple, les clusters Spark sur HDInsight fournissent des noyaux spark que vous pouvez sélectionner pour exécuter du code Python ou Scala à l’aide du moteur Spark.

Les notebooks Jupyter fournissent un environnement efficace pour l’analyse, la visualisation et le traitement de vos données avant de créer des visualisations plus avancées à l’aide d’un outil de création de rapports BI comme Power BI.

Notebooks Zeppelin

Les notebooks Zeppelin fournissent également un interpréteur de commandes basé sur un navigateur qui dispose de fonctionnalités similaires aux notebooks Jupyter. Certains clusters HDInsight sont préconfigurés avec des notebooks Zeppelin. Toutefois, si vous utilisez un cluster HDInsight Interactive Query (également appelé Apache Hive LLAP), Zeppelin est le seul notebook que vous pouvez utiliser pour exécuter des requêtes Hive interactives. En outre, si vous utilisez un cluster HDInsight joint à un domaine, les notebooks Zeppelin sont le seul type de notebooks qui vous permet d’attribuer différentes connexions utilisateur afin de contrôler l’accès aux notebooks et aux tables Hive sous-jacentes.

Notebooks Jupyter dans VS Code

VS Code est un éditeur de code gratuit et une plateforme de développement que vous pouvez utiliser localement ou connecté à un calcul distant. Lorsque vous utilisez VS Code avec l’extension Jupyter, il fournit un environnement entièrement intégré pour le développement Jupyter qui peut être amélioré avec d’autres extensions de langage. Choisissez cette option si vous souhaitez bénéficier d'une expérience Jupyter de première qualité et gratuite et pouvoir utiliser l'environnement de calcul de votre choix.

En utilisant VS Code, vous pouvez développer et exécuter des notebooks sur des serveurs distants et des conteneurs. Pour simplifier la transition depuis les notebooks Azure, l'image conteneur est également disponible pour vous permettre de l'utiliser avec VS Code.

Jupyter (anciennement IPython Notebook) est un projet open source qui permet de combiner facilement du texte Markdown et du code source Python exécutable sur un seul canevas appelé notebook. VS Code prend en charge l’utilisation de notebooks Jupyter en mode natif et via des fichiers de code Python.

Critères de sélection principaux

Commencez à limiter vos choix en répondant aux questions suivantes :

  • Devez-vous vous connecter à de nombreuses sources de données et fournir un emplacement centralisé pour créer des rapports pour les données réparties dans votre domaine ? Si vous le faites, choisissez une option qui vous permet de vous connecter à des centaines de sources de données.

  • Voulez-vous incorporer des visualisations dynamiques dans un site web externe ou une application ? Si vous le faites, choisissez une option qui fournit des fonctionnalités d’incorporation.

  • Souhaitez-vous concevoir vos visualisations et vos rapports en mode hors connexion ? Si vous le faites, choisissez une option qui a des fonctionnalités hors connexion.

  • Avez-vous besoin d’une puissance de traitement importante pour entraîner des modèles IA volumineux ou complexes ou utiliser des jeux de données volumineux ? Si vous le faites, choisissez une option qui peut se connecter à un cluster Big Data.

Matrice des fonctionnalités

Le tableau suivant récapitule les principales différences dans les fonctionnalités.

Fonctionnalités générales

Capacité Power BI Notebooks Jupyter Notebooks Zeppelin Notebooks Jupyter dans VS Code
Se connecter à des clusters Big Data pour un traitement avancé Oui Oui Oui Non
Service géré Oui Oui 1 Oui 1 Oui
Se connecter à des centaines de sources de données Oui Non Non Non
Fonctionnalités hors ligne Oui 2 Non Non Non
Fonctionnalités d’incorporation Oui Non Non Non
Actualisation automatique des données Oui Non Non Non
Accès à de nombreux packages open source Non Oui 3 Oui 3 Oui 4
Options de transformation ou de nettoyage des données Power Query, R 40 langues, y compris Python, R, Julia et Scala Plus de 20 interpréteurs, notamment Python, JDBC et R Python, F#, R
Tarifs Gratuit pour Power BI Desktop (création de contenu). Consultez la tarification de Power BI pour les options d’hébergement. Gratuit Gratuit Gratuit
Collaboration multi-utilisateur Oui Oui (via le partage ou avec un serveur multiutilisateur comme JupyterHub) Oui Oui (via le partage)

[1] Si utilisé dans un cluster HDInsight géré.

[2] En utilisant Power BI Desktop.

[3] Vous pouvez rechercher dans le référentiel Maven des packages fournis par la communauté.

[4] Vous pouvez installer des packages Python à l’aide de pip ou Conda. Vous pouvez installer des packages R à partir de CRAN ou GitHub. Vous pouvez installer des packages en F# via nuget.org à l’aide du gestionnaire de dépendances Paket.

Contributeurs

Microsoft gère cet article. Les contributeurs suivants ont écrit cet article.

Auteur principal :

Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.

Étapes suivantes