Exercice - Charger les données et créer un nuage de points
Les notebooks Jupyter sont composés de cellules. Chaque cellule se voit attribuer l’un des trois types :
- Markdown pour entrer du texte au format Markdown
- Code permettant d’entrer du code qui s’exécute de manière interactive
- Raw NBConvert pour entrer des données en ligne
Le code entré dans les cellules de code est exécuté par un noyau, qui fournit un environnement isolé pour que le notebook s’exécute. Le noyau IPython populaire prend en charge le code écrit en Python, mais des dizaines d’autres noyaux sont disponibles pour prendre en charge d’autres langages. Les notebooks Azure prennent en charge Python, R et F#. Ils prennent aussi en charge l’installation d’un grand nombre de packages et de bibliothèques qui sont couramment utilisés dans la recherche.
Actuellement, l’éditeur de notebooks montre une cellule vide. Dans cet exercice, vous allez ajouter du contenu à cette cellule et ajouter d’autres cellules pour importer des packages Python tels que NumPy, charger une paire de fichiers de données NASA contenant des données climatiques et créer un nuage de points à partir des données.
Dans la première cellule, définissez le type de cellule sur Markdown et entrez « Azure Notebook Climate Change Analysis » dans la cellule elle-même :

Définition d’une cellule markdown
Cliquez sur le bouton + dans la barre d’outils pour ajouter une nouvelle cellule. Vérifiez que le type de cellule est Code, puis entrez le code Python suivant dans la cellule :
import matplotlib.pyplot as plt import numpy as np from sklearn.linear_model import LinearRegression import seaborn as sns; sns.set()
Ajout d’une cellule de code
Cliquez maintenant sur le bouton Exécuter pour exécuter la cellule de code et importer les packages spécifiés dans les
importinstructions. Ignorez les avertissements qui s’affichent au fur et à mesure que vous préparez l’environnement pour la première fois.Vous pouvez supprimer les avertissements en sélectionnant la cellule de code et en la réexécutant.

Exécution d’une cellule de code
Cliquez sur Fichier dans le menu en haut de la page, puis sélectionnez Charger dans le menu déroulant. Chargez ensuite les fichiers nommés 5-year-mean-1951-1980.csv et 5-year-mean-1882-2014.csv.

Chargement de données dans le bloc-notes
Sélectionnez /project comme dossier de destination pour vous assurer que vos fichiers sont conservés. Cliquez sur Démarrer le chargement pour charger les fichiers, puis OK une fois qu’ils ont été chargés avec succès.

Sélection du dossier de destination pour les données
Placez le curseur dans la cellule vide en bas du notebook. Entrez « Importer des données » comme texte et remplacez le type de cellule par Markdown.
Ajoutez maintenant une cellule Code et collez le code suivant.
yearsBase, meanBase = np.loadtxt('5-year-mean-1951-1980.csv', delimiter=',', usecols=(0, 1), unpack=True) years, mean = np.loadtxt('5-year-mean-1882-2014.csv', delimiter=',', usecols=(0, 1), unpack=True)Cliquez sur le bouton Exécuter pour exécuter la cellule et utilisez la fonction NumPy
loadtxtpour charger les données que vous avez chargées. Les données sont maintenant en mémoire et peuvent être utilisées par l’application.
Chargement des données
Placez le curseur dans la cellule vide en bas du notebook. Remplacez le type de cellule par Markdown et entrez « Créer un nuage de points » comme texte.
Ajoutez une cellule Code et collez-la dans le code suivant, qui utilise Matplotlib pour créer un nuage de points.
plt.scatter(yearsBase, meanBase) plt.title('scatter plot of mean temp difference vs year') plt.xlabel('years', fontsize=12) plt.ylabel('mean temp difference', fontsize=12) plt.show()Cliquez sur Exécuter pour exécuter la cellule et créez un nuage de points.

Nuage de points produit par Matplotlib
Le jeu de données que vous avez chargé utilise une moyenne sur 30 ans entre 1951 et 1980 pour calculer une température de base pour cette période, puis il utilise des températures moyennes sur 5 ans pour calculer la différence entre la moyenne sur 5 ans et la moyenne sur 30 ans pour chaque année. Le nuage de points montre les différences des températures annuelles.