Comment visualiser les données d’un fichier CSV avec pandas à l’aide de graphiques et de diagrammes

La visualisation des données d’un fichier CSV avec pandas est une technique importante pour effectuer des analyses de données et prendre des décisions rapidement et efficacement. En représentant visuellement les données, il devient plus facile d’identifier des tendances et des motifs, ce qui est largement utilisé dans l’analyse commerciale, la recherche scientifique et les projets académiques. Dans cet article, nous commencerons par les opérations de base pour lire les données CSV avec Pandas, puis nous utiliserons des bibliothèques comme Matplotlib et Seaborn pour visualiser les données de manière attrayante et compréhensible. Cela vous aidera à améliorer vos compétences en analyse de données en utilisant Python.

Sommaire

Chargement du fichier CSV et aperçu des données

En utilisant Pandas pour charger un fichier CSV, vous pouvez commencer efficacement l’analyse des données. Voici les étapes pour charger un fichier CSV et examiner un aperçu des données.

Chargement du fichier CSV

Nous chargeons un fichier CSV à l’aide de la fonction read_csv() de Pandas. Par exemple, si nous voulons charger un fichier nommé data.csv, nous utiliserons le code suivant.

import pandas as pd

# Charger le fichier CSV
df = pd.read_csv('data.csv')

# Afficher les premières lignes du DataFrame
print(df.head())

Ce code charge les données CSV dans un DataFrame Pandas et affiche les 5 premières lignes des données.

Aperçu des données

Pour obtenir une vue d’ensemble de la structure et des statistiques de base des données, voici les méthodes à utiliser.

Vérification du nombre de lignes et de colonnes

   print(df.shape)
   # Sortie: (nombre de lignes, nombre de colonnes)

Vérification des colonnes spécifiques

   print(df['NomColonne'].unique())  # Afficher les valeurs uniques de la colonne
   print(df['NomColonne'].value_counts())  # Compter les occurrences des valeurs

Ces méthodes permettent de comprendre les grandes lignes des données et de se préparer pour l’étape suivante de visualisation.

Création de graphiques de base avec Matplotlib

En combinant Pandas et Matplotlib, vous pouvez facilement visualiser les données CSV. Nous allons ici présenter comment créer des graphiques de base.

Configuration de Matplotlib

Tout d’abord, nous importons Matplotlib. En utilisant le module pyplot, nous pouvons facilement créer des graphiques.

import matplotlib.pyplot as plt

# Charger le DataFrame df
df = pd.read_csv('data.csv')

Création d’un graphique en ligne

Un graphique en ligne est utile pour visualiser des données temporelles ou continues.

# Tracer les données de vente par date
plt.plot(df['Date'], df['Ventes'])
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.xticks(rotation=45)  # Faire pivoter les labels de l'axe x
plt.show()

Création d’un graphique à barres

Un graphique à barres est adapté pour visualiser les valeurs par catégorie.

# Agréger les ventes par catégorie et créer un graphique à barres
category_sales = df.groupby('Catégorie')['Ventes'].sum()
category_sales.plot(kind='bar', color='skyblue')
plt.title('Ventes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()

Création d’un nuage de points

Un nuage de points est utilisé pour visualiser la relation entre deux variables.

# Tracer la relation entre le prix et les ventes
plt.scatter(df['Prix'], df['Ventes'], alpha=0.7, color='green')
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()

Création d’un histogramme

Un histogramme est utile pour examiner la distribution des données.

# Tracer la distribution des ventes
df['Ventes'].plot(kind='hist', bins=20, color='orange', edgecolor='black')
plt.title('Distribution des ventes')
plt.xlabel('Ventes')
plt.ylabel('Fréquence')
plt.show()

Ces graphiques vous permettent de mieux comprendre les caractéristiques des données. Nous allons maintenant apprendre à réaliser des visualisations plus avancées avec Seaborn.

Utilisation de Seaborn pour des graphiques avancés

Seaborn est une bibliothèque qui fonctionne avec Pandas et Matplotlib, permettant de créer facilement des graphiques de haute qualité. Elle permet de réaliser des tracés plus complexes et de styliser les graphiques de manière intuitive. Nous allons découvrir les méthodes de visualisation avancées avec Seaborn.

Configuration de Seaborn

Nous commençons par importer Seaborn et définir son style.

import seaborn as sns

# Définir le style
sns.set(style="whitegrid")  
df = pd.read_csv('data.csv')  # Charger les données

Visualisation des données catégorielles : boîte à moustaches

Un graphique à boîte est utile pour visualiser la distribution des données par catégorie.

# Visualiser la distribution des ventes par catégorie
sns.boxplot(x='Catégorie', y='Ventes', data=df, palette='pastel')
plt.title('Distribution des ventes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()

Visualisation de la corrélation : nuage de points et droite de régression

Avec regplot de Seaborn, vous pouvez ajouter une droite de régression à un nuage de points.

# Tracer la corrélation entre le prix et les ventes
sns.regplot(x='Prix', y='Ventes', data=df, scatter_kws={'alpha':0.6}, line_kws={'color':'red'})
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()

Visualisation de la distribution des données : carte thermique

Pour visualiser une matrice de corrélation, vous pouvez utiliser une carte thermique.

# Calculer la matrice de corrélation
correlation_matrix = df.corr()

# Créer la carte thermique
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f')
plt.title('Matrice de corrélation')
plt.show()

Relation entre catégorie et données numériques : graphique en violon

Un graphique en violon permet de visualiser la distribution des données par catégorie de manière lisse.

# Tracer la distribution des ventes par catégorie
sns.violinplot(x='Catégorie', y='Ventes', data=df, palette='muted', inner='quartile')
plt.title('Distribution des ventes par catégorie (Graphique en violon)')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()

Mettre en évidence les tendances des données : graphique en comptage

Pour visualiser la fréquence d’apparition des données catégorielles, un graphique de comptage est utile.

# Tracer la fréquence des catégories de produits
sns.countplot(x='Catégorie', data=df, palette='viridis')
plt.title('Fréquence des catégories de produits')
plt.xlabel('Catégorie')
plt.ylabel('Fréquence')
plt.show()

Les graphiques sophistiqués de Seaborn permettent d’approfondir l’analyse des données. Nous allons maintenant expliquer comment extraire et visualiser des données spécifiques dans un DataFrame.

Visualisation des données extraites de colonnes spécifiques

Dans l’analyse de données, il est essentiel d’extraire des colonnes ou des données en fonction de critères spécifiques pour les visualiser. Voici comment filtrer les données avec Pandas et créer des graphiques appropriés.

Extraction et tracé d’une colonne spécifique

Lorsque vous vous concentrez sur une colonne spécifique, vous extrayez les données de cette colonne et les visualisez.

# Afficher les ventes sous forme d'histogramme
df['Ventes'].plot(kind='hist', bins=15, color='skyblue', edgecolor='black')
plt.title('Distribution des ventes')
plt.xlabel('Ventes')
plt.ylabel('Fréquence')
plt.show()

Tracé de plusieurs colonnes ensemble

Vous pouvez sélectionner plusieurs colonnes pour visualiser leur corrélation.

# Tracer la relation entre le prix et les ventes sous forme de nuage de points
plt.scatter(df['Prix'], df['Ventes'], color='green', alpha=0.6)
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()

Visualisation basée sur des conditions spécifiques

Vous pouvez extraire des données en fonction de certaines conditions et les visualiser pour une analyse plus approfondie.

# Extraire et tracer les données de ventes supérieures à 1000
high_sales = df[df['Ventes'] >= 1000]
plt.plot(high_sales['Date'], high_sales['Ventes'], marker='o', color='orange')
plt.title('Ventes supérieures à 1000 par date')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.xticks(rotation=45)
plt.show()

Agrégation des données et visualisation par groupes

Vous pouvez regrouper les données par catégorie ou par attribut et visualiser les résultats.

# Calculer les ventes moyennes par catégorie
category_avg_sales = df.groupby('Catégorie')['Ventes'].mean()

# Visualiser avec un graphique à barres
category_avg_sales.plot(kind='bar', color='coral')
plt.title('Ventes moyennes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes moyennes')
plt.show()

Extraction et visualisation des données avec plusieurs conditions

En combinant plusieurs conditions, vous pouvez extraire des données plus spécifiques et les visualiser.

# Extraire les données avec des ventes >= 1000 et un prix < 500
filtered_data = df[(df['Ventes'] >= 1000) & (df['Prix'] < 500)]

# Visualiser avec un nuage de points
plt.scatter(filtered_data['Prix'], filtered_data['Ventes'], color='purple', alpha=0.7)
plt.title('Relation entre ventes > 1000 et prix < 500')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()

Cela vous permet d'analyser des groupes de données spécifiques et de découvrir des motifs importants. Nous allons maintenant aborder la visualisation des données temporelles.

Méthodes de tracé des données temporelles

Les données temporelles sont essentielles pour analyser les tendances et les saisons en fonction du temps. Nous allons présenter comment tracer efficacement des données temporelles avec Pandas et les bibliothèques de visualisation.

Préparation des données temporelles

Tout d'abord, nous convertissons la colonne de dates en format datetime de Pandas, ce qui permet d'utiliser les fonctionnalités temporelles de Pandas.

# Convertir la colonne Date en format datetime
df['Date'] = pd.to_datetime(df['Date'])

# Trier les données par date
df = df.sort_values('Date')

# Définir la date comme index (optionnel)
df.set_index('Date', inplace=True)

Tracer des données temporelles simples

Nous traçons les données temporelles avec un graphique en ligne.

# Tracer les ventes sur le temps
df['Ventes'].plot(figsize=(10, 5), color='blue', linewidth=2)
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()

Comparer plusieurs séries temporelles

Nous pouvons superposer plusieurs séries temporelles sur le même graphique pour les comparer.

# Tracer les ventes et les profits simultanément
df[['Ventes', 'Profits']].plot(figsize=(10, 5), linewidth=2)
plt.title('Évolution des ventes et des profits')
plt.xlabel('Date')
plt.ylabel('Montant')
plt.legend(['Ventes', 'Profits'])
plt.grid(True)
plt.show()

Analyse de la saisonnalité et des tendances

Les séries temporelles peuvent contenir des tendances ou de la saisonnalité. Nous pouvons les décomposer pour les analyser.

from statsmodels.tsa.seasonal import seasonal_decompose

# Décomposer les ventes saisonnièrement
decomposition = seasonal_decompose(df['Ventes'], model='additive', period=12)

# Tracer chaque élément (tendance, saisonnalité, résidus)
decomposition.plot()
plt.show()

Tracer des données sur une période spécifique

Nous extrayons les données pour une période spécifique et les traçons.

# Extraire les données de 2023
df_2023 = df['2023']
df_2023['Ventes'].plot(figsize=(10, 5), color='green', linewidth=2)
plt.title('Évolution des ventes en 2023')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()

Personnalisation des visualisations temporelles

Nous pouvons ajouter des marqueurs ou des annotations pour souligner certains éléments dans le graphique.

# Ajouter un marqueur aux ventes
plt.plot(df.index, df['Ventes'], marker='o', color='red', linewidth=2)
plt.title('Évolution des ventes avec marqueurs')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)

# Ajouter une annotation à une date spécifique
peak_date = df['Ventes'].idxmax()  # Date du pic des ventes
peak_value = df['Ventes'].max()
plt.annotate(f'Pic des ventes: {peak_value}', xy=(peak_date, peak_value), xytext=(peak_date, peak_value + 100),
             arrowprops=dict(facecolor='black', arrowstyle='->'), fontsize=10)

plt.show()

Visualisation interactive des séries temporelles

Pour créer des visualisations interactives, vous pouvez utiliser des bibliothèques comme Plotly.

import plotly.express as px

# Tracer les ventes de manière interactive
fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')
fig.show()

Ces méthodes vous permettent de visualiser efficacement les données temporelles et d'identifier les tendances et la saisonnalité. Nous allons maintenant aborder la manière de tracer plusieurs graphiques simultanément.

Méthodes pour tracer plusieurs graphiques simultanément

Lorsque vous analysez des données, il peut être utile d'afficher plusieurs graphiques en même temps pour comparer les données sous différents angles. Nous allons expliquer comment tracer plusieurs graphiques simultanément à l'aide de Matplotlib et Seaborn.

Tracer plusieurs graphiques avec Matplotlib

En utilisant subplot de Matplotlib, vous pouvez tracer plusieurs graphiques dans une même figure.

import matplotlib.pyplot as plt

# Placer les graphiques sur 2 lignes et 2 colonnes
fig, axes = plt.subplots(2, 2, figsize=(12, 8))

# Graphique 1: Évolution des ventes
axes[0, 0].plot(df.index, df['Ventes'], color='blue', linewidth=2)
axes[0, 0].set_title('Évolution des ventes')
axes[0, 0].set_xlabel('Date')
axes[0, 0].set_ylabel('Ventes')

# Graphique 2: Évolution des profits
axes[0, 1].plot(df.index, df['Profits'], color='green', linewidth=2)
axes[0, 1].set_title('Évolution des profits')
axes[0, 1].set_xlabel('Date')
axes[0, 1].set_ylabel('Profits')

# Graphique 3: Distribution des ventes (Histogramme)
axes[1, 0].hist(df['Ventes'], bins=15, color='orange', edgecolor='black')
axes[1, 0].set_title('Distribution des ventes')
axes[1, 0].set_xlabel('Ventes')
axes[1, 0].set_ylabel('Fréquence')

# Graphique 4: Corrélation entre prix et ventes (Nuage de points)
axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
axes[1, 1].set_title('Corrélation entre prix et ventes')
axes[1, 1].set_xlabel('Prix')
axes[1, 1].set_ylabel('Ventes')

# Ajustement de la disposition
plt.tight_layout()
plt.show()

Tracer plusieurs graphiques avec Seaborn

Avec FacetGrid de Seaborn, vous pouvez diviser vos données par catégories et tracer plusieurs graphiques.

import seaborn as sns

# Tracer les ventes par catégorie
g = sns.FacetGrid(df, col="Catégorie", col_wrap=3, height=4)
g.map(sns.lineplot, "Date", "Ventes")
g.set_titles("{col_name}")
g.set_axis_labels("Date", "Ventes")
plt.show()

Superposer différents types de graphiques dans une même figure

Vous pouvez superposer différents types de graphiques dans une seule figure pour comparer les données.

fig, ax1 = plt.subplots(figsize=(10, 6))

# Tracer les ventes avec un graphique en ligne
ax1.plot(df.index, df['Ventes'], color='blue', label='Ventes')
ax1.set_xlabel('Date')
ax1.set_ylabel('Ventes', color='blue')
ax1.tick_params(axis='y', labelcolor='blue')

# Ajouter les profits avec un graphique à barres
ax2 = ax1.twinx()  # Créer un deuxième axe y
ax2.bar(df.index, df['Profits'], color='orange', alpha=0.6, label='Profits')
ax2.set_ylabel('Profits', color='orange')
ax2.tick_params(axis='y', labelcolor='orange')

# Titre et légende
fig.suptitle('Comparaison des ventes et des profits')
fig.legend(loc='upper left', bbox_to_anchor=(0.1, 0.9))
plt.show()

Sauvegarder plusieurs graphiques séparément

Si vous souhaitez sauvegarder chaque graphique individuellement, vous pouvez utiliser la fonction savefig() pour chaque graphique.

# Sauvegarder l'évolution des ventes
df['Ventes'].plot()
plt.title('Évolution des ventes')
plt.savefig('sales_trend.png')
plt.clf()  # Effacer le graphique actuel

# Sauvegarder la distribution des ventes
df['Ventes'].plot(kind='hist', bins=15, color='orange', edgecolor='black')
plt.title('Distribution des ventes')
plt.savefig('sales_distribution.png')
plt.clf()

Tracer plusieurs graphiques interactifs

Avec Plotly, vous pouvez créer plusieurs graphiques interactifs.

import plotly.subplots as sp
import plotly.graph_objects as go

# Créer un sous-graphe
fig = sp.make_subplots(rows=2, cols=2, subplot_titles=("Ventes", "Profits", "Distribution des ventes", "Corrélation entre prix et ventes"))

# Tracer les ventes
fig.add_trace(go.Scatter(x=df.index, y=df['Ventes'], name='Ventes'), row=1, col=1)

# Tracer les profits
fig.add_trace(go.Scatter(x=df.index, y=df['Profits'], name='Profits'), row=1, col=2)

# Tracer la distribution des ventes
fig.add_trace(go.Histogram(x=df['Ventes'], name='Distribution des ventes'), row=2, col=1)

# Tracer la corrélation entre prix et ventes
fig.add_trace(go.Scatter(x=df['Prix'], y=df['Ventes'], mode='markers', name='Prix vs Ventes'), row=2, col=2)

# Ajuster la disposition
fig.update_layout(title_text="Comparaison de plusieurs graphiques", showlegend=False, height=800)
fig.show()

Tracer plusieurs graphiques en même temps vous permet d'analyser les données sous différents angles. Enfin, nous aborderons comment personnaliser les graphiques.

Méthodes de personnalisation des graphiques (couleurs, styles, annotations, etc.)

Pour rendre vos graphiques plus lisibles et informatifs, il est essentiel de personnaliser les couleurs, les styles et les annotations. Nous allons expliquer comment personnaliser les graphiques à l'aide de Matplotlib.

Modification des couleurs et des styles

Changer la couleur et le style des graphiques améliore leur lisibilité.

import matplotlib.pyplot as plt

# Personnalisation de base
plt.plot(df.index, df['Ventes'], color='blue', linestyle='--', linewidth=2, label='Ventes')
plt.plot(df.index, df['Profits'], color='green', linestyle='-', linewidth=2, label='Profits')

# Ajouter un titre et des labels d'axes
plt.title('Évolution des ventes et des profits', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12)
plt.ylabel('Montant', fontsize=12)

# Ajouter une légende
plt.legend(fontsize=10, loc='upper left')

# Ajouter une grille
plt.grid(color='gray', linestyle=':', linewidth=0.5)

plt.show()

Ajustement des polices et tailles

Modifier la taille de la police ou le style des polices des éléments de votre graphique peut améliorer leur lisibilité.

# Modifier la taille de police globale
plt.rcParams.update({'font.size': 12})

# Modifier uniquement certains éléments
plt.title('Titre personnalisé', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12, fontstyle='italic')
plt.ylabel('Ventes', fontsize=12, fontstyle='italic')

Ajout d'annotations

Vous pouvez ajouter des annotations pour souligner certains points de données.

# Annotations sur le pic des ventes
peak_date = df['Ventes'].idxmax()
peak_value = df['Ventes'].max()

plt.plot(df.index, df['Ventes'], color='blue')
plt.annotate(f'Pic : {peak_value}', 
             xy=(peak_date, peak_value), 
             xytext=(peak_date, peak_value + 500),
             arrowprops=dict(facecolor='red', arrowstyle='->'),
             fontsize=10, color='darkred')

plt.title('Évolution des ventes avec annotations')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()

Utilisation des cartes de couleurs

Les cartes de couleurs vous permettent de changer la couleur en fonction des valeurs.

# Appliquer une carte de couleur sur un nuage de points
plt.scatter(df['Prix'], df['Ventes'], c=df['Ventes'], cmap='viridis', alpha=0.8)
plt.title('Prix et ventes (Carte de couleurs)')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.colorbar(label='Ventes')
plt.show()

Ajustement de la disposition des sous-graphiques

Si vous avez plusieurs graphiques dans une même figure, ajustez la disposition pour les rendre plus clairs.

fig, axes = plt.subplots(2, 2, figsize=(12, 8))

# Tracer chaque graphique
axes[0, 0].plot(df.index, df['Ventes'], color='blue')
axes[0, 0].set_title('Évolution des ventes')

axes[0, 1].plot(df.index, df['Profits'], color='green')
axes[0, 1].set_title('Évolution des profits')

axes[1, 0].hist(df['Ventes'], bins=15, color='orange')
axes[1, 0].set_title('Distribution des ventes')

axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
axes[1, 1].set_title('Corrélation entre prix et ventes')

# Ajuster la disposition
plt.tight_layout()
plt.show()

Changement de thème des graphiques

Avec Seaborn, vous pouvez changer le thème pour uniformiser le style de vos graphiques.

import seaborn as sns

# Définir un thème
sns.set_theme(style="whitegrid", palette="muted")

# Tracer les séries temporelles des ventes
sns.lineplot(x=df.index, y=df['Ventes'], color='blue', label='Ventes')
sns.lineplot(x=df.index, y=df['Profits'], color='green', label='Profits')

plt.title('Évolution des ventes et des profits (Thème appliqué)')
plt.xlabel('Date')
plt.ylabel('Montant')
plt.legend()
plt.show()

Sauvegarde des graphiques

Vous pouvez sauvegarder vos graphiques en tant qu'images avec la fonction savefig().

# Sauvegarder le graphique
plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.legend()
plt.savefig('sales_trend.png', dpi=300, bbox_inches='tight')  # Sauvegarder en haute résolution
plt.show()

Ces méthodes vous permettent de créer des graphiques visuellement attrayants et efficaces. Enfin, nous abordons la sauvegarde des visualisations.

Méthodes de sauvegarde des données visualisées (exportation d'images)

Il est important de sauvegarder les graphiques que vous avez créés en tant qu'images pour les partager ou les utiliser dans des rapports. Nous allons explorer les méthodes pour sauvegarder des graphiques avec Matplotlib.

Méthode de sauvegarde de base

La fonction savefig() de Matplotlib permet de sauvegarder un graphique en tant que fichier image. Voici un exemple de code de base.

import matplotlib.pyplot as plt

# Créer un graphique
plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.legend()

# Sauvegarder le graphique en image
plt.savefig('sales_trend.png')
plt.show()

Ce code sauvegarde le graphique actuel sous le nom sales_trend.png au format PNG.

Spécification du format d'image

Matplotlib vous permet de sauvegarder des images dans plusieurs formats, tels que JPEG, PDF et SVG.

# Sauvegarder en format JPEG
plt.savefig('sales_trend.jpg', format='jpg')

# Sauvegarder en format PDF
plt.savefig('sales_trend.pdf', format='pdf')

# Sauvegarder en format SVG
plt.savefig('sales_trend.svg', format='svg')

Réglage de la résolution (DPI)

Vous pouvez spécifier la résolution de l'image pour la sauvegarder en haute qualité.

# Sauvegarder avec une haute résolution (300 DPI)
plt.savefig('sales_trend_high_res.png', dpi=300)

Ajustement des marges

Les graphiques peuvent parfois avoir des marges excessives. Utilisez bbox_inches='tight' pour ajuster les marges.

# Sauvegarder en enlevant les marges
plt.savefig('sales_trend_tight.png', bbox_inches='tight')

Sauvegarde de plusieurs graphiques

Vous pouvez créer plusieurs graphiques et les sauvegarder dans des fichiers séparés.

# Graphique 1: Ventes
plt.plot(df.index, df['Ventes'], color='blue')
plt.title('Évolution des ventes')
plt.savefig('sales_plot.png')
plt.clf()  # Effacer le graphique actuel

# Graphique 2: Profits
plt.plot(df.index, df['Profits'], color='green')
plt.title('Évolution des profits')
plt.savefig('profit_plot.png')
plt.clf()

Sauvegarde de graphiques interactifs

Les graphiques interactifs créés avec Plotly peuvent être sauvegardés en format HTML.

import plotly.express as px

# Graphique interactif des ventes
fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')

# Sauvegarder au format HTML
fig.write_html('interactive_sales_plot.html')

Vérification après sauvegarde

Pour vérifier l'image sauvegardée, vous pouvez ouvrir l'image dans Python à l'aide d'un outil de visualisation d'image.

from PIL import Image

# Ouvrir l'image sauvegardée
img = Image.open('sales_trend.png')
img.show()

Ces méthodes vous permettent de sauvegarder et de partager vos graphiques. Nous conclurons l'article ici.

Résumé

Dans cet article, nous avons détaillé comment utiliser la bibliothèque Pandas de Python pour visualiser des données CSV. Nous avons abordé le chargement des données, la création de graphiques de base, le tracé de données temporelles, l'affichage de plusieurs graphiques, ainsi que la personnalisation des graphiques et leur sauvegarde.

La visualisation des données est une compétence essentielle pour transmettre des informations de manière claire. En combinant Pandas, Matplotlib et Seaborn, vous pouvez facilement découvrir des motifs et des tendances dans vos données. De plus, en utilisant des graphiques interactifs et en sauvegardant les résultats, vous pourrez partager vos analyses de manière efficace.

Utilisez ces techniques pour améliorer vos analyses de données et vos présentations.