La visualisation des données d’un fichier CSV avec pandas est une technique importante pour effectuer des analyses de données et prendre des décisions rapidement et efficacement. En représentant visuellement les données, il devient plus facile d’identifier des tendances et des motifs, ce qui est largement utilisé dans l’analyse commerciale, la recherche scientifique et les projets académiques. Dans cet article, nous commencerons par les opérations de base pour lire les données CSV avec Pandas, puis nous utiliserons des bibliothèques comme Matplotlib et Seaborn pour visualiser les données de manière attrayante et compréhensible. Cela vous aidera à améliorer vos compétences en analyse de données en utilisant Python.
Chargement du fichier CSV et aperçu des données
En utilisant Pandas pour charger un fichier CSV, vous pouvez commencer efficacement l’analyse des données. Voici les étapes pour charger un fichier CSV et examiner un aperçu des données.
Chargement du fichier CSV
Nous chargeons un fichier CSV à l’aide de la fonction read_csv()
de Pandas. Par exemple, si nous voulons charger un fichier nommé data.csv
, nous utiliserons le code suivant.
import pandas as pd
# Charger le fichier CSV
df = pd.read_csv('data.csv')
# Afficher les premières lignes du DataFrame
print(df.head())
Ce code charge les données CSV dans un DataFrame Pandas et affiche les 5 premières lignes des données.
Aperçu des données
Pour obtenir une vue d’ensemble de la structure et des statistiques de base des données, voici les méthodes à utiliser.
- Vérification du nombre de lignes et de colonnes
print(df.shape)
# Sortie: (nombre de lignes, nombre de colonnes)
- Vérification des colonnes spécifiques
print(df['NomColonne'].unique()) # Afficher les valeurs uniques de la colonne
print(df['NomColonne'].value_counts()) # Compter les occurrences des valeurs
Ces méthodes permettent de comprendre les grandes lignes des données et de se préparer pour l’étape suivante de visualisation.
Création de graphiques de base avec Matplotlib
En combinant Pandas et Matplotlib, vous pouvez facilement visualiser les données CSV. Nous allons ici présenter comment créer des graphiques de base.
Configuration de Matplotlib
Tout d’abord, nous importons Matplotlib. En utilisant le module pyplot
, nous pouvons facilement créer des graphiques.
import matplotlib.pyplot as plt
# Charger le DataFrame df
df = pd.read_csv('data.csv')
Création d’un graphique en ligne
Un graphique en ligne est utile pour visualiser des données temporelles ou continues.
# Tracer les données de vente par date
plt.plot(df['Date'], df['Ventes'])
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.xticks(rotation=45) # Faire pivoter les labels de l'axe x
plt.show()
Création d’un graphique à barres
Un graphique à barres est adapté pour visualiser les valeurs par catégorie.
# Agréger les ventes par catégorie et créer un graphique à barres
category_sales = df.groupby('Catégorie')['Ventes'].sum()
category_sales.plot(kind='bar', color='skyblue')
plt.title('Ventes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()
Création d’un nuage de points
Un nuage de points est utilisé pour visualiser la relation entre deux variables.
# Tracer la relation entre le prix et les ventes
plt.scatter(df['Prix'], df['Ventes'], alpha=0.7, color='green')
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()
Création d’un histogramme
Un histogramme est utile pour examiner la distribution des données.
# Tracer la distribution des ventes
df['Ventes'].plot(kind='hist', bins=20, color='orange', edgecolor='black')
plt.title('Distribution des ventes')
plt.xlabel('Ventes')
plt.ylabel('Fréquence')
plt.show()
Ces graphiques vous permettent de mieux comprendre les caractéristiques des données. Nous allons maintenant apprendre à réaliser des visualisations plus avancées avec Seaborn.
Utilisation de Seaborn pour des graphiques avancés
Seaborn est une bibliothèque qui fonctionne avec Pandas et Matplotlib, permettant de créer facilement des graphiques de haute qualité. Elle permet de réaliser des tracés plus complexes et de styliser les graphiques de manière intuitive. Nous allons découvrir les méthodes de visualisation avancées avec Seaborn.
Configuration de Seaborn
Nous commençons par importer Seaborn et définir son style.
import seaborn as sns
# Définir le style
sns.set(style="whitegrid")
df = pd.read_csv('data.csv') # Charger les données
Visualisation des données catégorielles : boîte à moustaches
Un graphique à boîte est utile pour visualiser la distribution des données par catégorie.
# Visualiser la distribution des ventes par catégorie
sns.boxplot(x='Catégorie', y='Ventes', data=df, palette='pastel')
plt.title('Distribution des ventes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()
Visualisation de la corrélation : nuage de points et droite de régression
Avec regplot
de Seaborn, vous pouvez ajouter une droite de régression à un nuage de points.
# Tracer la corrélation entre le prix et les ventes
sns.regplot(x='Prix', y='Ventes', data=df, scatter_kws={'alpha':0.6}, line_kws={'color':'red'})
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()
Visualisation de la distribution des données : carte thermique
Pour visualiser une matrice de corrélation, vous pouvez utiliser une carte thermique.
# Calculer la matrice de corrélation
correlation_matrix = df.corr()
# Créer la carte thermique
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f')
plt.title('Matrice de corrélation')
plt.show()
Relation entre catégorie et données numériques : graphique en violon
Un graphique en violon permet de visualiser la distribution des données par catégorie de manière lisse.
# Tracer la distribution des ventes par catégorie
sns.violinplot(x='Catégorie', y='Ventes', data=df, palette='muted', inner='quartile')
plt.title('Distribution des ventes par catégorie (Graphique en violon)')
plt.xlabel('Catégorie')
plt.ylabel('Ventes')
plt.show()
Mettre en évidence les tendances des données : graphique en comptage
Pour visualiser la fréquence d’apparition des données catégorielles, un graphique de comptage est utile.
# Tracer la fréquence des catégories de produits
sns.countplot(x='Catégorie', data=df, palette='viridis')
plt.title('Fréquence des catégories de produits')
plt.xlabel('Catégorie')
plt.ylabel('Fréquence')
plt.show()
Les graphiques sophistiqués de Seaborn permettent d’approfondir l’analyse des données. Nous allons maintenant expliquer comment extraire et visualiser des données spécifiques dans un DataFrame.
Visualisation des données extraites de colonnes spécifiques
Dans l’analyse de données, il est essentiel d’extraire des colonnes ou des données en fonction de critères spécifiques pour les visualiser. Voici comment filtrer les données avec Pandas et créer des graphiques appropriés.
Extraction et tracé d’une colonne spécifique
Lorsque vous vous concentrez sur une colonne spécifique, vous extrayez les données de cette colonne et les visualisez.
# Afficher les ventes sous forme d'histogramme
df['Ventes'].plot(kind='hist', bins=15, color='skyblue', edgecolor='black')
plt.title('Distribution des ventes')
plt.xlabel('Ventes')
plt.ylabel('Fréquence')
plt.show()
Tracé de plusieurs colonnes ensemble
Vous pouvez sélectionner plusieurs colonnes pour visualiser leur corrélation.
# Tracer la relation entre le prix et les ventes sous forme de nuage de points
plt.scatter(df['Prix'], df['Ventes'], color='green', alpha=0.6)
plt.title('Corrélation entre prix et ventes')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()
Visualisation basée sur des conditions spécifiques
Vous pouvez extraire des données en fonction de certaines conditions et les visualiser pour une analyse plus approfondie.
# Extraire et tracer les données de ventes supérieures à 1000
high_sales = df[df['Ventes'] >= 1000]
plt.plot(high_sales['Date'], high_sales['Ventes'], marker='o', color='orange')
plt.title('Ventes supérieures à 1000 par date')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.xticks(rotation=45)
plt.show()
Agrégation des données et visualisation par groupes
Vous pouvez regrouper les données par catégorie ou par attribut et visualiser les résultats.
# Calculer les ventes moyennes par catégorie
category_avg_sales = df.groupby('Catégorie')['Ventes'].mean()
# Visualiser avec un graphique à barres
category_avg_sales.plot(kind='bar', color='coral')
plt.title('Ventes moyennes par catégorie')
plt.xlabel('Catégorie')
plt.ylabel('Ventes moyennes')
plt.show()
Extraction et visualisation des données avec plusieurs conditions
En combinant plusieurs conditions, vous pouvez extraire des données plus spécifiques et les visualiser.
# Extraire les données avec des ventes >= 1000 et un prix < 500
filtered_data = df[(df['Ventes'] >= 1000) & (df['Prix'] < 500)]
# Visualiser avec un nuage de points
plt.scatter(filtered_data['Prix'], filtered_data['Ventes'], color='purple', alpha=0.7)
plt.title('Relation entre ventes > 1000 et prix < 500')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.show()
Cela vous permet d'analyser des groupes de données spécifiques et de découvrir des motifs importants. Nous allons maintenant aborder la visualisation des données temporelles.
Méthodes de tracé des données temporelles
Les données temporelles sont essentielles pour analyser les tendances et les saisons en fonction du temps. Nous allons présenter comment tracer efficacement des données temporelles avec Pandas et les bibliothèques de visualisation.
Préparation des données temporelles
Tout d'abord, nous convertissons la colonne de dates en format datetime
de Pandas, ce qui permet d'utiliser les fonctionnalités temporelles de Pandas.
# Convertir la colonne Date en format datetime
df['Date'] = pd.to_datetime(df['Date'])
# Trier les données par date
df = df.sort_values('Date')
# Définir la date comme index (optionnel)
df.set_index('Date', inplace=True)
Tracer des données temporelles simples
Nous traçons les données temporelles avec un graphique en ligne.
# Tracer les ventes sur le temps
df['Ventes'].plot(figsize=(10, 5), color='blue', linewidth=2)
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()
Comparer plusieurs séries temporelles
Nous pouvons superposer plusieurs séries temporelles sur le même graphique pour les comparer.
# Tracer les ventes et les profits simultanément
df[['Ventes', 'Profits']].plot(figsize=(10, 5), linewidth=2)
plt.title('Évolution des ventes et des profits')
plt.xlabel('Date')
plt.ylabel('Montant')
plt.legend(['Ventes', 'Profits'])
plt.grid(True)
plt.show()
Analyse de la saisonnalité et des tendances
Les séries temporelles peuvent contenir des tendances ou de la saisonnalité. Nous pouvons les décomposer pour les analyser.
from statsmodels.tsa.seasonal import seasonal_decompose
# Décomposer les ventes saisonnièrement
decomposition = seasonal_decompose(df['Ventes'], model='additive', period=12)
# Tracer chaque élément (tendance, saisonnalité, résidus)
decomposition.plot()
plt.show()
Tracer des données sur une période spécifique
Nous extrayons les données pour une période spécifique et les traçons.
# Extraire les données de 2023
df_2023 = df['2023']
df_2023['Ventes'].plot(figsize=(10, 5), color='green', linewidth=2)
plt.title('Évolution des ventes en 2023')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()
Personnalisation des visualisations temporelles
Nous pouvons ajouter des marqueurs ou des annotations pour souligner certains éléments dans le graphique.
# Ajouter un marqueur aux ventes
plt.plot(df.index, df['Ventes'], marker='o', color='red', linewidth=2)
plt.title('Évolution des ventes avec marqueurs')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
# Ajouter une annotation à une date spécifique
peak_date = df['Ventes'].idxmax() # Date du pic des ventes
peak_value = df['Ventes'].max()
plt.annotate(f'Pic des ventes: {peak_value}', xy=(peak_date, peak_value), xytext=(peak_date, peak_value + 100),
arrowprops=dict(facecolor='black', arrowstyle='->'), fontsize=10)
plt.show()
Visualisation interactive des séries temporelles
Pour créer des visualisations interactives, vous pouvez utiliser des bibliothèques comme Plotly
.
import plotly.express as px
# Tracer les ventes de manière interactive
fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')
fig.show()
Ces méthodes vous permettent de visualiser efficacement les données temporelles et d'identifier les tendances et la saisonnalité. Nous allons maintenant aborder la manière de tracer plusieurs graphiques simultanément.
Méthodes pour tracer plusieurs graphiques simultanément
Lorsque vous analysez des données, il peut être utile d'afficher plusieurs graphiques en même temps pour comparer les données sous différents angles. Nous allons expliquer comment tracer plusieurs graphiques simultanément à l'aide de Matplotlib et Seaborn.
Tracer plusieurs graphiques avec Matplotlib
En utilisant subplot
de Matplotlib, vous pouvez tracer plusieurs graphiques dans une même figure.
import matplotlib.pyplot as plt
# Placer les graphiques sur 2 lignes et 2 colonnes
fig, axes = plt.subplots(2, 2, figsize=(12, 8))
# Graphique 1: Évolution des ventes
axes[0, 0].plot(df.index, df['Ventes'], color='blue', linewidth=2)
axes[0, 0].set_title('Évolution des ventes')
axes[0, 0].set_xlabel('Date')
axes[0, 0].set_ylabel('Ventes')
# Graphique 2: Évolution des profits
axes[0, 1].plot(df.index, df['Profits'], color='green', linewidth=2)
axes[0, 1].set_title('Évolution des profits')
axes[0, 1].set_xlabel('Date')
axes[0, 1].set_ylabel('Profits')
# Graphique 3: Distribution des ventes (Histogramme)
axes[1, 0].hist(df['Ventes'], bins=15, color='orange', edgecolor='black')
axes[1, 0].set_title('Distribution des ventes')
axes[1, 0].set_xlabel('Ventes')
axes[1, 0].set_ylabel('Fréquence')
# Graphique 4: Corrélation entre prix et ventes (Nuage de points)
axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
axes[1, 1].set_title('Corrélation entre prix et ventes')
axes[1, 1].set_xlabel('Prix')
axes[1, 1].set_ylabel('Ventes')
# Ajustement de la disposition
plt.tight_layout()
plt.show()
Tracer plusieurs graphiques avec Seaborn
Avec FacetGrid
de Seaborn, vous pouvez diviser vos données par catégories et tracer plusieurs graphiques.
import seaborn as sns
# Tracer les ventes par catégorie
g = sns.FacetGrid(df, col="Catégorie", col_wrap=3, height=4)
g.map(sns.lineplot, "Date", "Ventes")
g.set_titles("{col_name}")
g.set_axis_labels("Date", "Ventes")
plt.show()
Superposer différents types de graphiques dans une même figure
Vous pouvez superposer différents types de graphiques dans une seule figure pour comparer les données.
fig, ax1 = plt.subplots(figsize=(10, 6))
# Tracer les ventes avec un graphique en ligne
ax1.plot(df.index, df['Ventes'], color='blue', label='Ventes')
ax1.set_xlabel('Date')
ax1.set_ylabel('Ventes', color='blue')
ax1.tick_params(axis='y', labelcolor='blue')
# Ajouter les profits avec un graphique à barres
ax2 = ax1.twinx() # Créer un deuxième axe y
ax2.bar(df.index, df['Profits'], color='orange', alpha=0.6, label='Profits')
ax2.set_ylabel('Profits', color='orange')
ax2.tick_params(axis='y', labelcolor='orange')
# Titre et légende
fig.suptitle('Comparaison des ventes et des profits')
fig.legend(loc='upper left', bbox_to_anchor=(0.1, 0.9))
plt.show()
Sauvegarder plusieurs graphiques séparément
Si vous souhaitez sauvegarder chaque graphique individuellement, vous pouvez utiliser la fonction savefig()
pour chaque graphique.
# Sauvegarder l'évolution des ventes
df['Ventes'].plot()
plt.title('Évolution des ventes')
plt.savefig('sales_trend.png')
plt.clf() # Effacer le graphique actuel
# Sauvegarder la distribution des ventes
df['Ventes'].plot(kind='hist', bins=15, color='orange', edgecolor='black')
plt.title('Distribution des ventes')
plt.savefig('sales_distribution.png')
plt.clf()
Tracer plusieurs graphiques interactifs
Avec Plotly
, vous pouvez créer plusieurs graphiques interactifs.
import plotly.subplots as sp
import plotly.graph_objects as go
# Créer un sous-graphe
fig = sp.make_subplots(rows=2, cols=2, subplot_titles=("Ventes", "Profits", "Distribution des ventes", "Corrélation entre prix et ventes"))
# Tracer les ventes
fig.add_trace(go.Scatter(x=df.index, y=df['Ventes'], name='Ventes'), row=1, col=1)
# Tracer les profits
fig.add_trace(go.Scatter(x=df.index, y=df['Profits'], name='Profits'), row=1, col=2)
# Tracer la distribution des ventes
fig.add_trace(go.Histogram(x=df['Ventes'], name='Distribution des ventes'), row=2, col=1)
# Tracer la corrélation entre prix et ventes
fig.add_trace(go.Scatter(x=df['Prix'], y=df['Ventes'], mode='markers', name='Prix vs Ventes'), row=2, col=2)
# Ajuster la disposition
fig.update_layout(title_text="Comparaison de plusieurs graphiques", showlegend=False, height=800)
fig.show()
Tracer plusieurs graphiques en même temps vous permet d'analyser les données sous différents angles. Enfin, nous aborderons comment personnaliser les graphiques.
Méthodes de personnalisation des graphiques (couleurs, styles, annotations, etc.)
Pour rendre vos graphiques plus lisibles et informatifs, il est essentiel de personnaliser les couleurs, les styles et les annotations. Nous allons expliquer comment personnaliser les graphiques à l'aide de Matplotlib.
Modification des couleurs et des styles
Changer la couleur et le style des graphiques améliore leur lisibilité.
import matplotlib.pyplot as plt
# Personnalisation de base
plt.plot(df.index, df['Ventes'], color='blue', linestyle='--', linewidth=2, label='Ventes')
plt.plot(df.index, df['Profits'], color='green', linestyle='-', linewidth=2, label='Profits')
# Ajouter un titre et des labels d'axes
plt.title('Évolution des ventes et des profits', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12)
plt.ylabel('Montant', fontsize=12)
# Ajouter une légende
plt.legend(fontsize=10, loc='upper left')
# Ajouter une grille
plt.grid(color='gray', linestyle=':', linewidth=0.5)
plt.show()
Ajustement des polices et tailles
Modifier la taille de la police ou le style des polices des éléments de votre graphique peut améliorer leur lisibilité.
# Modifier la taille de police globale
plt.rcParams.update({'font.size': 12})
# Modifier uniquement certains éléments
plt.title('Titre personnalisé', fontsize=16, fontweight='bold')
plt.xlabel('Date', fontsize=12, fontstyle='italic')
plt.ylabel('Ventes', fontsize=12, fontstyle='italic')
Ajout d'annotations
Vous pouvez ajouter des annotations pour souligner certains points de données.
# Annotations sur le pic des ventes
peak_date = df['Ventes'].idxmax()
peak_value = df['Ventes'].max()
plt.plot(df.index, df['Ventes'], color='blue')
plt.annotate(f'Pic : {peak_value}',
xy=(peak_date, peak_value),
xytext=(peak_date, peak_value + 500),
arrowprops=dict(facecolor='red', arrowstyle='->'),
fontsize=10, color='darkred')
plt.title('Évolution des ventes avec annotations')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.grid(True)
plt.show()
Utilisation des cartes de couleurs
Les cartes de couleurs vous permettent de changer la couleur en fonction des valeurs.
# Appliquer une carte de couleur sur un nuage de points
plt.scatter(df['Prix'], df['Ventes'], c=df['Ventes'], cmap='viridis', alpha=0.8)
plt.title('Prix et ventes (Carte de couleurs)')
plt.xlabel('Prix')
plt.ylabel('Ventes')
plt.colorbar(label='Ventes')
plt.show()
Ajustement de la disposition des sous-graphiques
Si vous avez plusieurs graphiques dans une même figure, ajustez la disposition pour les rendre plus clairs.
fig, axes = plt.subplots(2, 2, figsize=(12, 8))
# Tracer chaque graphique
axes[0, 0].plot(df.index, df['Ventes'], color='blue')
axes[0, 0].set_title('Évolution des ventes')
axes[0, 1].plot(df.index, df['Profits'], color='green')
axes[0, 1].set_title('Évolution des profits')
axes[1, 0].hist(df['Ventes'], bins=15, color='orange')
axes[1, 0].set_title('Distribution des ventes')
axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
axes[1, 1].set_title('Corrélation entre prix et ventes')
# Ajuster la disposition
plt.tight_layout()
plt.show()
Changement de thème des graphiques
Avec Seaborn, vous pouvez changer le thème pour uniformiser le style de vos graphiques.
import seaborn as sns
# Définir un thème
sns.set_theme(style="whitegrid", palette="muted")
# Tracer les séries temporelles des ventes
sns.lineplot(x=df.index, y=df['Ventes'], color='blue', label='Ventes')
sns.lineplot(x=df.index, y=df['Profits'], color='green', label='Profits')
plt.title('Évolution des ventes et des profits (Thème appliqué)')
plt.xlabel('Date')
plt.ylabel('Montant')
plt.legend()
plt.show()
Sauvegarde des graphiques
Vous pouvez sauvegarder vos graphiques en tant qu'images avec la fonction savefig()
.
# Sauvegarder le graphique
plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.legend()
plt.savefig('sales_trend.png', dpi=300, bbox_inches='tight') # Sauvegarder en haute résolution
plt.show()
Ces méthodes vous permettent de créer des graphiques visuellement attrayants et efficaces. Enfin, nous abordons la sauvegarde des visualisations.
Méthodes de sauvegarde des données visualisées (exportation d'images)
Il est important de sauvegarder les graphiques que vous avez créés en tant qu'images pour les partager ou les utiliser dans des rapports. Nous allons explorer les méthodes pour sauvegarder des graphiques avec Matplotlib.
Méthode de sauvegarde de base
La fonction savefig()
de Matplotlib permet de sauvegarder un graphique en tant que fichier image. Voici un exemple de code de base.
import matplotlib.pyplot as plt
# Créer un graphique
plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
plt.title('Évolution des ventes')
plt.xlabel('Date')
plt.ylabel('Ventes')
plt.legend()
# Sauvegarder le graphique en image
plt.savefig('sales_trend.png')
plt.show()
Ce code sauvegarde le graphique actuel sous le nom sales_trend.png
au format PNG.
Spécification du format d'image
Matplotlib vous permet de sauvegarder des images dans plusieurs formats, tels que JPEG, PDF et SVG.
# Sauvegarder en format JPEG
plt.savefig('sales_trend.jpg', format='jpg')
# Sauvegarder en format PDF
plt.savefig('sales_trend.pdf', format='pdf')
# Sauvegarder en format SVG
plt.savefig('sales_trend.svg', format='svg')
Réglage de la résolution (DPI)
Vous pouvez spécifier la résolution de l'image pour la sauvegarder en haute qualité.
# Sauvegarder avec une haute résolution (300 DPI)
plt.savefig('sales_trend_high_res.png', dpi=300)
Ajustement des marges
Les graphiques peuvent parfois avoir des marges excessives. Utilisez bbox_inches='tight'
pour ajuster les marges.
# Sauvegarder en enlevant les marges
plt.savefig('sales_trend_tight.png', bbox_inches='tight')
Sauvegarde de plusieurs graphiques
Vous pouvez créer plusieurs graphiques et les sauvegarder dans des fichiers séparés.
# Graphique 1: Ventes
plt.plot(df.index, df['Ventes'], color='blue')
plt.title('Évolution des ventes')
plt.savefig('sales_plot.png')
plt.clf() # Effacer le graphique actuel
# Graphique 2: Profits
plt.plot(df.index, df['Profits'], color='green')
plt.title('Évolution des profits')
plt.savefig('profit_plot.png')
plt.clf()
Sauvegarde de graphiques interactifs
Les graphiques interactifs créés avec Plotly
peuvent être sauvegardés en format HTML.
import plotly.express as px
# Graphique interactif des ventes
fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')
# Sauvegarder au format HTML
fig.write_html('interactive_sales_plot.html')
Vérification après sauvegarde
Pour vérifier l'image sauvegardée, vous pouvez ouvrir l'image dans Python à l'aide d'un outil de visualisation d'image.
from PIL import Image
# Ouvrir l'image sauvegardée
img = Image.open('sales_trend.png')
img.show()
Ces méthodes vous permettent de sauvegarder et de partager vos graphiques. Nous conclurons l'article ici.
Résumé
Dans cet article, nous avons détaillé comment utiliser la bibliothèque Pandas de Python pour visualiser des données CSV. Nous avons abordé le chargement des données, la création de graphiques de base, le tracé de données temporelles, l'affichage de plusieurs graphiques, ainsi que la personnalisation des graphiques et leur sauvegarde.
La visualisation des données est une compétence essentielle pour transmettre des informations de manière claire. En combinant Pandas, Matplotlib et Seaborn, vous pouvez facilement découvrir des motifs et des tendances dans vos données. De plus, en utilisant des graphiques interactifs et en sauvegardant les résultats, vous pourrez partager vos analyses de manière efficace.
Utilisez ces techniques pour améliorer vos analyses de données et vos présentations.