Comment visualiser les données d’un fichier CSV avec pandas à l’aide de graphiques et de diagrammes

La visualisation des données d’un fichier CSV avec pandas est une technique importante pour effectuer des analyses de données et prendre des décisions rapidement et efficacement. En représentant visuellement les données, il devient plus facile d’identifier des tendances et des motifs, ce qui est largement utilisé dans l’analyse commerciale, la recherche scientifique et les projets académiques. Dans cet article, nous commencerons par les opérations de base pour lire les données CSV avec Pandas, puis nous utiliserons des bibliothèques comme Matplotlib et Seaborn pour visualiser les données de manière attrayante et compréhensible. Cela vous aidera à améliorer vos compétences en analyse de données en utilisant Python.

Sommaire

Chargement du fichier CSV et aperçu des données


En utilisant Pandas pour charger un fichier CSV, vous pouvez commencer efficacement l’analyse des données. Voici les étapes pour charger un fichier CSV et examiner un aperçu des données.

Chargement du fichier CSV


Nous chargeons un fichier CSV à l’aide de la fonction read_csv() de Pandas. Par exemple, si nous voulons charger un fichier nommé data.csv, nous utiliserons le code suivant.

import pandas as pd

# Charger le fichier CSV
df = pd.read_csv('data.csv')

# Afficher les premières lignes du DataFrame
print(df.head())

Ce code charge les données CSV dans un DataFrame Pandas et affiche les 5 premières lignes des données.

Aperçu des données


Pour obtenir une vue d’ensemble de la structure et des statistiques de base des données, voici les méthodes à utiliser.

  1. Vérification du nombre de lignes et de colonnes
   print(df.shape)
   # Sortie: (nombre de lignes, nombre de colonnes)
  1. Vérification des colonnes spécifiques
  2.    print(df['NomColonne'].unique())  # Afficher les valeurs uniques de la colonne
       print(df['NomColonne'].value_counts())  # Compter les occurrences des valeurs

    Ces méthodes permettent de comprendre les grandes lignes des données et de se préparer pour l’étape suivante de visualisation.

    Création de graphiques de base avec Matplotlib


    En combinant Pandas et Matplotlib, vous pouvez facilement visualiser les données CSV. Nous allons ici présenter comment créer des graphiques de base.

    Configuration de Matplotlib


    Tout d’abord, nous importons Matplotlib. En utilisant le module pyplot, nous pouvons facilement créer des graphiques.

    import matplotlib.pyplot as plt
    
    # Charger le DataFrame df
    df = pd.read_csv('data.csv')

    Création d’un graphique en ligne


    Un graphique en ligne est utile pour visualiser des données temporelles ou continues.

    # Tracer les données de vente par date
    plt.plot(df['Date'], df['Ventes'])
    plt.title('Évolution des ventes')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.xticks(rotation=45)  # Faire pivoter les labels de l'axe x
    plt.show()

    Création d’un graphique à barres


    Un graphique à barres est adapté pour visualiser les valeurs par catégorie.

    # Agréger les ventes par catégorie et créer un graphique à barres
    category_sales = df.groupby('Catégorie')['Ventes'].sum()
    category_sales.plot(kind='bar', color='skyblue')
    plt.title('Ventes par catégorie')
    plt.xlabel('Catégorie')
    plt.ylabel('Ventes')
    plt.show()

    Création d’un nuage de points


    Un nuage de points est utilisé pour visualiser la relation entre deux variables.

    # Tracer la relation entre le prix et les ventes
    plt.scatter(df['Prix'], df['Ventes'], alpha=0.7, color='green')
    plt.title('Corrélation entre prix et ventes')
    plt.xlabel('Prix')
    plt.ylabel('Ventes')
    plt.show()

    Création d’un histogramme


    Un histogramme est utile pour examiner la distribution des données.

    # Tracer la distribution des ventes
    df['Ventes'].plot(kind='hist', bins=20, color='orange', edgecolor='black')
    plt.title('Distribution des ventes')
    plt.xlabel('Ventes')
    plt.ylabel('Fréquence')
    plt.show()

    Ces graphiques vous permettent de mieux comprendre les caractéristiques des données. Nous allons maintenant apprendre à réaliser des visualisations plus avancées avec Seaborn.

    Utilisation de Seaborn pour des graphiques avancés


    Seaborn est une bibliothèque qui fonctionne avec Pandas et Matplotlib, permettant de créer facilement des graphiques de haute qualité. Elle permet de réaliser des tracés plus complexes et de styliser les graphiques de manière intuitive. Nous allons découvrir les méthodes de visualisation avancées avec Seaborn.

    Configuration de Seaborn


    Nous commençons par importer Seaborn et définir son style.

    import seaborn as sns
    
    # Définir le style
    sns.set(style="whitegrid")  
    df = pd.read_csv('data.csv')  # Charger les données

    Visualisation des données catégorielles : boîte à moustaches


    Un graphique à boîte est utile pour visualiser la distribution des données par catégorie.

    # Visualiser la distribution des ventes par catégorie
    sns.boxplot(x='Catégorie', y='Ventes', data=df, palette='pastel')
    plt.title('Distribution des ventes par catégorie')
    plt.xlabel('Catégorie')
    plt.ylabel('Ventes')
    plt.show()

    Visualisation de la corrélation : nuage de points et droite de régression


    Avec regplot de Seaborn, vous pouvez ajouter une droite de régression à un nuage de points.

    # Tracer la corrélation entre le prix et les ventes
    sns.regplot(x='Prix', y='Ventes', data=df, scatter_kws={'alpha':0.6}, line_kws={'color':'red'})
    plt.title('Corrélation entre prix et ventes')
    plt.xlabel('Prix')
    plt.ylabel('Ventes')
    plt.show()

    Visualisation de la distribution des données : carte thermique


    Pour visualiser une matrice de corrélation, vous pouvez utiliser une carte thermique.

    # Calculer la matrice de corrélation
    correlation_matrix = df.corr()
    
    # Créer la carte thermique
    sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f')
    plt.title('Matrice de corrélation')
    plt.show()

    Relation entre catégorie et données numériques : graphique en violon


    Un graphique en violon permet de visualiser la distribution des données par catégorie de manière lisse.

    # Tracer la distribution des ventes par catégorie
    sns.violinplot(x='Catégorie', y='Ventes', data=df, palette='muted', inner='quartile')
    plt.title('Distribution des ventes par catégorie (Graphique en violon)')
    plt.xlabel('Catégorie')
    plt.ylabel('Ventes')
    plt.show()

    Mettre en évidence les tendances des données : graphique en comptage


    Pour visualiser la fréquence d’apparition des données catégorielles, un graphique de comptage est utile.

    # Tracer la fréquence des catégories de produits
    sns.countplot(x='Catégorie', data=df, palette='viridis')
    plt.title('Fréquence des catégories de produits')
    plt.xlabel('Catégorie')
    plt.ylabel('Fréquence')
    plt.show()

    Les graphiques sophistiqués de Seaborn permettent d’approfondir l’analyse des données. Nous allons maintenant expliquer comment extraire et visualiser des données spécifiques dans un DataFrame.

    Visualisation des données extraites de colonnes spécifiques


    Dans l’analyse de données, il est essentiel d’extraire des colonnes ou des données en fonction de critères spécifiques pour les visualiser. Voici comment filtrer les données avec Pandas et créer des graphiques appropriés.

    Extraction et tracé d’une colonne spécifique


    Lorsque vous vous concentrez sur une colonne spécifique, vous extrayez les données de cette colonne et les visualisez.

    # Afficher les ventes sous forme d'histogramme
    df['Ventes'].plot(kind='hist', bins=15, color='skyblue', edgecolor='black')
    plt.title('Distribution des ventes')
    plt.xlabel('Ventes')
    plt.ylabel('Fréquence')
    plt.show()

    Tracé de plusieurs colonnes ensemble


    Vous pouvez sélectionner plusieurs colonnes pour visualiser leur corrélation.

    # Tracer la relation entre le prix et les ventes sous forme de nuage de points
    plt.scatter(df['Prix'], df['Ventes'], color='green', alpha=0.6)
    plt.title('Corrélation entre prix et ventes')
    plt.xlabel('Prix')
    plt.ylabel('Ventes')
    plt.show()

    Visualisation basée sur des conditions spécifiques


    Vous pouvez extraire des données en fonction de certaines conditions et les visualiser pour une analyse plus approfondie.

    # Extraire et tracer les données de ventes supérieures à 1000
    high_sales = df[df['Ventes'] >= 1000]
    plt.plot(high_sales['Date'], high_sales['Ventes'], marker='o', color='orange')
    plt.title('Ventes supérieures à 1000 par date')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.xticks(rotation=45)
    plt.show()

    Agrégation des données et visualisation par groupes


    Vous pouvez regrouper les données par catégorie ou par attribut et visualiser les résultats.

    # Calculer les ventes moyennes par catégorie
    category_avg_sales = df.groupby('Catégorie')['Ventes'].mean()
    
    # Visualiser avec un graphique à barres
    category_avg_sales.plot(kind='bar', color='coral')
    plt.title('Ventes moyennes par catégorie')
    plt.xlabel('Catégorie')
    plt.ylabel('Ventes moyennes')
    plt.show()

    Extraction et visualisation des données avec plusieurs conditions


    En combinant plusieurs conditions, vous pouvez extraire des données plus spécifiques et les visualiser.

    # Extraire les données avec des ventes >= 1000 et un prix < 500
    filtered_data = df[(df['Ventes'] >= 1000) & (df['Prix'] < 500)]
    
    # Visualiser avec un nuage de points
    plt.scatter(filtered_data['Prix'], filtered_data['Ventes'], color='purple', alpha=0.7)
    plt.title('Relation entre ventes > 1000 et prix < 500')
    plt.xlabel('Prix')
    plt.ylabel('Ventes')
    plt.show()

    Cela vous permet d'analyser des groupes de données spécifiques et de découvrir des motifs importants. Nous allons maintenant aborder la visualisation des données temporelles.

    Méthodes de tracé des données temporelles


    Les données temporelles sont essentielles pour analyser les tendances et les saisons en fonction du temps. Nous allons présenter comment tracer efficacement des données temporelles avec Pandas et les bibliothèques de visualisation.

    Préparation des données temporelles


    Tout d'abord, nous convertissons la colonne de dates en format datetime de Pandas, ce qui permet d'utiliser les fonctionnalités temporelles de Pandas.

    # Convertir la colonne Date en format datetime
    df['Date'] = pd.to_datetime(df['Date'])
    
    # Trier les données par date
    df = df.sort_values('Date')
    
    # Définir la date comme index (optionnel)
    df.set_index('Date', inplace=True)

    Tracer des données temporelles simples


    Nous traçons les données temporelles avec un graphique en ligne.

    # Tracer les ventes sur le temps
    df['Ventes'].plot(figsize=(10, 5), color='blue', linewidth=2)
    plt.title('Évolution des ventes')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.grid(True)
    plt.show()

    Comparer plusieurs séries temporelles


    Nous pouvons superposer plusieurs séries temporelles sur le même graphique pour les comparer.

    # Tracer les ventes et les profits simultanément
    df[['Ventes', 'Profits']].plot(figsize=(10, 5), linewidth=2)
    plt.title('Évolution des ventes et des profits')
    plt.xlabel('Date')
    plt.ylabel('Montant')
    plt.legend(['Ventes', 'Profits'])
    plt.grid(True)
    plt.show()

    Analyse de la saisonnalité et des tendances


    Les séries temporelles peuvent contenir des tendances ou de la saisonnalité. Nous pouvons les décomposer pour les analyser.

    from statsmodels.tsa.seasonal import seasonal_decompose
    
    # Décomposer les ventes saisonnièrement
    decomposition = seasonal_decompose(df['Ventes'], model='additive', period=12)
    
    # Tracer chaque élément (tendance, saisonnalité, résidus)
    decomposition.plot()
    plt.show()

    Tracer des données sur une période spécifique


    Nous extrayons les données pour une période spécifique et les traçons.

    # Extraire les données de 2023
    df_2023 = df['2023']
    df_2023['Ventes'].plot(figsize=(10, 5), color='green', linewidth=2)
    plt.title('Évolution des ventes en 2023')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.grid(True)
    plt.show()

    Personnalisation des visualisations temporelles


    Nous pouvons ajouter des marqueurs ou des annotations pour souligner certains éléments dans le graphique.

    # Ajouter un marqueur aux ventes
    plt.plot(df.index, df['Ventes'], marker='o', color='red', linewidth=2)
    plt.title('Évolution des ventes avec marqueurs')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.grid(True)
    
    # Ajouter une annotation à une date spécifique
    peak_date = df['Ventes'].idxmax()  # Date du pic des ventes
    peak_value = df['Ventes'].max()
    plt.annotate(f'Pic des ventes: {peak_value}', xy=(peak_date, peak_value), xytext=(peak_date, peak_value + 100),
                 arrowprops=dict(facecolor='black', arrowstyle='->'), fontsize=10)
    
    plt.show()

    Visualisation interactive des séries temporelles


    Pour créer des visualisations interactives, vous pouvez utiliser des bibliothèques comme Plotly.

    import plotly.express as px
    
    # Tracer les ventes de manière interactive
    fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')
    fig.show()

    Ces méthodes vous permettent de visualiser efficacement les données temporelles et d'identifier les tendances et la saisonnalité. Nous allons maintenant aborder la manière de tracer plusieurs graphiques simultanément.

    Méthodes pour tracer plusieurs graphiques simultanément


    Lorsque vous analysez des données, il peut être utile d'afficher plusieurs graphiques en même temps pour comparer les données sous différents angles. Nous allons expliquer comment tracer plusieurs graphiques simultanément à l'aide de Matplotlib et Seaborn.

    Tracer plusieurs graphiques avec Matplotlib


    En utilisant subplot de Matplotlib, vous pouvez tracer plusieurs graphiques dans une même figure.

    import matplotlib.pyplot as plt
    
    # Placer les graphiques sur 2 lignes et 2 colonnes
    fig, axes = plt.subplots(2, 2, figsize=(12, 8))
    
    # Graphique 1: Évolution des ventes
    axes[0, 0].plot(df.index, df['Ventes'], color='blue', linewidth=2)
    axes[0, 0].set_title('Évolution des ventes')
    axes[0, 0].set_xlabel('Date')
    axes[0, 0].set_ylabel('Ventes')
    
    # Graphique 2: Évolution des profits
    axes[0, 1].plot(df.index, df['Profits'], color='green', linewidth=2)
    axes[0, 1].set_title('Évolution des profits')
    axes[0, 1].set_xlabel('Date')
    axes[0, 1].set_ylabel('Profits')
    
    # Graphique 3: Distribution des ventes (Histogramme)
    axes[1, 0].hist(df['Ventes'], bins=15, color='orange', edgecolor='black')
    axes[1, 0].set_title('Distribution des ventes')
    axes[1, 0].set_xlabel('Ventes')
    axes[1, 0].set_ylabel('Fréquence')
    
    # Graphique 4: Corrélation entre prix et ventes (Nuage de points)
    axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
    axes[1, 1].set_title('Corrélation entre prix et ventes')
    axes[1, 1].set_xlabel('Prix')
    axes[1, 1].set_ylabel('Ventes')
    
    # Ajustement de la disposition
    plt.tight_layout()
    plt.show()

    Tracer plusieurs graphiques avec Seaborn


    Avec FacetGrid de Seaborn, vous pouvez diviser vos données par catégories et tracer plusieurs graphiques.

    import seaborn as sns
    
    # Tracer les ventes par catégorie
    g = sns.FacetGrid(df, col="Catégorie", col_wrap=3, height=4)
    g.map(sns.lineplot, "Date", "Ventes")
    g.set_titles("{col_name}")
    g.set_axis_labels("Date", "Ventes")
    plt.show()

    Superposer différents types de graphiques dans une même figure


    Vous pouvez superposer différents types de graphiques dans une seule figure pour comparer les données.

    fig, ax1 = plt.subplots(figsize=(10, 6))
    
    # Tracer les ventes avec un graphique en ligne
    ax1.plot(df.index, df['Ventes'], color='blue', label='Ventes')
    ax1.set_xlabel('Date')
    ax1.set_ylabel('Ventes', color='blue')
    ax1.tick_params(axis='y', labelcolor='blue')
    
    # Ajouter les profits avec un graphique à barres
    ax2 = ax1.twinx()  # Créer un deuxième axe y
    ax2.bar(df.index, df['Profits'], color='orange', alpha=0.6, label='Profits')
    ax2.set_ylabel('Profits', color='orange')
    ax2.tick_params(axis='y', labelcolor='orange')
    
    # Titre et légende
    fig.suptitle('Comparaison des ventes et des profits')
    fig.legend(loc='upper left', bbox_to_anchor=(0.1, 0.9))
    plt.show()

    Sauvegarder plusieurs graphiques séparément


    Si vous souhaitez sauvegarder chaque graphique individuellement, vous pouvez utiliser la fonction savefig() pour chaque graphique.

    # Sauvegarder l'évolution des ventes
    df['Ventes'].plot()
    plt.title('Évolution des ventes')
    plt.savefig('sales_trend.png')
    plt.clf()  # Effacer le graphique actuel
    
    # Sauvegarder la distribution des ventes
    df['Ventes'].plot(kind='hist', bins=15, color='orange', edgecolor='black')
    plt.title('Distribution des ventes')
    plt.savefig('sales_distribution.png')
    plt.clf()

    Tracer plusieurs graphiques interactifs


    Avec Plotly, vous pouvez créer plusieurs graphiques interactifs.

    import plotly.subplots as sp
    import plotly.graph_objects as go
    
    # Créer un sous-graphe
    fig = sp.make_subplots(rows=2, cols=2, subplot_titles=("Ventes", "Profits", "Distribution des ventes", "Corrélation entre prix et ventes"))
    
    # Tracer les ventes
    fig.add_trace(go.Scatter(x=df.index, y=df['Ventes'], name='Ventes'), row=1, col=1)
    
    # Tracer les profits
    fig.add_trace(go.Scatter(x=df.index, y=df['Profits'], name='Profits'), row=1, col=2)
    
    # Tracer la distribution des ventes
    fig.add_trace(go.Histogram(x=df['Ventes'], name='Distribution des ventes'), row=2, col=1)
    
    # Tracer la corrélation entre prix et ventes
    fig.add_trace(go.Scatter(x=df['Prix'], y=df['Ventes'], mode='markers', name='Prix vs Ventes'), row=2, col=2)
    
    # Ajuster la disposition
    fig.update_layout(title_text="Comparaison de plusieurs graphiques", showlegend=False, height=800)
    fig.show()

    Tracer plusieurs graphiques en même temps vous permet d'analyser les données sous différents angles. Enfin, nous aborderons comment personnaliser les graphiques.

    Méthodes de personnalisation des graphiques (couleurs, styles, annotations, etc.)


    Pour rendre vos graphiques plus lisibles et informatifs, il est essentiel de personnaliser les couleurs, les styles et les annotations. Nous allons expliquer comment personnaliser les graphiques à l'aide de Matplotlib.

    Modification des couleurs et des styles


    Changer la couleur et le style des graphiques améliore leur lisibilité.

    import matplotlib.pyplot as plt
    
    # Personnalisation de base
    plt.plot(df.index, df['Ventes'], color='blue', linestyle='--', linewidth=2, label='Ventes')
    plt.plot(df.index, df['Profits'], color='green', linestyle='-', linewidth=2, label='Profits')
    
    # Ajouter un titre et des labels d'axes
    plt.title('Évolution des ventes et des profits', fontsize=16, fontweight='bold')
    plt.xlabel('Date', fontsize=12)
    plt.ylabel('Montant', fontsize=12)
    
    # Ajouter une légende
    plt.legend(fontsize=10, loc='upper left')
    
    # Ajouter une grille
    plt.grid(color='gray', linestyle=':', linewidth=0.5)
    
    plt.show()

    Ajustement des polices et tailles


    Modifier la taille de la police ou le style des polices des éléments de votre graphique peut améliorer leur lisibilité.

    # Modifier la taille de police globale
    plt.rcParams.update({'font.size': 12})
    
    # Modifier uniquement certains éléments
    plt.title('Titre personnalisé', fontsize=16, fontweight='bold')
    plt.xlabel('Date', fontsize=12, fontstyle='italic')
    plt.ylabel('Ventes', fontsize=12, fontstyle='italic')

    Ajout d'annotations


    Vous pouvez ajouter des annotations pour souligner certains points de données.

    # Annotations sur le pic des ventes
    peak_date = df['Ventes'].idxmax()
    peak_value = df['Ventes'].max()
    
    plt.plot(df.index, df['Ventes'], color='blue')
    plt.annotate(f'Pic : {peak_value}', 
                 xy=(peak_date, peak_value), 
                 xytext=(peak_date, peak_value + 500),
                 arrowprops=dict(facecolor='red', arrowstyle='->'),
                 fontsize=10, color='darkred')
    
    plt.title('Évolution des ventes avec annotations')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.grid(True)
    plt.show()

    Utilisation des cartes de couleurs


    Les cartes de couleurs vous permettent de changer la couleur en fonction des valeurs.

    # Appliquer une carte de couleur sur un nuage de points
    plt.scatter(df['Prix'], df['Ventes'], c=df['Ventes'], cmap='viridis', alpha=0.8)
    plt.title('Prix et ventes (Carte de couleurs)')
    plt.xlabel('Prix')
    plt.ylabel('Ventes')
    plt.colorbar(label='Ventes')
    plt.show()

    Ajustement de la disposition des sous-graphiques


    Si vous avez plusieurs graphiques dans une même figure, ajustez la disposition pour les rendre plus clairs.

    fig, axes = plt.subplots(2, 2, figsize=(12, 8))
    
    # Tracer chaque graphique
    axes[0, 0].plot(df.index, df['Ventes'], color='blue')
    axes[0, 0].set_title('Évolution des ventes')
    
    axes[0, 1].plot(df.index, df['Profits'], color='green')
    axes[0, 1].set_title('Évolution des profits')
    
    axes[1, 0].hist(df['Ventes'], bins=15, color='orange')
    axes[1, 0].set_title('Distribution des ventes')
    
    axes[1, 1].scatter(df['Prix'], df['Ventes'], color='purple', alpha=0.7)
    axes[1, 1].set_title('Corrélation entre prix et ventes')
    
    # Ajuster la disposition
    plt.tight_layout()
    plt.show()

    Changement de thème des graphiques


    Avec Seaborn, vous pouvez changer le thème pour uniformiser le style de vos graphiques.

    import seaborn as sns
    
    # Définir un thème
    sns.set_theme(style="whitegrid", palette="muted")
    
    # Tracer les séries temporelles des ventes
    sns.lineplot(x=df.index, y=df['Ventes'], color='blue', label='Ventes')
    sns.lineplot(x=df.index, y=df['Profits'], color='green', label='Profits')
    
    plt.title('Évolution des ventes et des profits (Thème appliqué)')
    plt.xlabel('Date')
    plt.ylabel('Montant')
    plt.legend()
    plt.show()

    Sauvegarde des graphiques


    Vous pouvez sauvegarder vos graphiques en tant qu'images avec la fonction savefig().

    # Sauvegarder le graphique
    plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
    plt.title('Évolution des ventes')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.legend()
    plt.savefig('sales_trend.png', dpi=300, bbox_inches='tight')  # Sauvegarder en haute résolution
    plt.show()

    Ces méthodes vous permettent de créer des graphiques visuellement attrayants et efficaces. Enfin, nous abordons la sauvegarde des visualisations.

    Méthodes de sauvegarde des données visualisées (exportation d'images)


    Il est important de sauvegarder les graphiques que vous avez créés en tant qu'images pour les partager ou les utiliser dans des rapports. Nous allons explorer les méthodes pour sauvegarder des graphiques avec Matplotlib.

    Méthode de sauvegarde de base


    La fonction savefig() de Matplotlib permet de sauvegarder un graphique en tant que fichier image. Voici un exemple de code de base.

    import matplotlib.pyplot as plt
    
    # Créer un graphique
    plt.plot(df.index, df['Ventes'], color='blue', label='Ventes')
    plt.title('Évolution des ventes')
    plt.xlabel('Date')
    plt.ylabel('Ventes')
    plt.legend()
    
    # Sauvegarder le graphique en image
    plt.savefig('sales_trend.png')
    plt.show()


    Ce code sauvegarde le graphique actuel sous le nom sales_trend.png au format PNG.

    Spécification du format d'image


    Matplotlib vous permet de sauvegarder des images dans plusieurs formats, tels que JPEG, PDF et SVG.

    # Sauvegarder en format JPEG
    plt.savefig('sales_trend.jpg', format='jpg')
    
    # Sauvegarder en format PDF
    plt.savefig('sales_trend.pdf', format='pdf')
    
    # Sauvegarder en format SVG
    plt.savefig('sales_trend.svg', format='svg')

    Réglage de la résolution (DPI)


    Vous pouvez spécifier la résolution de l'image pour la sauvegarder en haute qualité.

    # Sauvegarder avec une haute résolution (300 DPI)
    plt.savefig('sales_trend_high_res.png', dpi=300)

    Ajustement des marges


    Les graphiques peuvent parfois avoir des marges excessives. Utilisez bbox_inches='tight' pour ajuster les marges.

    # Sauvegarder en enlevant les marges
    plt.savefig('sales_trend_tight.png', bbox_inches='tight')

    Sauvegarde de plusieurs graphiques


    Vous pouvez créer plusieurs graphiques et les sauvegarder dans des fichiers séparés.

    # Graphique 1: Ventes
    plt.plot(df.index, df['Ventes'], color='blue')
    plt.title('Évolution des ventes')
    plt.savefig('sales_plot.png')
    plt.clf()  # Effacer le graphique actuel
    
    # Graphique 2: Profits
    plt.plot(df.index, df['Profits'], color='green')
    plt.title('Évolution des profits')
    plt.savefig('profit_plot.png')
    plt.clf()

    Sauvegarde de graphiques interactifs


    Les graphiques interactifs créés avec Plotly peuvent être sauvegardés en format HTML.

    import plotly.express as px
    
    # Graphique interactif des ventes
    fig = px.line(df.reset_index(), x='Date', y='Ventes', title='Évolution des ventes')
    
    # Sauvegarder au format HTML
    fig.write_html('interactive_sales_plot.html')

    Vérification après sauvegarde


    Pour vérifier l'image sauvegardée, vous pouvez ouvrir l'image dans Python à l'aide d'un outil de visualisation d'image.

    from PIL import Image
    
    # Ouvrir l'image sauvegardée
    img = Image.open('sales_trend.png')
    img.show()

    Ces méthodes vous permettent de sauvegarder et de partager vos graphiques. Nous conclurons l'article ici.

    Résumé


    Dans cet article, nous avons détaillé comment utiliser la bibliothèque Pandas de Python pour visualiser des données CSV. Nous avons abordé le chargement des données, la création de graphiques de base, le tracé de données temporelles, l'affichage de plusieurs graphiques, ainsi que la personnalisation des graphiques et leur sauvegarde.

    La visualisation des données est une compétence essentielle pour transmettre des informations de manière claire. En combinant Pandas, Matplotlib et Seaborn, vous pouvez facilement découvrir des motifs et des tendances dans vos données. De plus, en utilisant des graphiques interactifs et en sauvegardant les résultats, vous pourrez partager vos analyses de manière efficace.

    Utilisez ces techniques pour améliorer vos analyses de données et vos présentations.

Sommaire