Windows 11 : BSOD à répétition — diagnostic complet et correctifs (Z790, i9‑13900KF, DDR5, RTX 4090)

Des BSOD aléatoires sur Windows 11 malgré un matériel haut de gamme ? Voici une méthode éprouvée pour diagnostiquer et stabiliser un PC Z790/i9‑13900KF/DDR5/RTX 4090 : causes probables, procédures concrètes, réglages BIOS et check‑lists.

Sommaire

Contexte et symptômes

Un ordinateur haut de gamme sous Windows 11 Pro s’est mis à afficher des écrans bleus (BSOD) après plusieurs mois sans incident. Les codes d’arrêt renvoyés étaient variés et touchaient à la fois la mémoire, le stockage et les services noyau :

  • PAGE_FAULT_IN_NONPAGED_AREA
  • UNEXPECTED_STORE_EXCEPTION
  • IRQL_NOT_LESS_OR_EQUAL
  • SYSTEM_SERVICE_EXCEPTION

Les plantages survenaient à n’importe quel moment : au démarrage, en jeu, en veille ou au repos. La configuration matérielle représentative du cas étudié est la suivante :

  • CPU : Intel Core i9‑13900KF
  • RAM : 64 Go DDR5
  • GPU : GeForce RTX 4090
  • Carte mère : Asus Prime Z790‑P
  • Stockage système : SSD Samsung 970 EVO Plus (NVMe)

Ce qui a été testé, et ce que cela révèle

Le diagnostic a été mené pas‑à‑pas. Le tableau ci‑dessous récapitule les actions, leurs résultats et la lecture qu’on peut en faire.

ÉtapeActionRésultat / ObjetInterprétation
1SFC / DISMCorruptions d’abord non réparées, puis réparéesL’intégrité Windows a fluctué ; une source logicielle est plausible
2MemTest86 (4 passes)0 erreurLa RAM est probablement saine aux timings/fréquences testés
3Mise à jour BIOS + pilotesLégère améliorationFacteur firmware/pilotes impliqué, mais pas unique
4Désactivation DOCP/XMPStabilité accrue mais non définitiveTiming/tension DDR5 possiblement trop agressifs
5Driver VerifierTrois BSOD, dumps corrompus, pas de pilote incriminéLa piste « pilote tiers » est mince, voire combinaison de causes
6Réinitialiser ce PC (cloud)BSOD persistantsCette réinitialisation conserve parfois des reliquats
7Vraie ré‑installation propre via clé USBUn BSOD SYSTEM_SERVICE_EXCEPTION puis SFC a corrigé des fichiers – stabilité retrouvéeConsolide l’hypothèse d’un résidu logiciel
8CrystalDiskInfo sur SSD + HDDÉtat « Good »Disques écartés, au moins du point de vue SMART

Traduction technique des codes d’arrêt

Ces BSOD sont connus pour émerger de plusieurs couches (pilotes, mémoire, E/S, services noyau). Le tableau suivant aide à cibler les vérifications pertinentes.

Code BSODCauses fréquentesVérifications utiles
PAGE_FAULT_IN_NONPAGED_AREAAccès mémoire invalide, pilote défectueux, RAM instable, antivirusMemTest, désactivation XMP, mise à jour pilotes noyau, SFC/DISM
UNEXPECTED_STORE_EXCEPTIONProblèmes E/S, firmware SSD, filtre de stockage, hibernationSMART/firmware SSD, désactiver hibernation, vérifier pilotes de stockage
IRQL_NOT_LESS_OR_EQUALAccès IRQ inapproprié par un pilote, mémoire/IMC instablesDriver Verifier (non‑Microsoft), test RAM à fréquence abaissée
SYSTEM_SERVICE_EXCEPTIONViolation dans une API noyau, filtre sécurité/graphiqueMises à jour Windows, pilotes chipset/MEI, SFC/DISM et dumps

Procédure recommandée pour revenir à une base saine

Suivez ce cheminement en conservant l’ordre : d’abord un système propre et minimal, puis des ajouts par « lots » vérifiés.

Préparer l’installation propre

  1. Sauvegarder toutes les données (y compris profils de jeux, clés de licences, dossiers utilisateurs).
  2. Créer une clé USB d’installation de Windows 11 (outil officiel) et débrancher tous les disques secondaires pour éviter toute écriture parasite du bootloader.
  3. Dans le BIOS/UEFI : charger les valeurs par défaut, laisser le RAM Profile (XMP/DOCP) désactivé, activer AHCI/PCIe par défaut (pas d’overclock).

Installer en supprimant toutes les partitions système

  1. Démarrer sur la clé USB UEFI, choisir Installation personnalisée.
  2. Sur le SSD système, supprimer toutes les partitions Windows existantes (EFI, MSR, Recovery, OS), puis sélectionner l’espace non alloué et cliquer sur Suivant. L’installeur recréera les partitions correctement.
  3. Laisser Windows terminer l’installation, puis effectuer la configuration initiale sans installer d’applications tierces.

Ordre d’installation des pilotes (crucial)

  1. Chipset Intel (packages INF), puis Intel MEI (Management Engine).
  2. Pilotes réseau (Ethernet/Wi‑Fi/Bluetooth) fournis par le constructeur carte mère ou via Intel Driver & Support Assistant.
  3. GPU après redémarrage (pilote « clean » si possible).
  4. Passage par Windows Update avec plusieurs cycles Rechercher > Installer > Redémarrer jusqu’à ce qu’il n’y ait plus de mises à jour de pilotes.

Contrôles d’intégrité après chaque lot

Après chaque étage d’installations (chipset/MEI, réseau, GPU, applications), exécuter :

dism /online /cleanup-image /restorehealth
sfc /scannow

Si SFC répare des fichiers, redémarrer et relancer sfc /scannow jusqu’à « aucune violation d’intégrité ».

Valider la stabilité de base

  • Utiliser plusieurs heures le système dans des tâches mixtes (navigateur, vidéo, compressions, jeu léger) en surveillant l’Observateur d’événements (Applications & Système).
  • Vérifier l’absence de BugCheck 1001 et d’erreurs Kernel‑Power 41 (63).

Réactiver XMP/DOCP prudemment

Après 2–3 jours sans BSOD :

  • Activer XMP/DOCP, mais si la configuration est 2×32 Go DDR5, viser d’abord 5600 MT/s puis monter par paliers (6000 MT/s) si stable.
  • Maintenir VDD/VDDQ ≤ 1,35 V. Laisser le Memory Controller/SA en Auto (éviter les surtensions).
  • Si des BSOD réapparaissent, revenir à 5600 MT/s ou désactiver XMP, puis tester chaque barrette individuellement en A2/B2.

Surveiller et documenter correctement les pannes

Activer des minidumps fiables

  1. Panneau de configuration > Système > Paramètres système avancés > Démarrage et récupération.
  2. Section Écriture des informations de débogage : Image mémoire automatique (ou mémoire du noyau).
  3. Vérifier que le fichier de pagination est géré par le système sur le disque système.

Les minidumps se trouvent dans C:\Windows\Minidump (et éventuellement C:\Windows\MEMORY.DMP).

Observer ce que Windows en pense

  • Observateur d’événements > Journaux Windows > Système : filtrer sur BugCheck (1001) et Kernel‑Power 41.
  • Moniteur de fiabilité (Reliability Monitor) : un graphique chronologique lisible des erreurs applicatives et système.

Utiliser Driver Verifier avec précaution

Uniquement si le système est démarrable et que les BSOD persistent de façon sporadique :

  1. Lancer verifier > Créer des paramètres standard > Sélectionner automatiquement tous les pilotes non Microsoft.
  2. Redémarrer et reproduire le scénario. Désactiver ensuite avec verifier /reset (via CMD admin) si le système devient instable.

DDR5 & Z790 : bonnes pratiques de stabilité

Les plateformes Z790 et 64 Go DDR5 peuvent requerir un réglage plus conservateur, surtout avec quatre barrettes ou des modules 2×32 Go « dual‑rank ». Quelques repères :

Population mémoireFréquence cible réalisteConseils
2×16 Go (simple rang)6000–6400 MT/sTimings XMP souvent tenables, VDD/VDDQ <= 1,35 V
2×32 Go (dual‑rank)5600–6000 MT/sCommencer à 5600, passer à 6000 si stable, éviter les tensions IMC fixes
4×16 Go5200–5600 MT/sCharger « Optimized Defaults », laisser le training mémoire faire son travail

Après chaque changement XMP / DOCP, effectuer un cold boot, puis un MemTest86 (au moins 4 passes) avant de déclarer le profil « bon ».

Électricité, thermiques et alimentation

Les erreurs IRQL, Store et Service peuvent surgir lors de pics de charge combinant CPU/GPU et E/S.

  • Alimentation : pour un couple i9‑13900KF + RTX 4090, une PSU de qualité, certifiée et correctement dimensionnée (marge de 20–30 %) est recommandée.
  • Connectique : vérifier les connecteurs GPU (12VHPWR), l’absence de jeu, le cheminement des câbles.
  • Thermiques : surveiller les températures CPU (pics >95 °C possibles en burst) et SSD, et adapter le boîtier/airflow.

Plan de test & validation croisée

ScénarioOutilDuréeObjectif
CPU purOCCT « Small Data Set »30 minValider IMC + cache, détecter instabilités rapides
GPUStress GPU dédié30–60 minTester alimentation et pilote graphique
MixteOCCT « Power Test »20–30 minObserver la stabilité de la ligne +12 V en charge combinée
RAMMemTest864 passesDébusquer erreurs bit‑flip ou training instable
Veille/Sortie de veilleCycle S3/S0 répété10 cyclesDétecter problèmes ACPI/pilotes périphériques

Arbre de décision en cas de récidive

  1. Aucun dump généré : vérifier minidump, pagefile, espace libre (≥1 % du SSD), réactiver CrashDump automatique.
  2. Erreurs mémoire : tester chaque barrette seule, slots A2/B2, XMP off, puis RMA de la barrette fautive.
  3. Erreurs uniquement en charge GPU : inspecter câblage GPU, changer le câble/rail PSU si possible, réinstaller le pilote graphique en « propre ».
  4. Erreurs en E/S disque : vérifier firmware du SSD, désactiver l’hibernation si instable (powercfg /h off), réinstaller le pilote de stockage.
  5. Erreurs noyau variées après XMP : abaisser à 5600 MT/s, VDD/VDDQ ≤1,35 V, laisser IMC/SA en auto.
  6. Échec persistant malgré tout : suspecter la carte mère (RMA) ou l’alimentation.

Cas réel : ce qui a fonctionné

Dans le scénario décrit, la ré‑installation propre depuis un support externe, avec suppression de toutes les partitions système, a été déterminante. Après un unique BSOD SYSTEM_SERVICE_EXCEPTION post‑install, l’exécution de sfc /scannow a corrigé des fichiers et la stabilité s’est réinstallée. Aucun nouveau BSOD n’a été constaté sur plus de 15 heures d’usage soutenu (jeux, multitâche, veille/résume). Une période d’observation de 7‑10 jours reste recommandée avant de clôturer définitivement.

Checklist « zéro bruit » après installation

ActionPourquoiÉtat cible
Windows Update & redémarrages multiplesStabiliser la pile noyau/pilotesAucune mise à jour en attente
Chipset > MEI > Réseau > GPUOrdre de pilotes évite des conflitsTous à jour, Device Manager propre
DISM/SFC après chaque lotDétecter des corruptions précoces« Aucune violation d’intégrité »
Minidumps & pagefile systèmeDiagnostics exploitables en cas de BSODC:\Windows\Minidump alimenté
XMP/DOCP désactivé 48–72 hIsoler le facteur mémoireActiver ensuite prudemment

Commandes et réglages à garder sous le coude

:: Intégrité du composant et des fichiers
dism /online /cleanup-image /restorehealth
sfc /scannow

:: Driver Verifier (activer puis désactiver)
verifier /standard /all
verifier /reset

:: Désactiver l’hibernation (si instable)
powercfg /h off 

Bonnes pratiques complémentaires

  • Réserver ~1 % d’espace libre sur le SSD système afin de garantir l’écriture des dumps.
  • Activer Windows Memory Integrity (HVCI) uniquement après plusieurs jours sans incident.
  • Mettre à jour le firmware du SSD via l’outil constructeur (ex. utilitaire de gestion), certaines révisions corrigent des freezes rares.
  • Sur plates‑formes Z790, privilégier des BIOS publiés à partir de fin 2023 (améliorations DDR5 6000+). En cas de restauration XMP, viser ces versions ou plus récentes.

Résumé actionnable

  1. Repartir d’une installation propre (suppression des partitions système, autres disques débranchés).
  2. BIOS à jour, valeurs par défaut, XMP off initialement.
  3. Installer d’abord chipset, MEI, réseau, puis GPU.
  4. Après chaque lot, exécuter DISM puis SFC. Surveiller l’Observateur d’événements.
  5. Si récidive : tester barrettes une à une, stress CPU/GPU séparément, vérifier la ligne +12 V, et déclencher un RMA pour tout composant fautif.

Pourquoi cette approche fonctionne

Une pile Windows moderne est un empilement de couches (matériel → firmware → pilotes → services noyau → applications). Les symptômes polymorphes (codes d’arrêt multiples, occurrence aléatoire) signalent souvent un état mixte : fichiers système corrompus, pilote intermédiaire resté d’une version antérieure, et/ou marge d’instabilité mémoire à la limite du contrôleur. En réinitialisant la base logicielle (installation propre) et en réduisant la complexité (XMP désactivé, pilotes dans l’ordre), on isole les variables. On peut ensuite réintroduire des optimisations (XMP/DOCP) tout en s’appuyant sur des tests ciblés et des journaux exploitables. Cette stratégie a permis, dans le cas étudié, de sortir durablement du cycle de BSOD.


État final et suivi

Après ré‑installation propre et correction SFC, aucun nouveau BSOD n’a été rencontré sur plus de 15 heures d’usage intensif. Poursuivre l’observation 7–10 jours avant de considérer le souci clos. Si des symptômes réapparaissent durant cette période, reprendre l’arbre de décision ci‑dessus en notant chaque changement effectué.

FAQ express

Q : Un « Reset cloud » suffit‑il ?
R : Non toujours. Cette procédure conserve parfois des pilotes ou filtres résiduels. La suppression manuelle des partitions lors d’une installation propre élimine ce bruit de fond.

Q : Dois‑je forcer des tensions IMC/SA ?
R : Évitez. Laissez l’UEFI en Auto tant que possible. Si l’XMP à 6000 MT/s n’est pas stable, abaissez la fréquence (5600 MT/s) plutôt que de pousser des tensions risquées.

Q : Les dumps sont vides/corrompus ?
R : Vérifiez le fichier de pagination et l’espace disque. Optez pour « Image mémoire automatique ». Sans dump, désactiver temporairement le redémarrage automatique peut aider à capturer le code.


En appliquant cette feuille de route, vous maximisez vos chances d’éliminer des BSOD Windows 11 hétérogènes sur une machine performante (Z790, i9‑13900KF, DDR5, RTX 4090), sans tomber dans une chasse aux sorcières infinie.

Sommaire