AMD RX 580 : résoudre les gels et redémarrages WATCHDOG sous Windows (LiveKernelReports)

Votre PC équipé d’une AMD RX 580 gèle en plein jeu, écran noir à la remise sous tension du moniteur et dumps LiveKernelReports‑WATCHDOG dans Windows ? Voici un guide pas‑à‑pas, concret et éprouvé, pour éliminer ces gels/redémarrages et retrouver une machine stable.

Sommaire

Vue d’ensemble de la question

  • Depuis deux jours, la machine se fige en plein jeu : l’image se bloque, le son continue, puis un bruit « USB déconnecté » retentit.
  • Le clavier réagit (Num Lock), mais aucun Alt + Tab/Alt + F4 n’est possible ; l’écran reste noir après extinction/rallumage du moniteur.
  • Après certains redémarrages forcés, le pilote Radeon signale une incompatibilité et le Gestionnaire de périphériques indique néanmoins que la carte fonctionne.
  • Les journaux montrent des dumps LiveKernelReports‑WATCHDOG à l’heure exacte du plantage, et des erreurs Kernel 411 en dehors de ces créneaux.
  • Configuration : Ryzen 5 2600, Radeon RX 580, 16 Go RAM 3000 MHz, SSD 1,5 To, alimentation 600 W, BIOS carte‑mère récemment mis à jour.

Ce qui se passe techniquement lors d’un « WATCHDOG »

Windows surveille le GPU via un mécanisme nommé TDR (Timeout Detection and Recovery). Si le pilote graphique ou le GPU ne répond plus dans le délai imparti, Windows déclenche une réinitialisation du pilote. Cette détection se matérialise par un dump dans C:\Windows\LiveKernelReports\WATCHDOG\ et, selon le cas, par un gel, un écran noir, un retour au bureau ou un redémarrage brutal. Le son « USB déconnecté » vient souvent de la réinitialisation du bus PCIe qui fait brièvement « disparaître » certains contrôleurs USB reliés au chipset.

À noter : les arrêts inopinés (power loss) se traduisent fréquemment par un événement Kernel‑Power (ID 41). Si vos journaux affichent « Kernel 411 », vérifiez l’ID exact dans le Observateur d’événements (fréquemment 41 pour ce type d’arrêt).

Réponse & pistes de résolution

ÉtapeAction recommandéePourquoi / points de vigilance
1Désinstaller complètement le pilote graphique actuel avec DDU (Display Driver Uninstaller) en mode sans échec.Les minidumps pointent le pilote AMD ; DDU supprime résidus et services qui résistent aux désinstallations classiques.
2Après redémarrage, installer une version légèrement plus ancienne du pilote Radeon disponible sur le site AMD (éviter la toute dernière WHQL ou beta).Certains lots récents provoquent des timeouts (TDR) ; une version antérieure, réputée stable, contourne souvent le WATCHDOG.
3Pendant la phase de test :
• Désactiver la surcadençage GPU/CPU.
• Surveiller température GPU (≤ 80 °C) avec Adrenalin, HW‑Monitor, etc.
La surchauffe ou un overclock instable déclenchent également des TDR.
4Vérifier l’alimentation :
• Câbles PCIe fermement branchés.
• Mesurer les tensions sous charge (si possible).
Un 12 V qui chute sous forte charge peut provoquer la « déconnexion » perçue (bruit USB).
5Contrôle de cohérence Windows :
sfc /scannow et DISM /Online /Cleanup-Image /RestoreHealth.
Écarte la corruption système signalée par l’incompatibilité du logiciel Radeon.
6BIOS & chipset : s’assurer que la mise à jour récente du BIOS n’a pas modifié des options PCIe (Gen 2/Gen 3, ASPM).Certaines cartes mères imposent par défaut un mode PCIe qui déstabilise les RX 580.
7Tests complémentaires (facultatif) :
• Stress GPU : OCCT / FurMark 10 min.
• Stress RAM : MemTest86 (1‑2 passes).
Permet de départager pilote vs. matériel défectueux (RAM/VRAM).

Mode opératoire détaillé

Nettoyage complet du pilote avec DDU

  1. Créer un point de restauration Windows.
  2. Déconnecter Internet (pour empêcher Windows Update d’imposer un pilote pendant l’opération).
  3. Démarrer en mode sans échec.
  4. Lancer DDU, choisir GPU > AMD puis l’option Nettoyer et redémarrer.
  5. Après retour sur le Bureau, vérifier dans Gestionnaire de périphériques > Cartes graphiques que la RX 580 est en « Carte vidéo de base Microsoft ».

Pourquoi c’est crucial : DDU retire les services, filtres et caches shader qui persistent sinon. Une désinstallation incomplète entretient les conflits entre versions.

Choisir un pilote Radeon stable

Réinstallez un pilote antérieur mais récent plutôt que la toute dernière mouture. Pour prioriser la stabilité :

  • Préférez une version WHQL datée de quelques semaines/mois plutôt qu’une version « Optional/Beta » très récente.
  • Si les plantages persistent, testez le pilote « Pro Edition » (axé stabilité) pour Polaris (RX 580).
  • Après installation, réinitialisez les paramètres Adrenalin (« Factory Reset » si proposé) pour éliminer un profil WattMan corrompu.

Message « Pilote incompatible » après redémarrage forcé ? Il survient quand Windows active un pilote générique suite à une reprise instable. DDU + réinstallation propre règle généralement ce point.

Contrôler températures, fréquences et power limit

  • Dans Adrenalin, désactiver tout overclock (GPU et VRAM). Revenez au mode par défaut.
  • Surveiller en jeu : Température GPU ≤ 80 °C, ventilateurs effectifs, GPU Hotspot raisonnable.
  • À titre de test, appliquez Power Limit -10 % ou une légère sous‑tension (undervolt) prudente : si la stabilité augmente, l’alimentation ou la dissipation sont des suspects crédibles.
  • Évitez de faire tourner simultanément plusieurs outils d’overlay/monitoring (Adrenalin, MSI Afterburner, RTSS, HWiNFO). Un seul outil à la fois réduit les conflits API.

Valider l’alimentation et le câblage PCIe

  • La RX 580 consomme beaucoup en charge. Assurez‑vous d’utiliser deux câbles PCIe séparés si votre PSU le permet, plutôt qu’un câble « en Y ».
  • Vérifiez l’enfichage au GPU et au PSU (clic net), absence d’oxydation sur les broches.
  • Si vous pouvez mesurer : sous charge (jeu/benchmark), surveillez le rail 12 V. Une chute marquée < 11,6 V peut provoquer des resets bus PCIe (bruit USB).
  • Essayez un autre circuit électrique ou une prise parasurtenseur de qualité pour exclure une alimentation secteur instable.

Intégrité Windows et composants système

Ouvrez une invite de commandes en tant qu’administrateur et lancez :

sfc /scannow
DISM /Online /Cleanup-Image /RestoreHealth
  • Redémarrez après SFC/DISM, puis retentez un jeu.
  • Dans Options d’alimentation > Paramètres d’alimentation supplémentaires, activez le plan Performances élevées (ou AMD Ryzen Balanced si présent).
  • Dans Options d’alimentation > Paramètres avancés, mettez PCI Express > Gestion de l’état du lien sur Arrêt.
  • Testez l’option Planification GPU à accélération matérielle (HAGS) dans Paramètres > Système > Affichage > Graphiques : un on/off peut faire la différence selon la pile pilote.
  • Désactivez temporairement Démarrage rapide (Windows 10/11) via Options d’alimentation > Choisir l’action des boutons d’alimentation.

Réglages BIOS et pilote chipset

  • Après une mise à jour de BIOS, certaines cartes mères repassent en PCIe Auto. Forcez le slot GPU en Gen 3 (ou Gen 2 pour test) si l’option existe.
  • Désactivez provisoirement ASPM (Active State Power Management) si disponible.
  • Mettez à jour (ou réinstallez) le pilote chipset AMD correspondant à votre plateforme. Un pilote chipset incohérent peut perturber la gestion PCIe/USB.
  • Conservez l’UEFI en mode par défaut, évitez les profils XMP/DOCP agressifs pendant le diagnostic (RAM à la fréquence JEDEC pour test).

Tests ciblés pour isoler la cause

  • Stress GPU : 10 minutes d’OCCT GPU (mode erreur VRAM) ou FurMark. Surveillez si un WATCHDOG survient rapidement.
  • Stress RAM : 1‑2 passes de MemTest86 (ou Windows Memory Diagnostic) pour exclure une instabilité mémoire.
  • Cache shader : dans Adrenalin, videz le cache shader pour éliminer des ressources corruptibles.
  • Conflits logiciels : désactivez overlays (Steam, Discord, Xbox Game Bar, Rivatuner), capture vidéo, anti‑cheat intrusifs, jusqu’à stabilisation.

Analyse des journaux et des dumps

Pour comprendre et documenter le problème :

  • Moniteur de fiabilité : Panneau de configuration > Sécurité et maintenance > Maintenance > Afficher l’historique de fiabilité. Repérez les « Défaillances matérielles » et la chronologie des événements.
  • Observateur d’événements : Journaux Windows > Système. Recherchez Display, amdkmdag, Kernel‑Power (ID 41) autour de l’heure du gel.
  • Dumps LiveKernelReports : C:\Windows\LiveKernelReports\WATCHDOG\*.dmp. Les signatures récurrentes pointant dxgkrnl.sys / amdkmdag.sys soutiennent la piste pilote/TDR.

Paramètres Windows & Radeon qui aident

  • Optimisations plein écran : cochez/décochez pour les jeux qui gèlent (clic droit sur l’EXE > Compatibilité).
  • Mode d’énergie Radeon : passez en Équilibré ou Économie le temps du test.
  • FreeSync : désactivez pour essai, surtout si l’écran perd le signal.
  • Profondeur de couleur / format pixel : repassez en paramètres par défaut (8 bits, RGB 4:4:4). Des réglages exotiques peuvent gêner certains écrans/firmwares.

Checklist express

ContrôleAttenduSi échec
Températures GPU en jeu≤ 80 °C (hotspot raisonnable)Nettoyer boîtier, ventilateurs, pâte thermique, réduire Power Limit
Alimentation PCIeDeux câbles, brochage fermeEssayer un autre câble/PSU, éviter adaptateurs douteux
Pile logicielleDDU > pilote WHQL antérieur stableTester pilote Pro Edition, vider cache shader
WindowsSFC/DISM OK, HAGS testé, Démarrage rapide offRéparer image, mettre à jour, reconfigurer énergie PCIe
BIOS/PCIeSlot forcé Gen 3, ASPM offRevenir à Gen 2 pour test, MAJ chipset

Plan de test en conditions réelles

  1. Jour 1 : DDU, pilote WHQL antérieur, aucun overclock, plan énergie élevé, monitoring unique. Jouer 30‑60 min au(x) jeu(x) déclencheur(s).
  2. Jour 2 : Si OK, réactiver au besoin FreeSync/overlays un par un (un changement par session) pour cerner un conflit. Si KO, passer au pilote Pro Edition ou Power Limit -10 %.
  3. Jour 3 : Forcer PCIe Gen 3, ASPM off dans le BIOS, répéter les tests. Si KO, Gen 2 pour essai.
  4. Jour 4 : Vérifier avec une autre alimentation/câble PCIe ou tester la carte dans une autre machine (ou une autre carte dans la vôtre) pour trancher matériel vs. logiciel.

Questions fréquentes

Le message « pilote Radeon incompatible » après un crash signifie‑t‑il que la carte est HS ?
Pas nécessairement. Il accompagne souvent une réinitialisation TDR ratée. Une réinstallation propre (DDU) corrige dans la majorité des cas.

Augmenter TdrDelay dans le Registre règle‑t‑il le problème ?
Évitez de masquer la cause. À la rigueur, pour diagnostiquer, augmentez temporairement TdrDelay (et TdrDdiDelay) de 2 à 8‑10 s, puis revenez aux valeurs par défaut une fois la cause trouvée.

Changer de port vidéo peut‑il aider ?
Oui : testez un autre câble/port (DisplayPort <> HDMI), désactivez la veille d’écran pendant vos essais.

Mes logs affichent « Kernel 411 »
Les arrêts brutaux sont généralement consignés en Kernel‑Power ID 41. Vérifiez l’ID de l’événement ; la numérotation « 411 » pourrait être une lecture différente ou un autre journal.

Le problème est‑il propre à un jeu ?
Si un seul titre provoque le gel, videz son cache shader, désactivez FSR/VSync/overlays, passez de Vulkan à DirectX 11/12 (ou inversement) pour test.

Procédure de restitution en cas d’échec complet

  1. DDU > pilote Pro Edition.
  2. BIOS : Gen 2 forcé, ASPM off.
  3. Power Limit -15 %, FreeSync off, HAGS off.
  4. PSU/câbles alternatifs.
  5. Test croisé (autre PC/une autre carte).

Si, après ces cinq actions, les WATCHDOG persistent de façon identique, la probabilité d’un défaut matériel (VRAM/VRM GPU ou carte mère) devient élevée.

Résumé actionnable

  • Faire une réinstallation propre du pilote AMD via DDU, puis installer un pilote WHQL antérieur (ou Pro Edition).
  • Neutraliser overclocks, limiter la puissance, surveiller ≤ 80 °C.
  • Vérifier PSU et câbles PCIe, privilégier deux câbles séparés.
  • Exécuter sfc/dism, désactiver HAGS/Démarrage rapide pour test, mettre PCIe Link State = Arrêt.
  • Forcer PCIe Gen 3 (ou Gen 2 à défaut), désactiver ASPM, réinstaller pilote chipset AMD.
  • Documenter avec Moniteur de fiabilité et Observateur d’événements, puis ajuster en fonction des résultats.

Conclusion

Les gels et redémarrages liés à LiveKernelReports‑WATCHDOG sur une AMD RX 580 proviennent majoritairement d’une combinaison pilote + paramètres (pile graphique, énergie, PCIe). L’approche gagnante consiste à repartir d’un environnement propre (DDU), adopter un pilote stabilisé (ou Pro), éliminer les surcharges (overclocks/overlays), verrouiller la chaîne alimentation → PCIe, puis valider par étapes. Dans cette configuration, la grande majorité des cas se résolvent sans remplacement matériel. Si, malgré tout, le problème persiste, le test croisé reste l’outil le plus rapide pour conclure à un défaut matériel (GPU/PSU/carte mère).

Astuce pratique : conservez un point de restauration avant chaque changement (pilote, BIOS, chipset). Vous pourrez revenir en arrière instantanément si un lot instable réapparaît.

Sommaire