Un guide de l’erreur correctable ECC de la mémoire et lorsqu’elle déclenche un événement
Étapes à suivre lorsque vous traitez de l’événement d’erreur correctable ECC enregistré dans le journal des événements système (SEL)
Les erreurs correctibles ECC représentent un dépassement de seuil pour un module de mémoire DIMM (Dual In-line Modules) donné dans un délai donné.
- s’il n’y a pas de problème catastrophique (Écran violet de la mort (PSOD) ou redémarrage inattendu), et l’erreur ECC correctable, y compris l’erreur ADDDC (Adaptive Double Device Data Correction), qui est inférieure à 10 événements toutes les 24 heures pour chaque emplacement DIMM est dans la limite du seuil, de sorte que la recommandation est de surveiller toute erreur ECC qui se produise à chaque emplacement DIMM qui déclenche l’événement.
- En cas de problème catastrophique (Écran violet de la mort ou redémarrage inattendu) et si l’erreur ECC correctable, y compris l’erreur ADDDC (Adaptive Double Device Data Correction), qui correspond à plus de 10 événements toutes les 24 heures pour chaque emplacement DIMM, il est recommandé de réinsérez chaque emplacement DIMM en suivant les étapes ci-dessous :
- Mettez le système hors tension et retirez le câble d’alimentation secteur
- Identifiez l’emplacement DIMM à réinsérez, reportez-vous aux spécifications techniques de votre plate-forme de serveur pour identifier l’emplacement DES DIMM
- Réinsérez les barrettes DIMM identifiées
- Insérer Câble d’alimentation secteur secteur et alimentation sur le système
- Observez pendant 24 heures toute anomalie de l’erreur ECC
- Si l’erreur ECC persiste au même emplacement DIMM qui a été réinséqué, génèrez et envoyez les journaux SEL et Débogage, tous deux générés à partir de la console Web BMC, à l’assistance à la clientèle Intel
Notes |
Les erreurs du code de correction d’erreur (ECC) sont auto-correcteurs. Selon la configuration RAS (Reliability Availability Serviceability) de la mémoire, le contrôleur mémoire intégré (IMC) peut déconnecter le module DIMM affecté. |
Pour différentes plateformes serveur Intel, il y a des différences dans leur définition d’événement, reportez-vous au Guide de dépannage du journal des événements système pour votre plate-forme serveur | |
Intel recommande de télécharger et de mettre à jour le BIOS système avec la dernière version disponible pour votre plateforme serveur. | |
Si le système est un système Intel® datacenter certifié pour la plateforme Nutanix* Enterprise Cloud, visitez la page Gestionnaire du cycle de vie Nutanix*. Pour obtenir une liste de compatibilité du matériel et des microprogrammes, consultez la page de compatibilité du matériel et du microprogramme Nutanix*. |