Partager via


Suivi de l'état de la mémoire persistante

Cet article fournit des informations sur la gestion des erreurs et la gestion de l’intégrité propres aux appareils de mémoire persistante (PMem), souvent appelées mémoire de classe de stockage (SCM), constituant un type de média non volatile qui peut être utilisé comme stockage de niveau supérieur.

Ces courtes vidéos fournissent une vue d’ensemble de la prise en charge de la mémoire persistante par Windows :

Voir aussi Comprendre et déployer la mémoire persistante.

Les périphériques de mémoire persistante sont pris en charge avec les pilotes natifs à partir de Windows Server 2016 et Windows 10 (version 1607). Bien que les périphériques de mémoire persistante se comportent comme d’autres disques (disques durs et SSD), ils possèdent quelques particularités.

Dans un cas d’usage courant, deux modules de mémoire persistante sont utilisés en tant que cache en écriture différée en miroir dans un espace de stockage. Pour définir une telle configuration, consultez Configuration des espaces de stockage avec un cache en écriture différée NVDIMM-N.

Dans Windows Server 2016, l’interface graphique utilisateur des espaces de stockage affiche le type de bus NVDIMM-N comme étant INCONNU. Il n’y a aucune perte de fonctionnalité ni aucune incapacité à créer un pool, un disque virtuel de stockage. Vous pouvez vérifier le type de bus en exécutant l’applet de commande suivante :

Get-PhysicalDisk | fl

Le paramètre BusType dans la sortie affiche correctement le type de bus en tant que SCM.

Afficher l’état d’intégrité de la mémoire persistante

Cette section décrit comment afficher l’état d’intégrité de vos modules de mémoire persistante. Lorsque vous utilisez la mémoire persistante, l’expérience de surveillance comporte quelques différences :

  • La mémoire persistante ne crée pas de compteurs de performances de disque physique. Vous ne la verrez donc pas sur les graphiques dans Windows Admin Center.
  • La mémoire persistante ne crée pas de données Storport 505, ce qui empêche la détection proactive des valeurs hors norme.

Dans le cas contraire, l’expérience de surveillance est la même que pour n’importe quel autre disque physique.

Vous pouvez interroger l’intégrité d’un disque de mémoire persistante en exécutant les applets de commande suivantes :

Get-PmemDisk

DiskNumber Size   HealthStatus AtomicityType CanBeRemoved PhysicalDeviceIds UnsafeShutdownCount
---------- ----   ------------ ------------- ------------ ----------------- -------------------
2          252 GB Unhealthy    None          True         {20, 120}         2
3          252 GB Healthy      None          True         {1020, 1120}      0

Get-PmemDisk | Get-PhysicalDisk | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

SerialNumber               HealthStatus OperationalStatus  OperationalDetails
------------               ------------ ------------------ ------------------
802c-01-1602-117cb5fc      Healthy      OK
802c-01-1602-117cb64f      Warning      Predictive Failure {Threshold Exceeded,NVDIMM_N Error}

Notez que vous pouvez récupérer les mêmes informations à l’aide de l’applet de commande Get-PhysicalDisk et en spécifiant le BusType en tant que SCM :

Get-PhysicalDisk | where BusType -eq "SCM" | select SerialNumber, HealthStatus, OperationalStatus, OperationalDetails

Note

Pour rechercher l’emplacement physique d’un périphérique de mémoire persistante spécifié dans un événement, sous l’onglet Détails de l’événement dans l’Observateur d’événements, accédez à l’emplacement EventData>. Notez que Windows Server 2016 répertorie l’emplacement incorrect des périphériques de mémoire persistante, mais ce problème est résolu dans la version 1709 de Windows Server.

HealthStatus indique si le disque de mémoire persistante est sain.

La valeur UnsafeshutdownCount suit le nombre d’arrêts susceptibles d’entraîner une perte de données sur ce disque logique. Il s’agit de la somme des nombres d’arrêt non sécurisés de tous les périphériques de mémoire persistante sous-jacents de ce disque. Pour plus d’informations sur l’état d’intégrité, utilisez le cmdlet Get-PmemPhysicalDevice pour rechercher des informations telles que OperationalStatus.

Get-PmemPhysicalDevice

DeviceId DeviceType           HealthStatus OperationalStatus PhysicalLocation FirmwareRevision Persistent memory size Volatile memory size
-------- ----------           ------------ ----------------- ---------------- ---------------- ---------------------- --------------------
1020     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_C1     102005310        126 GB                 0 GB
1120     Intel INVDIMM device Healthy      {Ok}              CPU2_DIMM_F1     102005310        126 GB                 0 GB
120      Intel INVDIMM device Healthy      {Ok}              CPU1_DIMM_F1     102005310        126 GB                 0 GB
20       Intel INVDIMM device Unhealthy    {HardwareError}   CPU1_DIMM_C1     102005310        126 GB                 0 GB

Cette applet de commande indique quel périphérique de mémoire persistante est défectueux. L’appareil non sain (DeviceId 20) correspond au cas dans l’exemple précédent. PhysicalLocation dans le BIOS peut aider à identifier l’appareil de mémoire persistante dans un état défectueux.

Pour comprendre les différentes conditions d’intégrité, consultez les sections suivantes.

État d’intégrité « Avertissement »

Cette condition est présente lorsque vous vérifiez l’intégrité d’un appareil de mémoire persistante et que son état d’intégrité est répertorié en tant qu’avertissement, comme indiqué dans cet exemple de sortie :

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Warning Échec prédictif {Seuil dépassé,erreur NVDIMM_N}

Le tableau suivant répertorie des informations sur cette condition.

Heading Description
État probable Seuil d’avertissement dépassé
Cause racine Les périphériques de mémoire persistante suivent divers seuils, comme la température, la durée de vie NVM et/ou la durée de vie de la source d’énergie. Quand l’un de ces seuils est dépassé, le système d’exploitation est notifié.
Comportement général Le dispositif reste totalement opérationnel. Il s’agit d’un avertissement, pas d’une erreur.
Comportement des espaces de stockage Le dispositif reste totalement opérationnel. Il s’agit d’un avertissement, pas d’une erreur.
Plus d’informations Champ OperationalStatus de l’objet PhysicalDisk. Journal des événements – Microsoft-Windows-ScmDisk0101/Operational
Procédure à suivre En fonction du seuil d’avertissement, il peut être prudent de remplacer le périphérique de mémoire persistante.

Échec de l’écriture sur un périphérique de mémoire persistante

Cette condition est présente lorsque vous vérifiez le statut de santé d’un appareil de mémoire persistante et que l’état de santé est répertorié comme Insalubre et que le statut opérationnel mentionne une Erreur E/S, comme illustré dans cet exemple de sortie :

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
802c-01-1602-117cb64f Unhealthy {Métadonnées obsolètes, Erreur d’E/S, Erreur temporaire} {Persistance de données perdue, Données perdues, NV...}

Le tableau suivant répertorie des informations sur cette condition.

Heading Description
État probable Perte de persistance/alimentation de secours
Cause racine Les appareils de mémoire persistante s’appuient sur une source d’alimentation de secours pour leur persistance, souvent une batterie ou un supercondensateur. Si cette source d’alimentation de secours n’est pas disponible ou si le dispositif ne parvient pas à effectuer une sauvegarde pour une raison quelconque (erreur de contrôleur/Flash), les données sont exposées à un risque et Windows empêche toute nouvelle écriture sur le dispositif concerné. Les lectures sont toujours possibles pour évacuer des données.
Comportement général Le volume NTFS est démonté.
Le champ de l’état d’intégrité de PhysicalDisk indique « Défectueux » pour tous les dispositifs NVDIMM-N concernés.
Comportement des espaces de stockage L’espace de stockage reste opérationnel tant qu’un seul module de mémoire persistante est concerné. Si plusieurs dispositifs sont concernés, les écritures dans l’espace de stockage échouent.
Le champ de l’état d’intégrité de PhysicalDisk indique « Défectueux » pour tous les appareils de mémoire persistante concernés.
Plus d’informations Champ OperationalStatus de l’objet PhysicalDisk.
Journal des événements – Microsoft-Windows-ScmDisk0101/Operational
Procédure à suivre Nous vous recommandons de sauvegarder les données PMem concernées. Pour obtenir un accès en lecture, vous pouvez manuellement mettre le disque en ligne (il apparaît en tant que volume NTFS en lecture seule).

Pour effacer entièrement cette condition, la cause première doit être résolue (réparez le bloc d’alimentation ou remplacez le module de mémoire persistante, en fonction du problème) et le volume situé sur le module doit être mis hors connexion, puis remis en ligne, ou le système doit être redémarré.

Pour rendre le périphérique de mémoire persistante à nouveau utilisable dans les espaces de stockage, utilisez l’applet de commande Reset-PhysicalDisk qui réintègre le dispositif et démarre le processus de réparation.

Le périphérique apparaît avec une capacité de 0 octet ou en tant que « Disque physique générique »

Cette condition est présente lorsqu’un périphérique de mémoire persistante est affiché avec une capacité de 0 octets et ne peut pas être initialisé, ou est exposé en tant qu’objet « Disque physique générique » sans numéro de série qui affiche un état opérationnel de la communication perdue, comme illustré dans cet exemple de sortie :

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK
Warning Communication perdue

Le tableau suivant répertorie des informations sur cette condition.

Heading Description
État probable Le BIOS n’a pas exposé le module de mémoire persistante au système d’exploitation
Cause racine Les périphériques de mémoire persistante sont basés sur la DRAM. Quand une adresse DRAM endommagée est référencée, la plupart des processeurs lancent une vérification d’ordinateur et redémarrent le serveur. Certaines plateformes de serveur démappe le périphérique de mémoire persistante, ce qui empêche le système d’exploitation d’y accéder et d’entraîner éventuellement une autre vérification d’ordinateur. Cela peut également se produire si le BIOS détecte que le module de mémoire persistante a échoué et doit être remplacé.
Comportement général Le module de mémoire persistante est affiché comme non initialisé, avec une capacité de 0 octet, sans possibilité de lecture ou d’écriture.
Comportement des espaces de stockage L’espace de stockage reste opérationnel (à condition qu’un seul module de mémoire persistante soit affecté).
L’objet PMem PhysicalDisk est affiché avec l’état d’intégrité Avertissement et comme « Disque physique général »
Plus d’informations Champ OperationalStatus de l’objet PhysicalDisk.
Journal des événements – Microsoft-Windows-ScmDisk0101/Operational
Procédure à suivre Le périphérique de mémoire persistante doit être remplacé ou assaini de sorte que la plateforme serveur l’expose au système d’exploitation hôte. Le remplacement du périphérique est recommandé, car d’autres erreurs irrécupérables risquent de se produire. L’applet de commande Add-PhysicalDisk permet d’ajouter un appareil de remplacement à une configuration d’espaces de stockage.

Le périphérique apparaît en tant que RAW ou en tant que disque vide après un redémarrage

Cette condition est présente lorsque vous vérifiez l'intégrité d'un dispositif de mémoire persistante et que vous voyez un état d'intégrité non sain et un état opérationnel des métadonnées non reconnues, comme montré dans cet exemple de sortie :

SerialNumber HealthStatus OperationalStatus OperationalDetails
802c-01-1602-117cb5fc Healthy OK {Unknown}
802c-01-1602-117cb64f Unhealthy {Métadonnées non reconnues, Métadonnées obsolètes} {Unknown}

Le tableau suivant répertorie des informations sur cette condition.

Heading Description
État probable Échec de sauvegarde/restauration
Origine En cas de défaillance de la procédure de sauvegarde ou de restauration, vous risquez de perdre toutes les données du module de mémoire persistante. Lorsque le système d'exploitation se charge, il apparaît en tant que tout nouveau périphérique de mémoire persistante sans partition ni système de fichiers et comporte le libellé RAW, ce qui signifie qu'il n'a pas de système de fichiers.
Comportement général La mémoire persistante est en mode de lecture seule. Une action explicite de l’utilisateur est nécessaire pour commencer à l’utiliser à nouveau.
Comportement des espaces de stockage Les espaces de stockage restent opérationnels si un seul périphérique de mémoire persistante est concerné.
L’objet du disque physique PMem apparaît avec l’état d’intégrité « Défectueux » et n’est pas utilisé par les espaces de stockage.
Plus d’informations Champ OperationalStatus de l’objet PhysicalDisk.
Journal des événements – Microsoft-Windows-ScmDisk0101/Operational
Procédure à suivre Si l’utilisateur ne veut pas remplacer le dispositif concerné, il peut utiliser l’applet de commande Reset-PhysicalDisk pour supprimer la condition de lecture seule sur le périphérique de mémoire persistante concerné. Dans les environnements d’espaces de stockage, celle-ci peut aussi essayer de réintégrer le périphérique de mémoire persistante dans l’espace de stockage et démarrer le processus de réparation.

Étapes suivantes

Pour plus d’informations, consultez également :