Outils personnels

SMART sur SATA

De wikiGite

Surveillance disque SATA

SMART, hddtemp

install smartmontools install sdparm hdparm hddtemp

sdparm : voir commande 'sync' pour flusher le cache après une sauvegarde ?

hddtemp permet de connaitre la temperature du disque.
hdparm -tT /dev/sda donne les taux de transfert

smartctl -a /dev/sda

Si la commande répond "Device does not support SMART", alors que
"hdparm -I /dev/sda" indique "SMART feature set", ou que
"smartctl -a /dev/sda -d ata" indique "SMART support is: Available - device has SMART capability",

essayer avec :

smartctl -a /dev/sda -d ata
smartctl -H /dev/sda -d ata

donne le "health" du disque

smartctl -l error /dev/sda -d ata

liste les erreurs

Eventuellement,

smartctl -s on -d ata /dev/sdb

active le SMART

smartctl -t short -d ata /dev/sdb

démarre un self test court (2min),

smartctl -t long -d ata /dev/sdb

pour un self test long (~50min). La commande est passée directement au disque et rend la main.

Résultat visible quand le test est fini par

smartctl -l selftest /dev/sda -d ata

script de surveillance

Sur plusieurs disques sda, sdb, et sdc par exemple :

#!/bin/bash
MAIL=admin@domain.com
if [ ! $(date +\%w) -eq 0 -a $(date +\%d) -le 07 ]
then
   for dsk in a b c
   do
      STATE=$(/usr/sbin/smartctl -a /dev/sd${dsk} | grep Health | awk 'BEGIN{FS=":"}{print $2}' | sed 's/ //g')
      if [ "$STATE" != "OK" ]
      then
         (/usr/sbin/smartctl -a /dev/sd${dsk})| mail -s "PROBLEME RAID sur $(hostname) $(date +%d/%m)" $MAIL
      fi
   done
fi