smartd
最終更新日時:2010-03-19 15:31:35
その他UNIX系
その他UNIX系
概要
smartdはHDD回りの監視、チェックを行うデーモンです。
個人的にはあまり使っていませんが。。。。
使用例
smartd を常駐していると、以下のようなエラーが /var/log/messages に出力されることがあります。
Device: /dev/hdb, 9 Offline uncorrectable sectors Device: /dev/hdb, 12 Currently unreadable(pending) sectors
これは smartd によるアラートなので、問題となっているデバイス /dev/hdb に対して簡易チェックを実行してみます。
# smartctl -H /dev/hdb
すると、以下のようなエラーが出ました。
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 200 Multi_Zone_Error_Rate 0x0009 198 028 051 Pre-fail Offline In_the_past 9
上記のID=200 Multi_Zone_Error_Rate の意味は以下あたりを参照してください。
http://smart.jinaka.com/information_list.html
http://en.wikipedia.org/wiki/S.M.A.R.T.
さらに、詳細チェックを実行してみます。
# smartctl -t long /dev/hdb
すると、以下のようなエラーが出ました。
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed: read failure 90% 764 xxxxxxxx
xxxxxxxxのセクタが壊れているということになります。
この修復方法ですが、とりあえず smartd レベルであれば、dd 等で該当セクタに 0 を書いてしまえばエラーは無くなります。
# dd if=/dev/zero of=/dev/hdb seek=xxxxxxxx bs=512 count=1