smartd

最終更新日時:2010-03-19 15:31:35
その他UNIX系

概要


smartdはHDD回りの監視、チェックを行うデーモンです。
個人的にはあまり使っていませんが。。。。

使用例


smartd を常駐していると、以下のようなエラーが /var/log/messages に出力されることがあります。

 Device: /dev/hdb, 9 Offline uncorrectable sectors
 Device: /dev/hdb, 12  Currently unreadable(pending) sectors


これは smartd によるアラートなので、問題となっているデバイス /dev/hdb に対して簡易チェックを実行してみます。

 # smartctl -H /dev/hdb


すると、以下のようなエラーが出ました。

 ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
 200 Multi_Zone_Error_Rate   0x0009   198   028   051    Pre-fail  Offline  In_the_past 9


上記のID=200 Multi_Zone_Error_Rate の意味は以下あたりを参照してください。

http://smart.jinaka.com/information_list.html
http://en.wikipedia.org/wiki/S.M.A.R.T.

さらに、詳細チェックを実行してみます。

 # smartctl -t long /dev/hdb


すると、以下のようなエラーが出ました。

 Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
 # 1  Extended offline    Completed: read failure       90%       764         xxxxxxxx


xxxxxxxxのセクタが壊れているということになります。
この修復方法ですが、とりあえず smartd レベルであれば、dd 等で該当セクタに 0 を書いてしまえばエラーは無くなります。

 # dd if=/dev/zero of=/dev/hdb seek=xxxxxxxx bs=512 count=1


お問い合わせは 掲示板 にて。