ホーム > UNIX / Linux, 自作PC > サーバのHDDがヤバい

サーバのHDDがヤバい

2009 年 11 月 19 日 コメントをどうぞ コメント

ウチのサーバで使っているHDDの一つがヤバいことに。
smartdから警告メールが来てました。

内容はこんな感じ

This email was generated by the smartd daemon running on:

host name: motami.net
DNS domain: net
NIS domain: (none)

The following warning/error was logged by the smartd daemon:

Device: /dev/sdb, FAILED SMART self-check. BACK UP DATA NOW!

For details see host’s SYSLOG (default: /var/log/messages).

You can also use the smartctl utility for further investigation.
No additional email messages about this problem will be sent.


SMART値を見てみると不良セクタが増えまくっている!
ちなみに、システムやユーザディレクトリ(メール等)は別のHDDなので、最悪これが壊れても全体が停止することはありません。
壊れた場合被害を受けるデータは、データベースの定期バックアップ、ユーザディレクトリの定期バックアップ、後はFTPの共有ディレクトリのデータです。
バックアップのデータは消えても実害はありませんが、共有のデータは今のところ退避先が無いので、新しいHDDに乗せかえる前に死んだ場合はなくなります・・・。

実際のSMART値は↓を。

HDD-SMART
●不良セクタ関連で注意すべき項目
・05 「Reallocated Sectors Count」 代替処置(データを特別に予約した予備エリアに移動する)を済まされた不良セクタ(読込み不能の領域)の数。
・C4 「Reallocation Event Count」  不良セクタから代替セクタへのチェック回数。
・C5 「Current Pending Sector Count」 現在異常があって代替処理を保留中のセクタの数。後で読み込みに成功したセクタがあれば、この値は減少する。
・C6 「Off-Line Scan Uncorrectable Sector Count」  オフラインスキャン時に訂正できなかった回復不可能セクタ数。
・C7 「CRC Error Count」 接続ケーブル不良・コネクタ異常。
(2ch自作板 WesternDigital製HDD友の会 Vol.88より引用)

[Reallocated_Sector_Ct]がやばいことになってます。いつファイルを読めなくなってもおかしくない状態かと。
そしてC5、C6も増えてます。これも調子がよければ数年使って0のままってのが大体普通です。

正常なHDDのSMART値(通電時間5000時間強)
HDD2-SMART
Windowsなので表示方法が若干違いますが、こちらは05、C4~C7すべて0です。

ちなみにこのHDD、友人が2台まとめて同じ店で買って、そのうちの1台を貰ったものなんですが、その友人のHDDも当初から不調で頻繁にPIO病になったりしていたようです。
ハズレロットだった可能性が高そうです・・・。
もう初期不良交換の期間過ぎてしまったし、修理に出すとなると1ヶ月くらいでしょうか・・・。
幸いGreenHouseの箱物だったので、代理店の3年保障+RMAが付いてました。(取り扱った代理店によって、保障内容が変わる。ちなみにCFD系の場合はRMAすら付いていない。詳しくはこのあたりを)

とりあえず近日中に新しいHDDを買って乗せ変えようと思いますが、
WDもSeagateも1.5TBのモデルは評判がよろしくない・・・。
HGSTは1.5TBの機種自体が無い・・・。
ここは思い切ってSAMSUNG??w

カテゴリー: UNIX / Linux, 自作PC タグ: