ハードディスクの故障率

2007年6月18日 (月)

ITproサイトでハードディスク・ドライブの故障率に関する事実という記事を読んだ。これは
Disk failures in the real world: What does an MTTF of 1,000,000 hours mean to you?という論文の解説記事である。結論は3つある。
1.HDDの故障率は「メモリーと同じく高い」
HDDは故障の多いコンポーネントだが、その故障率はメモリーと同等とか。高速で回転する機械のHDDと動く部分のないメモリーの故障率が同等、というのは意外だった。なおCPUはHDDより250%故障率が低く、マザーボードはHDDより50%故障率が低かったそうだ。

私はいままで10数台のPCを使用してきたが、HDDの故障は3~4台、マザーボードの故障は2枚、CPUは故障無し(CPUファンは故障1回有り)だった。そしてメモリーの故障は無し。私の体験と上記論文の結果はかなり異なる。上記論文は、ハイ・パフォーマンス・コンピューティング(HPC)クラスタを運用する組織などからのデータらしい。ということは最高級のサーバ環境のデータ。片や私は安物PCまたは自作PCなので、比較の土俵が違うかもしれない。是非安物PCでの調査が読みたいものだ。

2.HDDの年間交換率は3%,SATA,SCSI,FCで違いなし
交換率3%は、HDDメーカの故障率数値より3倍強の数値らしい。これは私の体験よりも多い。また、故障率がSATA,SCSIで違いのないことは驚きだった。値段の高いSCSIのほうが「しっかり作って有るはずなので故障は少ないはず」と私は思い込んでいたからである。

私の現在のサーバはSCSIだが、次はボード・ディスクとも価格の安いSATAにしよう。

3.ハードディスクは次々壊れる?
記事によれば

ハードドライブが故障しても,RAIDが機能していればデータは保護される,と考えているからだ。

 これは「1台目のハードディスクが故障しても,2台目のハードディスクはすぐに故障しない」ことを前提としている。しかし,この前提は正しいとは言えないようだ。

とのこと。RAIDにしておけば安心、ではないようだ。RAID神話に一石を投ずる記事ではあるが、ではどうするか。結局、より冗長度を高めたRAIDかクラスタ構成にするか、しか方法は無いように思う。それから、問題が発生したときにいかに早く当該装置を物理的・ソフト的に切り離すか、がポイントになりそうな気がする。

この記事のトラックバックURL:
http://www.momologue.net/archives/22/trackback/

コメント投稿

(承認制となっております。)


(必須)


(必須ですが表示されません)



コメント・トラックバック一覧(0)

この記事にはまだコメントがついていません。

 

QLOOK ANALYTICS