そう、先週から制作室内のサーバが3台クラッシュした。クラッシュという表現は正確ではないが、異なるハードウェアで同じ場所に設置したサーバ3台が3台ともハードディスクが飛んでしまうという不可解な状況が発生したのだ。
OSのバージョンもハードも異なるにもかかわらず、同じ場所に設置したサーバが3台クラッシュ。若干、オカルトじみているが、原因は意外と単純なものだと推測される。
1.電源周り
2.電波周り
3.その他
まー、1.が主原因だろうな、同じ電源ケーブル・電源タップを使ってるから、、、。実は4台目も微妙にクラッシュしかけて、ほぼ確実に電源周りが原因と推測。電源ケーブルでの障害ってのは経験がないのですが、まー、とりあえず替えてみて様子を見るよそうするよ。電源タップについてもハブみたいにポート単位で壊れるって可能性も完全否定は出来ないなぁ。とにかく、色々様子を見るですよ、ええ。
えすえすけー
ハードエンジニアからすれば
電源系のトラブルってあって当たり前で
それを見越した設計するもんですけどね。
ええ。
あとは温度も結構ありまっせ。
室温=動作保証温度範囲とはいえ、
排気(換気)がうまくいっていないと
内部温度が高くなっちゃって壊れやすい。
とかなんとか。
ymkx
サーバの電源ユニットはよくある障害なんだけど、電源ケーブルとか電源系の低いレイヤーは想定外でした。んー、今までに経験のない系統でしたな。でも、確かに十分あり得る話しなんだよなぁ。
飛び方からして、OSが直接的なエラーではなくて結果的なエラーしか記録できてないパターンが多々。kernelがpanicとか、、、。ああ、めんどい、、、。ネットワークエンジニア・サーバエンジニアって、ある意味かなり探偵チックな能力が必要になるなぁ。ハード寄りのエンジニアだったら、分解できる限り分解して(ユニット的意味)調査するんだろうけど、、、。