Suzulan > コンピュータ >
          トラブル記録
   
  【 発生:2009/3/29  装置:I/Oデータ LANDISK Tera HDL-GT 1.0  事象:システム起動停止 】  
     
  RAID崩壊?
いつものようにLANDISK Tera HDL-GT 1.0(写真:以下HDL-GTと記述) の電源を投入して立ち上がりを待っていました。このハードディスクはLAN接続用です。250GB x 4台のディスクカートリッジを500GB X 2台としてボリュームを組みRAID1(ミラーリング)動作をしています。更に書き込み高速化のためRAID0(ストライピング)動作もさせています。つまりRAID1+0(ミラーストライピング)方式で使用しています。立ち上がり完了時には"ピー"とブザーが一回鳴り通知してくれます。が、今回は”ピーピーピーピー”と連続した警報音が鳴りっぱなしになりました。ギョっとしてHDL-GTをみると、4台全てのディスクカートリッジのアクセスランプが赤点灯しSTATUSランプも赤点滅しています。ガ〜ン!通常、アクセスランプは青点灯でSTATUSランプは緑点灯のはずです。とりあえずCOPYボタンを押してブザーを停止させ、さてどうするか? このままではいつまでたっても立ち上がらないないので一旦シャットダウンし電源ONで再立ち上げを試みました。結果は非情にも同じ状態で立ち上げ不能です。一瞬RAID崩壊を疑いました。もしRAID崩壊なら、RAID構成から初期設定しなけらばならず、保存データは全て失われます。データは月1回、別のハードディスクに全域バックアップをしてありましたので、全てを失う状況ではありませんでしたが、バックアップ時点から今日までの差分データは失われます。待て待て!本当にRAID崩壊なのかよ? ここはあわてずマニュアルをジックリ見ることにします。その結果、RAID崩壊時は4台全てのディスクカートリッジアクセスランプが赤点灯、STATUSランプも赤点滅し今回の事象とまったく同じですが、ブザー音が”ピーピーピー”ではなく”ピーポーピーポーピーポー”になることがわかりました。また、今回の事象は何らかの原因で
システムが起動停止状態になっていることもわかりました。もしかして保存データは助かるかも・・・。オー神さま〜。
 
     
  起動停止状態の確認
マニュアルにしたがって具体的なシステム起動停止状態を確認します。このような状態のHDL-GTは固定IPアドレスの設定であれ、DHCPによるIPアドレス設定であれ、強制的に”192.168.0.200”を自身に設定し起動停止しています。つまりこのIPアドレスにパソコンからアクセスしてもらうことを期待し助けを求めている状態なのです。じゃ〜助けにいかなくちゃ〜。HDL-GTにアクセスするためパソコンのIPアドレスを”192.168.0.xxx”(xxxは200を除く 1〜254のいずれかの値)、サブネットマスクを”255.255.255.0”に設定します。ルータを無視して直接HDL-GTにアクセスを試むわけです。Webブラウザを起動しURL欄に”http://192.168.0.200/”と入力、Enterキーを押します。結果、HDL-GTから
”ハードディスク内のシステムの内容が一致していません”のメッセージと、各ディスクカートリッジの”最終更新時刻”が情報として返ってきました。最終更新時刻を見ると本来4台のディスクカートリッジは全て同時刻でなければならないのに、上部2台の時刻と下部2台の時刻が異なっていました。HDL-GTのシステムは、時刻のアンマッチによりどの時刻のディスクを立ち上げればよいのかわからず起動停止状態に陥っていたのです。なぜ時刻のアンマッチが起こってしまったのかは不明ですが・・・。(^^;
 
     
  修復
一旦HDL-GTをシャットダウンし、最終更新時刻が異なっていた下部2台のディスクカートリッジのスライドスイッチをアンロックして引き出し、システムから切り離します。続いて、電源ONで上部2台のディスクカートリッジによる立ち上げをします。アクセスランプ(青色)が点滅を始め、待つこと数分、システムの立ち上げに成功しました(写真)。このことはHDL-GTがルータに認識され、通常アクセスが可能になったことを意味します。パソコンを元のIPアドレスに戻し、
とりあえずHDL-GTの保存データを別ハードディスクにバックアップします。バックアップにより、以後の修復過程においてHDL-GTが最悪の状態に陥ってもバックアップファイルから保存データの救済ができるようになるからです。シャットダウンはせず、この状態で作業を続行します。切り離していた下部2台のディスクカートリッジを押し込みシステムに接続します。スライドスイッチをLOCK側に固定すると、全ディスクカートリッジのアクセスランプが点滅を始め自動的にシステムの再構築が始まります。構築は約30分ほどで完了しました。HDL-GTに添付されているディスク保守用ツール(Magical Finder)でボリューム状態を調べたところ全てのディスクカートリッジが正常状態になっていることが確認できました。また保存データも確認しましたが、こちらも正常で失われたデータはありませんでした。ここでHDL-GTをシャットダウンし、通常立ち上げ試験をします。結果、RAID1+0モードで正常に立ち上がり元どおりに修復されたことが確認されました。幸いにもバックアップしたファイルを使用するような事態には陥りませんでした。ヤレヤレです。

RAIDについて
RAID方式によるハードディスクは、一般のハードディスクでは起こり得ないこの種のドッキリ故障が発生することがあります。原因は今回のような”最終更新時刻のアンマッチ”だけではありません。ディスクカートリッジ自体は正常にもかかわらず、RAIDシステムであるがゆえに他にもいろいろな事象(マニュアルに詳述されています。)が起こり得ます。最も悲惨なのがRAID崩壊を起こし保存データを失うことです。幸い今回はRAID崩壊ではなかったものの、ミラーリングしているから大丈夫とはいかないのです。まあ、とにかくこのような事象に遭遇したときは安易にRAIDの初期構築などは行わず、マニュアルをジックリ眺めて保存データの救済ができる故障なのか否かを見極めることが重要です。また天を仰ぐことのないよう最悪の事態を想定し、保存データは別のハードディスクやメディアへこまめにバックアップしておくことも大切なことですね。