「バックアップ」タグアーカイブ

2012-08
27
03:26:21
NASをRAID5ではなくRAID10にしていて助かった話


NASをRAID5ではなくRAID10にしていて助かった話
NASをRAID5ではなくRAID10にしていて助かった話

まあインフラ周りの仕事をしていてよくご存じの方には今更の話なんですが、近年家庭用のNAS(外付けHDDでもですが)も安く出回って一般ユーザーにも広まっており、何かの参考になるかなあと思ったので書いておきますね。

以前まともにバックアップしていなくて開発したソフトのコードを全損しかけた(笑)経験から、家庭用外付けハードディスクを幾つか渡り歩いた後、メーカー限らずあまりによく壊れるので(理由は熱暴走とか突如のHDD破壊とか様々です)、試しにRAID対応のNASを買ってみました。結構前のことで、2009年春頃のことです。
買ったのはバッファローのLS-Q2.0LS/R5という機種で、これを選んだ理由はあまり覚えていないのですが、 「値段手頃」で「その前に壊れたのがIOデータ製だったから」とかそんな程度の理由だったと思います。

いわゆるPCの定期バックアップと言うよりは普段使わないデータの保存先が主な目的で、一時期MacのTime Machineバックアップにも使用していましたがその後純正Time Capsuleを買ったのでその目的では使わなくなりました。また開発コードやコンテンツなども最新版をコピーしていましたが、同時にsubversionも使用していますので、基本的にはこれまでのデータの退避先ですね。

という状態で3年ほど何事も無く過ぎていたのですが、基本的に先日家に帰るとNASが停止していて、すぐには気付いていなかったのですがアラートメールが届いていました。
非常に分かりにくいメールでしたが(なので一般ユーザーだと何が起こったのか、分からないんじゃないかなあ。。)、どうやらRAIDを構成するディスクにエラーが発生し縮退運転に入り、また縮退運転時には自動停止する設定にしていたのでNASがシャットダウンされていたようです。

RAIDで運用している訳ですからエラーの出ているHDDを普通に交換すればいいだけなんですが、アラートメールだけでは詳しい状況が分からなかったので試しに起動し直してみると、意外にも「壊れたHDDは2台」だったことが前面のアクセスランプから判明しました。ここで多少血の気が引いていくのを感じたのを覚えています(笑)

一般的にRAIDと言われるとよく知られているのはRAID5では無いでしょうか。こちらにRAIDの種類については詳しい説明がありますが、RAID5というのは「パリティと呼ばれる、他の残りデータと組み合わせると欠損データを回復できる仕組みを用いた冗長化」が主な特徴になっています。このパリティは常にHDD1台分のデータが必要とされるのでRAID5を構成している1台のHDDが故障してもこれを交換すれば自動的にデータ復旧が行われて回復可能です。
しかしHDD2台が同時に破損するとデータ復旧は不可能です。


http://www.data-sos.com/raid/raid09.html より引用

しかし僕はすっかり忘れていたのですが、RAID10で運用していたのでした。

RAID10は、RAID1 + RAID0が命名の語源で、まず構成されるHDDは二つのミラーセットに分けられます。書き込みデータはRAID0と同様にストライピング(ミラーリングの単位で分散配置される)とともにRAID1のようにミラーリングセット間でミラーリングされます。パリティは無いのでRAID5より信頼性は劣るとされますが、同じミラーリングセット内で無い限り、二台のHDDが故障してもデータは保証されます。


http://www.data-sos.com/raid/raid015.html より引用

僕の場合はまさしく、「たまたま」この故障した二台のHDDは二つ存在したミラーリングセットそれぞれの一台ずつで、幸いにもHDD2台を交換することで正常にリビルドが行われ、元に戻すことが出来ました。良かった良かった・・・

では果たして、RAID5よりもRAID10にしておくべきなのか?

これは先に示したサイトでも詳細に説明されていますが、そう単純なことではありません。ここに記載した事例は「幸い良い方向に倒れた一つの事例」に過ぎません。
RAIDなどのバックアップ方法は「求める目的」と「許容できる障害範囲」(と場合によっては「パフォーマンス」「容量」も)によって選ばれるべきです。でも、そこの見極めが難しいんですよねえ。
先に書いたとおりですが、企業内利用ならともかく、個人利用だと目的や要件が利用しているうちに変わってしまうことは多いでしょう。するとRAIDも含めてバックアップ方針はそれに応じて変更することを常に考えた方がいいでしょう。

一般的には、RAID対応のNASを買う以上はほとんどの場合そのバックアップ内容に「信頼性」を求める場合がほとんどかと思います。しかし例えばRAID5にしていても、常にディスク状態をチェックして交換用ディスクを準備してすぐに交換できなければ(RAID5では1台が故障中にもう1台故障すればデータは全損します)RAIDを組んでいた意味がありません。また昨年の計画停電時には停電でRAIDのコントローラーやHDDがダメージを受けた例が多発したそうです。そうした場合で無くとも、極端な場合落雷や過電流などでHDDが全損する可能性もゼロでは無いはずです。

実は僕の場合、何故HDDが同時に2台故障したのだろうかと疑問だったのですが、よくよく調べてみると、実は1年以上前に故障したHDDの1台からエラーが発生したというアラートメールが届いていたのを見過ごしていました。ただアクセスランプは正常だったので恐らく自動的にエラーセクターは修復されていたのでしょう。しかしそもそも調子は悪かったはずで今回エラーになった際に同時に巻き込まれた?などと推測しています。しかし最初のエラーの際にディスクチェックや交換などを行っていればもう少し状況は変わったかも知れません。しかし個人での運用なんて「その程度」のものなのですよね。

逆に言えばRAIDなどハードウェアに頼り切るよりも、実は運用こそが重要と言えるかも知れません。
今回の件からは、例えばRAID対応NASよりは、例えば安く買えるRAID対応していないNASを2台並べて、またはNASに外付けHDDを増設して定期的に一方向バックアップでも十分かなあと思い始めています。
メディアバックアップも意外に馬鹿にはできません。最近は4層120Gに対応した書き込み型Blu-rayディスク(BDXL)もありますので、本当に重要なデータなら選択的にこれらを活用してもいいでしょう。
またプライバシーや情報漏洩上は問題も指摘されますが、1TBなどの非常に大きなデータで無い限りは、クラウドのバックアップサービスを選択しても良いでしょう。これは例えば自宅が火事や災害によって被害を受けることを想定した場合には非常に有効です。
上記は「無くなっては困るがもう頻繁には更新されない重要なデータ」には有効な手段でしょう。

蛇足ですが

実は今僕が使っているLS-Q2.0LS/R5に限らず、バッファローのNAS/外付けHDD用の交換HDDって、とっても高いんですよ!
数が出る製品でも無いので、アマゾンでも1台=2万円ほどしており、つまり今回は2台で約4万円も交換にかかってしまいました。。。
そもそもここまでコストをかけてHDD交換するか、別のNASに買い換えるか悩んだんですが、別のNASにした場合データ移行時に現在のNASで仮にもう1台HDDが故障した場合はもう全損なので、安全を取ってHDD交換/リビルドを選択してしまいました。つまり体よく「メーカー・ロックオン」されてしまった訳ですね。一応「出荷時に専用検査とエイジングテスト実施」とは謳っているんですが、あまりに高いでは無いですか、そもそもこのNASは45000円で買ったものなんですけども。なのでせめてあと3年は使えてくれないと困ります。。
そもそものRAID(Redundant Arrays of Inexpensive Disks)という名称の由来に反してませんかねぇ。。

幸い最近は専用で無くとも市販の安価なHDDで組めるRAID機も多く出回っていますので、皆様におかれては「交換ディスクは幾らで買えるか」もちゃんと確認してRAID対応NAS/外付けHDDを選ばれるようにオススメします(^.^)

 

 

2009-06
18
08:23:00
iPhoneOS 3.0 アップデート


3.0来ましたね~
SIMフリーにしたいためにJBしていたので迷ってましたが好奇心には勝てず、公開直後からアップデートしていました。
が、問題あり、経験を共有しておきます。

SIMを認識してくれない!

うちで出た問題がこれでした。書き込みとか見てるとかなり特殊な部類かも?
うまくいっている人も多い中、僕も途中までかなり順調でした。
あっさりとダウンロードとインストールまで終わったのですが、バックアップに入って随分と待たされてました。
事前にバックアップはしていたはずなんですが何故か再度バックアップに入りほとんど止まってしまう状態にまでなりました。
しびれを切らし、「まあバックアップぐらいキャンセルしても問題ないだろう」と考えて一旦キャンセルしたんですが、ロックを外してみるとキャリア名が表示されず、アンテナも一本しか立っていない状態に。
実はラジオを掴んでくれない症状はJB直後などにもあったので心配していなかったんですが、その後何をしても解決しませんでした。
再起動しても、SIMを抜き差ししても、USBをつなぎ替えしても、一度フライトモードにしてみても、ネットワーク設定をリセットしても全然駄目。
よくよく確認してみると、SIMの電話番号も「使用できません」となっていたので、SIMが読めていないことは確実なようです。
症状は違うように思えたんですがネットではAppleのアクティベーションサーバーが応答しないとかで、アクティベーションが出来ないとか騒ぎになっていましたね。
見た目は違う現象なんですが、もしかしたらアクティベーションにエラーがあってSIM認識しなくなったのかも知れませんが、原因の確証はありません。
もしくは、JBはSIMアンロックしたいがためにYellowsn0wをインストールしていたんですが、何か関係するのかな・・?
ともあれやむなく復元を行ったところ、難なくラジオを認識するようになりました。パチパチ。
20090618082142.jpg
これから色々試してみます。
因みにバッテリー表示にパーセントが追加されたんですね。
SBSettingでパーセント表示はしていたので「JB環境残ってるのか」とひびりましたが、そんなことないですよね・・?

2006-12
30
23:38:00
自宅PCがこわれちゃいました。。。


この年の瀬に、自宅PCが起動しなくなってしまいました。。
特に何をしたでもなく、数回に一度しか起動しなくなり、起動しても数分で電源が落ちる。。。。
どうもディスクエラーが発生しているようですが、来年早々にも個人旅行とまた海外出張に行くので修理にも出せません。
困った・・・。
最近バックアップもあまり取っていなかったので、個人のデータも引き出せてません。
それに加え、gcNotifierのコードが永久に失われる可能性があります。
旅行びと日記やblogeetあたりもここ一年ほどのコードが無くなる可能性が。
全てバックアップを怠っていた僕の責任なんですが、ユーザーの皆さんには申し訳ありません。
最大限努力しますが、現状は不明瞭です。
gcNotifierはほぼR0.6が出来上がっていたんですが、わずかに間に合いませんでした。
そう考えると、in2gcとol2gcをこの間リリースしていてまだよかったです。でもこれらもR0.3ぐらいまでしか戻らないかも。
とにかく事の重大さに呆然としてしまって何をすればいいか思い付いていませんが、進展あればまたご報告します。
ふにーー、どうしよう・・・><

2006-02
17
00:45:00
Seesaa落ちた


20060216201220.jpgSeesaaが壮絶に落ちました。
どうやら昼12時頃から夜0時過ぎまで約12時間のダウンでした。
どうもディスク障害らしいんですが、Raid構成だったにも関わらずサービスに影響が出たというのがよく分からない。
バックアップから戻していたらしいのでコントローラでも無いようだし、ディスクの玉が複数故障するなんてことあるかな??
実は以前から故障していたのに気付かず、今日になって二つ目が故障してサービス継続できなくなったんではないかと踏んでいるんですが。
今日びこれだけの時間サービスが出来なくなったというのは致命傷に近い。
既にこれだけの規模なんだし、運営体制とかしっかりね、Seesaaさん。