月別アーカイブ: 2012年8月

2012-08
27
03:26:21
NASをRAID5ではなくRAID10にしていて助かった話


NASをRAID5ではなくRAID10にしていて助かった話
NASをRAID5ではなくRAID10にしていて助かった話

まあインフラ周りの仕事をしていてよくご存じの方には今更の話なんですが、近年家庭用のNAS(外付けHDDでもですが)も安く出回って一般ユーザーにも広まっており、何かの参考になるかなあと思ったので書いておきますね。

以前まともにバックアップしていなくて開発したソフトのコードを全損しかけた(笑)経験から、家庭用外付けハードディスクを幾つか渡り歩いた後、メーカー限らずあまりによく壊れるので(理由は熱暴走とか突如のHDD破壊とか様々です)、試しにRAID対応のNASを買ってみました。結構前のことで、2009年春頃のことです。
買ったのはバッファローのLS-Q2.0LS/R5という機種で、これを選んだ理由はあまり覚えていないのですが、 「値段手頃」で「その前に壊れたのがIOデータ製だったから」とかそんな程度の理由だったと思います。

いわゆるPCの定期バックアップと言うよりは普段使わないデータの保存先が主な目的で、一時期MacのTime Machineバックアップにも使用していましたがその後純正Time Capsuleを買ったのでその目的では使わなくなりました。また開発コードやコンテンツなども最新版をコピーしていましたが、同時にsubversionも使用していますので、基本的にはこれまでのデータの退避先ですね。

という状態で3年ほど何事も無く過ぎていたのですが、基本的に先日家に帰るとNASが停止していて、すぐには気付いていなかったのですがアラートメールが届いていました。
非常に分かりにくいメールでしたが(なので一般ユーザーだと何が起こったのか、分からないんじゃないかなあ。。)、どうやらRAIDを構成するディスクにエラーが発生し縮退運転に入り、また縮退運転時には自動停止する設定にしていたのでNASがシャットダウンされていたようです。

RAIDで運用している訳ですからエラーの出ているHDDを普通に交換すればいいだけなんですが、アラートメールだけでは詳しい状況が分からなかったので試しに起動し直してみると、意外にも「壊れたHDDは2台」だったことが前面のアクセスランプから判明しました。ここで多少血の気が引いていくのを感じたのを覚えています(笑)

一般的にRAIDと言われるとよく知られているのはRAID5では無いでしょうか。こちらにRAIDの種類については詳しい説明がありますが、RAID5というのは「パリティと呼ばれる、他の残りデータと組み合わせると欠損データを回復できる仕組みを用いた冗長化」が主な特徴になっています。このパリティは常にHDD1台分のデータが必要とされるのでRAID5を構成している1台のHDDが故障してもこれを交換すれば自動的にデータ復旧が行われて回復可能です。
しかしHDD2台が同時に破損するとデータ復旧は不可能です。


http://www.data-sos.com/raid/raid09.html より引用

しかし僕はすっかり忘れていたのですが、RAID10で運用していたのでした。

RAID10は、RAID1 + RAID0が命名の語源で、まず構成されるHDDは二つのミラーセットに分けられます。書き込みデータはRAID0と同様にストライピング(ミラーリングの単位で分散配置される)とともにRAID1のようにミラーリングセット間でミラーリングされます。パリティは無いのでRAID5より信頼性は劣るとされますが、同じミラーリングセット内で無い限り、二台のHDDが故障してもデータは保証されます。


http://www.data-sos.com/raid/raid015.html より引用

僕の場合はまさしく、「たまたま」この故障した二台のHDDは二つ存在したミラーリングセットそれぞれの一台ずつで、幸いにもHDD2台を交換することで正常にリビルドが行われ、元に戻すことが出来ました。良かった良かった・・・

では果たして、RAID5よりもRAID10にしておくべきなのか?

これは先に示したサイトでも詳細に説明されていますが、そう単純なことではありません。ここに記載した事例は「幸い良い方向に倒れた一つの事例」に過ぎません。
RAIDなどのバックアップ方法は「求める目的」と「許容できる障害範囲」(と場合によっては「パフォーマンス」「容量」も)によって選ばれるべきです。でも、そこの見極めが難しいんですよねえ。
先に書いたとおりですが、企業内利用ならともかく、個人利用だと目的や要件が利用しているうちに変わってしまうことは多いでしょう。するとRAIDも含めてバックアップ方針はそれに応じて変更することを常に考えた方がいいでしょう。

一般的には、RAID対応のNASを買う以上はほとんどの場合そのバックアップ内容に「信頼性」を求める場合がほとんどかと思います。しかし例えばRAID5にしていても、常にディスク状態をチェックして交換用ディスクを準備してすぐに交換できなければ(RAID5では1台が故障中にもう1台故障すればデータは全損します)RAIDを組んでいた意味がありません。また昨年の計画停電時には停電でRAIDのコントローラーやHDDがダメージを受けた例が多発したそうです。そうした場合で無くとも、極端な場合落雷や過電流などでHDDが全損する可能性もゼロでは無いはずです。

実は僕の場合、何故HDDが同時に2台故障したのだろうかと疑問だったのですが、よくよく調べてみると、実は1年以上前に故障したHDDの1台からエラーが発生したというアラートメールが届いていたのを見過ごしていました。ただアクセスランプは正常だったので恐らく自動的にエラーセクターは修復されていたのでしょう。しかしそもそも調子は悪かったはずで今回エラーになった際に同時に巻き込まれた?などと推測しています。しかし最初のエラーの際にディスクチェックや交換などを行っていればもう少し状況は変わったかも知れません。しかし個人での運用なんて「その程度」のものなのですよね。

逆に言えばRAIDなどハードウェアに頼り切るよりも、実は運用こそが重要と言えるかも知れません。
今回の件からは、例えばRAID対応NASよりは、例えば安く買えるRAID対応していないNASを2台並べて、またはNASに外付けHDDを増設して定期的に一方向バックアップでも十分かなあと思い始めています。
メディアバックアップも意外に馬鹿にはできません。最近は4層120Gに対応した書き込み型Blu-rayディスク(BDXL)もありますので、本当に重要なデータなら選択的にこれらを活用してもいいでしょう。
またプライバシーや情報漏洩上は問題も指摘されますが、1TBなどの非常に大きなデータで無い限りは、クラウドのバックアップサービスを選択しても良いでしょう。これは例えば自宅が火事や災害によって被害を受けることを想定した場合には非常に有効です。
上記は「無くなっては困るがもう頻繁には更新されない重要なデータ」には有効な手段でしょう。

蛇足ですが

実は今僕が使っているLS-Q2.0LS/R5に限らず、バッファローのNAS/外付けHDD用の交換HDDって、とっても高いんですよ!
数が出る製品でも無いので、アマゾンでも1台=2万円ほどしており、つまり今回は2台で約4万円も交換にかかってしまいました。。。
そもそもここまでコストをかけてHDD交換するか、別のNASに買い換えるか悩んだんですが、別のNASにした場合データ移行時に現在のNASで仮にもう1台HDDが故障した場合はもう全損なので、安全を取ってHDD交換/リビルドを選択してしまいました。つまり体よく「メーカー・ロックオン」されてしまった訳ですね。一応「出荷時に専用検査とエイジングテスト実施」とは謳っているんですが、あまりに高いでは無いですか、そもそもこのNASは45000円で買ったものなんですけども。なのでせめてあと3年は使えてくれないと困ります。。
そもそものRAID(Redundant Arrays of Inexpensive Disks)という名称の由来に反してませんかねぇ。。

幸い最近は専用で無くとも市販の安価なHDDで組めるRAID機も多く出回っていますので、皆様におかれては「交換ディスクは幾らで買えるか」もちゃんと確認してRAID対応NAS/外付けHDDを選ばれるようにオススメします(^.^)