テープとディスクバックアップはどちらが早いか?

ひと昔前は、バックアップについてテープとディスクが同じ土俵で語られることはほとんどなかったと思います。しかし、最近ではディスク-ディスクバックアップというキーワードもある通り、バックアップをテープではなくてディスクからディスクへ取得することが一般的になりつつあります。


バックアップ媒体として多くの企業では未だにテープ装置が使われています。というよりも、企業が数年前に導入したテープ装置をまだ使い続けています。しかし、一方でテープ装置では賄いきれないテラを超えるデータ量となり、バックアップ時間が長くなり、テープメディアの管理も複雑になってきている現状があるため、高速で管理が簡単なバックアップ手法が求められていました。。


様々な議論はあると思いますが、ここに来てディスク装置をバックアップ媒体として使うという動きが加速しています。シリアルATAディスク(以下、SATAディスク)など安価なディスクドライブが普及し始め、ディスクドライブ1本の価格が大幅に下落しているのが一番の要因です。


また最近では仮想テープライブラリと呼ばれるディスク装置上にあたかもLTO、DLTなどのテープメディアがあるように仮想的に認識させる装置が普及し始めている。これら仮想テープライブラリは、市販されているローエンドのディスク装置をバックアップ専用にチューニングしている場合が多いため、テープに比べバックアップが早くなり、結果としてバックアップ時間の短縮に繋がるものです。


実際にバックアップを取るためにはテープとディスクどちらが早いでしょうか?
性能、管理、価格の面から比べてみたいと思います。


テープメディアのマイナス面ばかりを書くつもりはないが、テープへのバックアップについてはいくつか考慮しなければならないことがある。ひとつ目はその管理性である。オートローダー、テープライブラリを導入し、なおかつバックアップ容量が足りている場合は問題ないが、テープを交換する必要がある場合は、テープメディアの保管や入れ替えなど管理がかなり複雑になることがある。

ストレージ設計⑩

ストレージを購入するときに考えなければならないデザインの最後のポイントです。
昨日のストレージ設計⑨でもバックアップについて説明しましたが、やはり重要なデータを保存しておくストレージだからこそ、そのデータを万が一の事態からも守るバックアップは非常に重要です。バックアップは重要なのですが、ではどのようにバックアップを取ればよいのでしょうか? バックアップについては追々このブログの中で説明していきますが、今回はストレージを購入するときに考えなければいけないバックアップの要素について語ることにします。

⑩オンラインバックアップ方法
<ポイント>

  • バックアップは停止して取得することができるか?
  • 停止可能な時間はどのくらいか?
  • 筐体内ミラーリングにディスクがいくつ必要か?

どれほど高価なストレージ装置でもハードウェアである限り故障がないとは言い切れないはずです。そのために保存されているデータを保護するためのバックアップを取得することが求められます。4〜5年前まではハイエンドストレージ(一部、ミドルレンジストレージ)でのみ提供されていたストレージ筐体内コピー機能も現在ではミドルレンジや安価なローエンドストレージでも提供されるようになってきています。


ベンダによって呼び名が変わりますが、ストレージ筐体内コピー機は、スナップショット、スナップクローン、ミラーリング、コピーなどと呼ばれ、ストレージ筐体内部で重要なデータと同じ内容を持つコピーを別の領域に作る機能のことを言います。(スナップショットなどいろいろな機能がありますが、今回はクローンやコピーという機能だけを説明することにします)重要なデータが2箇所にできるということは、元々業務サーバからアクセスされていた重要データ領域はそのままアクセスが継続でき、もう1箇所のコピー領域をバックアップサーバにマウントさせて、重要データには影響のないところでバックアップが取得できるということです。ストレージの機能によりコピーが作成されることから、重要データにアクセスする業務サーバには一切の負荷がかからずバックアップが取得できるようになり、極端な話、日中の時間帯でもバックアップを取れるようになります。


このストレージ設計⑩のポイントとしては、コピーのための領域は、重要データ領域と同じ容量、もしくは世代によってはその2倍、3倍の容量が必要になります。ストレージ設計⑨で書いたようにこの領域も含めてATAディスクを使うなどを考える必要がありますし、そもそもこのバックアップのためのコピー領域が必要なのかを考えることが求められます。


システムの重要性に応じて必要かどうかの判断が必要ですが、24時間365日可能な限りとめたくないシステムであれば業務サーバには一切負荷をかけないオンラインバックアップを実現するためのひとつの方法であるこの筐体内コピー機能を使いたいと思われるはずです。ストレージ筐体に保存されているデータがどれだけ重要で、どれくらいそのサーバを止められるかということを考えて、筐体内コピー機能を使うか使わないかを判断してください。


これまでストレージ設計のポイントを10個紹介しました。このポイントを抑えて設計することで、誰かに任せず自分自身でどのようなストレージが良いか、搭載するディスク本数などが決められるはずです。

ストレージ設計⑨

一足早くブログで3連休してしまいました。頭の中では2日のはずだったのですが、3日も書いていないことに今日気付きました。今日の内容は、バックアップ領域の設計について考えてみたいと思います。

バックアップ領域について
<ポイント>

  • ディスクドライブはFCかSATA
  • バックアップ領域は遅くても良いか?
  • 容量重視のディスク設計とは?

以前の内容に書き忘れてしまったことがあります。ストレージ設計③で説明したディスクドライブタイプの決定で回転数、容量を決めることと書きましたが、実はもうひとつポイントがありました。ディスクドライブのタイプとして、高速な書き込みを実現するFC(ファイバチャネル)ディスクか、安価で大容量を実現するATAディスクかを決める必要があります。


今回のテーマにあげている「バックアップ領域について」考えるときに、書き込み、読み込みの性能が求められる本番領域に比べると、性能を求めず容量はなるべく多く準備したほうが良いと覚えてください。そのため高価なFCディスクより安価で300GB、500GBなど大容量を実現するATAディスクを選択することにより、少ない本数で容量を多く準備することができます。


バックアップ領域としては、性能よりもバックアップデータを何世代も保存できる大容量の領域が必要になります。最近ではディスクからディスクへバックアップを取得する仕組みが一般的になりつつあります。少しでも多くの容量を確保するためにはスロット数に限りがあるディスク装置では1ドライブで500GBを確保できるATAディスクが重宝します。容量を重視するためにはバックアップ領域としてATAディスクを選択すると良いでしょう。

ストレージ設計⑧

さて、ストレージデザイン ステップ10の8番目です。ストレージはハードウェアですが、本当に考えないといけないことはストレージにデータを書き込むアプリケーションについてです。どのようにデータを書き込むのか、少しでも性能を出すにはどうすれば良いのか、これまではディスクの数などをポイントにあげてきましたが、今回はアプリケーションについて考えましょう。

<ポイント>

  • アプリケーションの特性を考慮したディスク配置
  • 性能を求める場合は、ディスクドライブの書き込みやすい位置にデータを配置

ストレージは、コントローラに近いディスクドライブのほうが書き込みが早いと言われています。コントローラからの接続が内部的にいくつかのループに分かれてはいるが1本のパスに数珠繋ぎのように接続されているためです。それほど大きな違いはないと思われるがコントローラに近いディスクドライブのほうがコントローラから遠いディスクドライブよりも性能が変わるといわれます。


アプリケーションの特性により、容量よりも性能を求める領域が必要になることがあります。例えば、データベースのインデックス領域やメールソフトウェアのトランザクションログ領域などがそれに当たります。アプリケーションの特性を考えると必ずしもディスクドライブをすべて同じ容量、同じRAIDタイプ、同じ回転数に統一するわけではなく、性能を求める領域と容量を重視する領域をわけて考えたいです。

例えば、
ディスクタイプを選択する章でも記述しているが、アプリケーションの特性を考えると回転数が15,000rpmのディスクのほうが7,500rpmのディスクドライブよりも書き込み性能が高い。この15,000rpmディスクドライブをコントローラへ一番近いディスクスロットへ配置することにより、性能が良くなる可能性があることを覚えておきたい。また、ディスクドライブの容量でも、より小さな73GBなどのディスクドライブを横並びに配置したほうが、300GBを数本並べるよりもストライピングの幅が広がるので早くなる可能性がある。

アプリケーションの特徴をよく考えデザインをして欲しい。
これは次回に記載するバックアップ領域についても同じです

ストレージ設計⑦

スペアディスクの決定

<ポイント>

  • ディスクに障害が起こった場合に、スペアとして何台のスペアディスクドライブを用意するか?
  • スペアディスクが1つだと、2つ以上のディスクに障害が発生した場合にデータを守れない


たとえRAID設定ができるディスク装置を購入しデータロスを無くしたとしてもハードウェアである以上ディスクドライブは壊れるものです。スペアディスクはストレージ筐体内のディスクドライブが壊れた場合にその代わりとなりデータを守る役目をするものであす。ほとんどのストレージ機器は、ディスクドライブ1つが壊れた場合にその壊れたディスクドライブ内部に保存されていたデータをミラーリングされたディスク(RAID1)、もしくはパリティデータ(RAID5)から復旧、もしくは予防的にスペアディスクに書き込む方法でデータを守っています。


そのスペアディスクドライブをストレージ筐体で何本設定するのかを決定します。通常、スペアディスクは何本でも設定できるのですが、ストレージ筐体内のディスクが障害とならない限り使われることのないものである。最大何本までのディスクドライブ障害に耐えられる構成とするのかをここで決めたい。


ディスクドライブ全体の本数が多ければ故障率もあがることになるのでホットスペアディスクの本数が多くしたほうが無難です。文章中にホットスペアディスクと記述しましたが、特別なディスクドライブではなく、通常のディスクドライブをホットスペアとして設定するものであるということも合わせて覚えておきたいポイントです。
障害が起こらなければ使わないディスクドライブである。データの重要度も考慮し、何本までのディスクドライブ障害に耐えられる構成とするのか決定しましょう。


一般的なディスク装置が1筐体に14〜15ディスクドライブ搭載できるものであるので、その筐体1台につきスペアディスク1本という計算がわかりやすいと思う。これであればどのディスクがスペアディスクであるのか管理するのも簡単だと思う。もしバックアップ専用ディスク装置の位置づけであれば2,3筐体に1スペアディスクでも問題ないと思う。前述したが、保存されるデータの重要度に応じてスペアディスクの本数を計算するのが良いです。


次回は、アプリケーションを考えてみましょう。ステップ⑧です

ストレージ設計⑤、⑥

週末の2日間さぼってしまいました。ストレージ設計のステップ⑤、⑥について今日はまとめて書きたいと思います。


⑤ディスク数の決定
<ポイント>
実際に搭載するディスク数を決定

これまでのストレージ設計ステップ①〜④で、容量、RAIDタイプ、ディスクドライブタイプ、障害対応、回転数についてのポイントを検討しました。この検討内容をもとにこのステップ⑤では実際に搭載するディスクドライブ数を決定します。

例えば、「1TBの容量を最高の性能で提供したい」ということであれば、ポイントは

  • 一番小さなサイズのディスクドライブでストライピングさせる
  • RAID1、もしくはRAID0/1が良い
  • 回転数が早いディスク(15,000rpmが最高かな?)
  • 付き合ってるベンダで一番早いRAIDディスク

となります。
ここで要件に一番適したディスクドライブ数を決定しておきます。ここが基準です。この後のステップでもしかしたら要件が変わるかもしれませんし、金額を見て、どこか削りたくなるかもしれません。しかし、まずは自分の要件に一番最適なディスクドライブ数を基準として定めることが重要です。

基準を明確にすることで、例えば、回転数を遅くすることによるメリット、デメリットをあげたりすることができますし、ベンダによってはもっと違うディスクドライブの選択肢があるかもしれません。基準を早めに決めることがこのステップ⑤では必要です。


⑥接続ポート数の検討
<ポイント>

  • 何台のサーバを接続するのか?
  • ストレージ製品に何ポート接続可能か?
  • 必要であればSANを導入し、スイッチ経由でポート数を増やす必要があるか?

システム構成により何台のサーバがストレージへ接続されるのかが決まってくる。ほとんどは1台のサーバから正系、副系の合計2本の接続が必要になる。サーバ台数に応じて接続可能なストレージを選択すれば良いが、ストレージ機器は最小で2ポート、最近では256ポートものサーバ接続用のポートを搭載している製品もある。サーバ接続数よりもストレージのポート数が少ない場合は、ファイバチャネルスイッチを導入し、FCスイッチ経由でストレージ機器への接続を多くする方法がある。


さて、次回のステップ⑦ではスペアディスクについて考えましょう

ストレージ設計④

ストレージを設計するためのポイント10つの4番目です。
システムエンジニアが次に考えるべきポイントは、RAIDタイプの決定になります。

<ポイント>

  • 重要なデータは、RAID 0/1
  • コストを下げる場合は、RAID 5

RAIDとは、複数のディスクドライブをあたかもひとつのディスクドライブとして見せることを可能にする技術です。安価なディスクドライブを組み合わせることでドライブに障害が発生しても中に保存されているデータが守られること、複数ディスクドライブを横に並べて並行処理することにより性能を高めることができるようになります。


RAID 1は、ミラーリングとして知られており、4本のディスクドライブで計算すると、2本分の容量がデータ保存領域として使うことができます。残りの2本はミラーリング領域として同じデータがコピーされるイメージです。

RAID 5は、パリティを用いてデータを保護する方式で、上記と同じく4本で計算すると3本分の容量がデータ保存領域として使うことが可能です。そのため、容量を大きく取ることができるRAID 5は、バックアップ領域、スナップショット領域など本番データではないデータを保存することに使われることが多いです。
また、同じ本数でもデータを保存する容量が多いため、コスト削減のために少しでも安価に抑えたい方には有効なRAIDタイプだと思います。


次は、ディスク本数を決めましょう