バックアップに許される時間

毎週バックアップについて書きながら、バックアップは重要だなぁと改めて考えてしまう自分がいます。バックアップが重要だというよりも、バックアップ対象であるデータの重要度が高まっているのかもしれません。これからはサーバの処理能力よりもストレージへの書き込み速度やストレージ処理能力が重要になってくる時代が来るのではないでしょうか。

さて、今回はバックアップに許される時間について記載したいと思います。

前回バックアップだけでは止められないバックアップだけでは止められない - 誰かに任せておけないストレージで書きましたが、オンラインでバックアップを取得する方法はいくつかあります。止まっているように見せる機能、バックアップソフトウェアのオプション機能などがそれです。

バックアップは通常夜間に取得しますバックアップを取得する処理が本番サーバの処理能力に影響を与えてしまうからです。一般ユーザが使っている日中の時間帯にバックアップを流せば、おそらくクレームが来るでしょう。イメージとして、お昼や夕方に流れるクライアントPCのウィルスソフトウェア処理がわかりやすいでしょう。ウィルスの処理が走るとPCの処理能力が落ちます。遅くて嫌だなぁと感じることが多いのではないでしょうか。これと同じことがバックアップ処理中の本番サーバに起こるのです。

そのためにバックアップはユーザが使わないであろう午前0時から8時までの間に終わらせるのが一般的です。

しかしながら、データ容量が倍々に増える現在ではこの時間内に終われないことが問題としてあがっています。バックアップの取得方法も工夫する必要があるのです。そのためにバックアップソフトウェアでは、差分バックアップ増分バックアップと呼ばれる機能が備わっています

差分、増分の違いは議論が分かれるところではありますが、ここでは差分は前回のフルバックアップからの更新データのことを言います。増分は、前回のフルバックアップからの更新でなおかつ直前の増分バックアップからの更新データのことを言うことにします。

フルバックアップを日曜日に取得したとすると、
→月曜日:差分、増分とも月曜日の更新データだけなので、容量は同じです。
→火曜日:差分はフルバックアップからの更新データですから、月曜日と火曜日の更新データ量がバックアップされる
     増分は、直前の増分バックアップからの更新ですから、月曜日から火曜日にかけての1日分のデータです
・・・
→金曜日:差分はフルバックアップからのデータ更新なので月曜から金曜までの更新データがすべて取得されます
     増分は、例えば金曜日一日分のデータだけを取得するだけで済みます


バックアップだけ考えると差分、増分機能を使うとバックアップ時間の短縮となります。しかし、バックアップエンジニアたる者、バックアップの時間短縮だけ考えているようでは半人前です。このバックアップデータをリストアするとき、サーバに何か障害やデータ破損があった場合の戻しの状況も考えなくてはいけません

フルバックアップであれば、障害のあった直前のフルバックアップデータを戻せば終わりです。
差分バックアップであれば、フルバックアップデータと障害のあった直前の差分バックアップを戻すことになります
増分バックアップはやや複雑で、フルバックアップデータと障害のあった時までの増分バックアップデータをすべて戻さなければデータは復旧できません。

リストアに関して言うと、バックアップソフトウェアが自動でリストア処理をしてくれるのですが、やや複雑になります。ここまで考えることができてバックアップを語れるということです。

まだまだ書ききれませんが、残り2回で一人前のバックアップエンジニアにしてみせましょう。