TOP > IT > データレプリケーションとは？目的とバックアップとの違いや2つの効果

データレプリケーションとは？目的とバックアップとの違いや2つの効果

記事更新日: 2022/11/10

執筆: 川崎かおり

データレプリケーションとは、データベースのレプリカ（複製）を作ることです。

絶対にサーバーダウンが許されない状況において、可用性（システムが停止することなく稼働し続けること）の維持・向上のために行われます。

本記事では、データレプリケーションの目的やバックアップとの違い、データレプリケーションによって得られるメリット・注意点を詳しく紹介します。

1.
データレプリケーションとは
- データレプリケーションの目的
- データレプリケーションの重要性
2.
データレプリケーションの種類
3.
バックアップやミラーリングとの違い
- バックアップとの違い
- ミラーリングとの違い
4.
データレプリケーションで得られる2つの効果
- 1. システム停止を防ぐ
- 2. サーバーの負荷を分散できる
5.
データレプリケーションの注意点2つ
- 1. コストが高額になる
- 2. コピーするデータを選べない
6.
こんなケースはデータレプリケーションがおすすめ！
- ディザスタ・リカバリ
- データベースへのアクセスやデータ量が多い
7.
まとめ

データレプリケーションとは

データレプリケーションとは、メインサーバーと同じ構成を持つサブサーバーを構築することです。

元サーバーは「プライマリ」「マスター」、サブサーバーは「セカンダリ」「レプリカ」などと呼ばれます。

データレプリケーションを行う目的や、重要性を見ていきましょう。

データレプリケーションの目的

データレプリケーションの目的は、サーバーダウンを防ぐこと・サーバーにかかる負荷を分散させることです。

データレプリケーションでは、マスターサーバーの変更を元にレプリカサーバーが更新されます。

2つのサーバーは常に同じ構成が保たれており、万が一のときはマスターサーバーをレプリカサーバーに切り替えて運用することが可能です。

データレプリケーションを行っていれば、マスターサーバーがダウンしてもシステムが停止する心配がありません。

アクセスを分散させれば、サーバーに負荷がかかるのも防げます。

いつ・いかなるときもシステムは稼働を続けられるため、システムの安定的な運用が可能です。

データレプリケーションの重要性

データレプリケーションは、「情報セキュリティの3要素（機密性・可用性・完全性）」のうちの「可用性（Availability）」に関わるものです。

可用性とは、ユーザーが必要なときに必要な情報にアクセスできることを指します。

システム側から見た場合は、「停止せずに動き続けること」「稼働の空白時間を作らないこと」と言い換えられるでしょう。

近年は社会全体のDX（デジタルトランスフォーメーション）が進んでおり、多くの企業が外部サーバーに依存した情報資産管理を行っています。

そんな中、わずかな時間の停止さえ許されないシステムや、常に高い可用性が求められるサービスも少なくはありません。

企業が円滑に経済活動を行ったり人々が不自由なく社会生活を行ったりする上で、システムの可用性を確保することは非常に重要です。

データレプリケーションの種類

データレプリケーションには「一方向レプリケーション」「双方向レプリケーション」があります。

またデータレプリケーションをタイミングで分類した場合は「同期レプリケーション」「非同期レプリケーション」の2種類に分けられます。

それぞれについて、詳しく見ていきましょう。

1. 一方向レプリケーション

マスターサーバーの情報をレプリカサーバーに送ることで、随時情報をアップデートする方法です。

マスターサーバーは「送る側」レプリカサーバーは「受ける側」と役割が決まっており、逆方向はありません。

レプリカサーバーで更新を行っても、マスターサーバーには反映されない仕組みです。

一方向レプリケーションのメリットは、データ不整合が発生しにくい点です。

ごく一般的なデータレプリケーションでは、一方向レプリケーションが選択されるケースが多いでしょう。

2. 双方向レプリケーション

マスターサーバー・レプリカサーバーのどちらともが「送る側」であると同時に、「受ける側」でもあります。

どちらかで行われた更新は相手にも共有されるため、マスターサーバー・レプリカサーバーは常に同じ構成です。

双方向レプリケーションは、障害・災害対策やサーバーの負荷分散に最適とされます。

また全国に複数拠点を展開する企業などでは、拠点間を結ぶデータベースとして使われるケースも多いでしょう。

注意点は、マスターサーバー・レプリカサーバーで同じレコードを更新すると、データの更新競合が発生する点です。

データが競合すると整合性が失われ、レプリケーションの目的を果たせなくなります。

3. 同期レプリケーション

複製データを転送するタイミングでレプリケーションを分類した場合、データ更新に遅延がないのが「同期レプリケーション」です。

マスターサーバーに変更があった場合はすぐにレプリカサーバーに反映されるため、マスタサーバー・レプリカサーバーは常に同じ状態です。

データの最新性が重視されるケースでは、同期レプリケーションが選択されます。

ただし、利用しているネットワークの帯域が狭かったり、サーバー間の距離が離れていたりした場合、同期処理に時間がかかる、あるいは、同期処理できないことがあるでしょう。

4. 非同期レプリケーション

設定された任意のタイミングでデータ更新を行うのが非同期レプリケーションです。

WAN（Wide Area Network）を利用してデータ転送できるため、サーバー間の距離が離れている場合でも同期処理がスムーズに行われます。

非同期レプリケーションはレプリケーションの安定性が確保できるというメリットがありますが、データの最新性は担保されません。

マスターサーバーがダウンした場合、同期のタイミングによっては最新のデータが失われる可能性があります。

バックアップやミラーリングとの違い

システムの可用性を確保するための方法として、「バックアップ」「ミラーリング」などがあります。データレプリケーションと混同されるケースが多々ありますが、それぞれどのような違いがあるのでしょうか？

具体的な詳細を見ていきましょう。

バックアップとの違い

バックアップとは、データの複製を作成して外部装置などに保管することです。

万が一サーバーのデータが破損してしまっても、バックアップがあれば復元できます。

データのバックアップを作成することも、障害・災害対策として有効といわれます。

しかしバックアップでシステムを破損前の状態に戻すには、復元データをシステムに戻す「レストア」作業が必要です。

データレプリケーションのようなリアルタイム性がなく、復旧作業中システムは完全に停止します。

「データ保護・保存」には有益ですが、可用性の確保には不向きです。

ミラーリングとの違い

ミラーリングとは、1つのサーバーに複数のストレージをつなげ、それぞれに同じ書き込み・更新を加えることです。

「データベースの複製を作成する」という点では、データレプリケーションと同じ役割を持つといえます。

システムに異常があった場合は、ストレージを替えて同期を行えば、速やかな復旧が可能です。

ただしミラーリングは同一サーバーで複製を行うため、データレプリケーションのようなストレージの自由度がありません。

マスターデータを全てコピーして保管するのはほぼ不可能なため、ミラーリングされるのはごく一部の重要なデータのみとなるでしょう。

ミラーリングのみでシステムを完全復旧させるのは難しい上、作業中にはシステムが停止します。

可用性の確保という点では、やはりデータレプリケーションに軍配が上がります。

データレプリケーションで得られる2つの効果

データレプリケーションの効果として大きいものに以下の2つがあげられます。

システム停止を防ぐ
サーバーの負荷を低減できる

それぞれについて、詳しく見ていきましょう。

1. システム停止を防ぐ

マスターサーバーに障害が発生しても、レプリカサーバーにスイッチしてシステムを継続できます。

サーバートラブルがどのようなものであれ、ユーザーに与える悪影響をほぼゼロに抑えることが可能です。

データレプリケーションで構築されるレプリカサーバーは、マスターサーバーと全く同じ構成です。

サーバー切り替えによる混乱は発生しにくく、マスタサーバーの修復をしながら通常のシステムを運用できます。

データレプリケーションを利用すれば、絶対に停止が許されないインフラ系のシステムや、停止が大きな社会混乱につながるシステムなども、安全かつ安定的に運用できます。

2. サーバーの負荷を分散できる

マスターサーバーのレプリカを作っておけば、サーバーに負荷のかかりそうな作業を分けて行うことが可能です。

サーバーへの負荷集中による処理速度の低下やサーバーダウンのリスクを低減できます。

例えば多量なデータ更新を行うと、サーバーには大きな負荷がかかります。

一般ユーザーの処理速度が低下し、可用性が損なわれる恐れがあるでしょう。

このときデータレプリケーションでマスターサーバー・レプリカサーバーを作っておけば、データ更新と一般ユーザーのアクセスを分けられます。

データレプリケーションの注意点2つ

効果の高いデータレプリケーションですが、注意しなければならない点が2つあります。

コストが高額
コピーするデータを選べない

2つの要注意点についてそれぞれ解説します。

1. コストが高額になる

データレプリケーションでは、マスターサーバーと全く同じ環境を構築しなければなりません。

サーバー構築にかかる費用はもちろん、継続的な保守・運用コストが必要です。

バックアップやミラーリングと比較すると、金銭面の負担が大きくなります。

また、データレプリケーションを適切に行うには、それなりの知識・スキルを持つ人材も確保しなければなりません。

社内でまかなえない場合は外部リソースに頼ることとなり、より多くのコストがかかると予想されます。

2. コピーするデータを選べない

データレプリケーションでは、マスターサーバーの更新はそのままレプリカサーバーに反映されます。

「○日前の時点に戻したい」などというニーズには対応できません。

またリアルタイム情報をやり取りする性質上、マスターサーバーのトラブル・障害がレプリカサーバーに引き継がれる恐れがあります。

例えば、マスターサーバーがマルウェアによってダメージを受けた場合は、レプリカサーバーにも同じ状態がコピーされます。

マルウェア対策やデータ保存をメイン目的とするケースでは、データレプリケーションは不向きです。

こんなケースはデータレプリケーションがおすすめ！

データレプリケーションは、情報セキュリティには必須の「ネットワーク分離」の実現に有益です。

データレプリケーションが、特に高い効果を発揮するケースを見ていきましょう。

ディザスタ・リカバリ

ディザスタ・リカバリとは、災害によってダメージを受けたシステムを復旧することです。

自然災害の多い日本では、安定した企業運営を行えるよう、常に災害に備えておく必要があります。

BCP（事業継続計画）の1つとして、どのような規模の企業でもディザスタ・リカバリの手段を確保しておかなければなりません。

データレプリケーションを活用すれば、マスターサーバーを東京に設置し、レプリカサーバーを東や西の拠点都市に設置する…という運用が可能です。

万が一片方のサーバーに被害があったとしても、企業の基幹システムが影響を受けることはありません。

データベースへのアクセスやデータ量が多い

データベースへのユーザーアクセスが多かったり、データベースそのものの規模が大きかったりする場合、サーバーには常に大きな負荷がかかります。

データ更新やデータ解析などを行うと、タイミングを誤ると処理速度が低下したりサーバーがダウンしたりする恐れがあるでしょう。

データレプリケーションでレプリカサーバーを作成すれば、レプリカサーバーを「参照用」マスターサーバーを「更新用」「解析用」などとして用途を分散できます。

システムの運用が安定し、高いレベルで可用性を維持することが可能です。

例えばサーバーダウンが大きな混乱につながる金融機関や交通系のシステムなどでは、データレプリケーションを利用しているケースが多く見られます。

まとめ

データレプリケーションとは、マスターサーバーと同じ構成を持つレプリカサーバーを作ることです。災害やサーバートラブルがあっても、サーバーを切り替えることで安定的なシステム運用が可能となります。

サーバーへの負荷増大で運用が不安定になっていたり、災害への対策が十分に行われていなかったりする企業は、データレプリケーションの導入が課題解決につながる可能性があります。

ただしデータレプリケーションの導入には、コストや人材の確保が必要です。導入を検討する際は構築・保守・運用コストを算出し、自社にメリットがあるかどうかを適切に判断してください。

画像出典元：Unsplash