データ重複排除は、ストレージ容量を最適化する人気の高いストレージ技術です。データセットから重複データを削除してコピーを1つだけ残すことで、冗長なデータを排除します。下の図に示すように、この技術は、増大するデータストレージの需要を満たすために必要な物理的なストレージスペースを大幅に削減できます。重複排除技術は、主に次の側面を含む多くの実用的な利点をもたらします。
| (1) | 投資収益率(ROI)および総所有コスト(TCO)の要件を満たす。 |
| (2) | データの急速な増加は効果的に制御できる。 |
| (3) | 有効収納スペースを増やし、収納効率を向上させる。 |
| (4) | 保管コストと管理コストの合計を削減する。 |
| (5) | データ伝送のネットワーク帯域幅を節約する。 |
| (6) | スペース、電力供給、冷却などの運用・保守コストを削減できます。 |
重複排除技術は、データのバックアップやアーカイブシステムで広く使用されています。これは、データの複数回のバックアップ後には多くの重複データが発生するため、この技術に非常に適しているためです。実際、重複排除技術は、オンラインデータ、ニアラインデータ、オフラインデータストレージシステムなど、多くの状況で使用できます。ファイルシステム、ボリュームマネージャ、NAS、SANに実装できます。重複排除は、データ圧縮技術としてデータパッケージングに使用できるため、データ災害復旧、データ転送、同期にも使用できます。重複排除技術は、多くのアプリケーションでデータストレージを削減し、ネットワーク帯域幅を節約し、ストレージ効率を向上させ、バックアップウィンドウを短縮し、コストを削減するのに役立ちます。
重複排除には、重複排除率とパフォーマンスという2つの主要な側面があります。重複排除のパフォーマンスは特定の実装技術に依存しますが、重複排除率は、以下の表に示すように、データ自体の特性とアプリケーションパターンによって決まります。ストレージベンダーは現在、20:1から500:1の範囲の重複排除率を報告しています。
| 高い重複排除率 | 重複排除率が低い |
| ユーザーによって作成されたデータ | 自然界からのデータ |
| データの変化率が低い | データの変化率が高い |
| 参照データ、非アクティブデータ | アクティブデータ |
| データ変更率の低いアプリケーション | データ変更率の高いアプリケーション |
| 完全なデータバックアップ | 増分データバックアップ |
| データの長期保存 | データの短期保存 |
| 幅広いデータアプリケーション | データアプリケーションの範囲は限られています |
| 継続的なデータビジネス処理 | 一般的なデータビジネス処理 |
| 小規模データセグメンテーション | ビッグデータセグメンテーション |
| データ分割を延長する | 固定長データ分割 |
| データコンテンツが認識される | データの内容は不明です。 |
| 時間データの重複排除 | 空間データ重複排除 |
重複排除の実装ポイント
重複排除技術を開発または適用する際には、さまざまな要素を考慮する必要があります。これらの要素は、その性能と有効性に直接影響を与えるからです。
| (1) | 何 | どのようなデータが重み付け解除されるのですか? |
| (2) | いつ | 体重はいつ減るのでしょうか? |
| (3) | どこ | 減量はどこで行われるのですか? |
| (4) | どうやって | 体重を減らすにはどうすればいいですか? |
重複排除の主要技術
ストレージシステムの重複排除プロセスは一般的に次のとおりです。まず、データファイルをデータのセットに分割し、各データブロックに対してフィンガープリントを計算します。次に、フィンガープリントハッシュに基づいてキーワードを検索し、一致するデータがあれば重複データブロックを示し、データブロックのインデックス番号のみを保存します。そうでなければ、データブロックは新しいデータの唯一の部分であることを意味します。データブロックを保存し、関連するメタ情報を作成します。したがって、ストレージシステム内の物理ファイルは、FPメタデータのセットの論理表現に対応します。ファイルを読み取るときは、まず論理ファイルを読み取り、次にFPシーケンスに従って、ストレージシステムから対応するデータブロックを取り出し、物理ファイルのコピーを復元します。上記のプロセスから、重複排除の主要技術は主にファイルデータブロックの分割、データブロックフィンガープリントの計算、およびデータブロックの取得であることがわかります。
(1)ファイルデータブロックの分割
(2)データブロックフィンガープリントの計算
(3)データブロックの取得
ネットワークパケット重複排除を開始するための推奨モデルを見つけるには、以下を参照してください。
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-640048個の10GE SFP+ポートと4個の40GE/100GE QSFP28ポート、最大880Gbps
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-56606つの40GE/100GE QSFP28と48の10GE/25GE SFP28、最大1.8Tbps
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-506048個の10GE SFP+ポートと2個の40GE QSFPポート、最大560Gbps
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-486048*10GE SFP+、最大480Gbps、機能プラス
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-481048*10GE SFP+、最大480Gbps
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-2410P24*10GE SFP+、最大240Gbps、DPI機能
Mylinking™ ネットワークパケットブローカー(NPB)ML-NPB-6400
48個の10GE SFP+ポートと4個の40GE/100GE QSFP28ポート、最大880Gbps
投稿日時:2022年10月18日

