データ重複排除は、ストレージ容量を最適化する人気の高いストレージ テクノロジです。データセットから重複データを削除し、コピーを 1 つだけ残すことで冗長データを排除します。下の図に示すように、このテクノロジにより、増大するデータ ストレージの需要を満たすために必要な物理ストレージ スペースを大幅に削減できます。重複排除テクノロジには、主に次の側面を含む多くの実用的な利点があります。
(1) | ROI (投資収益率)/TCO (総所有コスト) 要件を満たします。 |
(2) | データの急速な増加を効果的に制御できます。 |
(3) | 有効なストレージスペースを増やし、ストレージ効率を向上させます。 |
(4) | 総ストレージコストと管理コストを節約します。 |
(5) | データ転送のネットワーク帯域幅を節約します。 |
(6) | スペース、電源、冷却などの運用および保守コストを節約します。 |
重複排除技術は、データのバックアップやアーカイブシステムで広く利用されています。これは、データの複数回のバックアップ後に大量の重複データが発生するため、この技術に非常に適しているためです。実際、重複排除技術は、オンラインデータ、ニアラインデータ、オフラインデータストレージシステムなど、様々な状況で活用できます。ファイルシステム、ボリュームマネージャ、NAS、SANに実装できます。また、データ圧縮技術はデータのパッケージ化に使用できるため、重複排除はデータの災害復旧、データ転送、同期にも使用できます。重複排除技術は、多くのアプリケーションにおいて、データストレージの削減、ネットワーク帯域幅の節約、ストレージ効率の向上、バックアップウィンドウの短縮、コスト削減に役立ちます。
重複排除には、重複排除率とパフォーマンスという 2 つの主な側面があります。重複排除パフォーマンスは特定の実装テクノロジに依存しますが、重複排除率は、次の表に示すように、データ自体の特性とアプリケーション パターンによって決まります。現在、ストレージ ベンダーは、20:1 から 500:1 の範囲の重複排除率を報告しています。
高い重複排除率 | 重複排除率が低い |
ユーザーが作成したデータ | 自然界からのデータ |
データの変化率が低い | データの変化率が高い |
参照データ、非アクティブデータ | アクティブデータ |
低データ変更率アプリケーション | 高データ変更率アプリケーション |
完全なデータバックアップ | 増分データバックアップ |
データの長期保存 | データの短期保存 |
幅広いデータアプリケーション | データアプリケーションの範囲が狭い |
継続的なデータビジネス処理 | 一般データ業務処理 |
小規模データのセグメンテーション | ビッグデータのセグメンテーション |
細長いデータセグメンテーション | 固定長データセグメンテーション |
認識されるデータ内容 | データ内容不明 |
時間データ重複排除 | 空間データ重複排除 |
重複排除の実装ポイント
Dedupe テクノロジーを開発または適用する際には、さまざまな要素を考慮する必要があります。これらの要素は、パフォーマンスと有効性に直接影響します。
(1) | 何 | どのデータが重み付け軽減されますか? |
(2) | いつ | いつになったら体重は減るのでしょうか? |
(3) | どこ | 減量はどこにありますか? |
(4) | どうやって | 体重を減らすにはどうすればいいですか? |
重複排除の主要技術
ストレージ システムの一般的な重複排除プロセスは次のとおりです。まず、データ ファイルがデータのセットに分割され、各データ ブロックのフィンガープリントが計算されます。次に、フィンガープリントのハッシュ検索キーワードに基づいて、一致するデータが重複データ ブロックであることを示します。一致する場合は、データ ブロックのインデックス番号のみが格納されます。一致しない場合は、データ ブロックが新しい唯一の部分であることを意味し、データ ブロックを保存して、関連するメタ情報を作成します。したがって、ストレージ システム内の物理ファイルは、FP メタデータ セットの論理表現に対応します。ファイルを読み取るときは、最初に論理ファイルを読み取り、次に FP シーケンスに従って、ストレージ システムから対応するデータ ブロックを取り出し、物理ファイルのコピーを復元します。上記のプロセスから、重複排除の主要テクノロジには、主にファイル データ ブロックのセグメンテーション、データ ブロック フィンガープリントの計算、およびデータ ブロックの取得が含まれることがわかります。
(1)ファイルデータブロックの分割
(2)データブロックのフィンガープリントの計算
(3)データブロックの取得
ネットワーク パケット重複排除を開始するための推奨モデルを見つけるには:
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-640048*10GE SFP+ と 4*40GE/100GE QSFP28、最大 880Gbps
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-56606*40GE/100GE QSFP28 と 48*10GE/25GE SFP28、最大 1.8Tbps
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-506048*10GE SFP+ と 2*40GE QSFP、最大 560Gbps
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-486048*10GE SFP+、最大480Gbps、機能プラス
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-481048*10GE SFP+、最大480Gbps
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-2410P24*10GE SFP+、最大240Gbps、DPI機能
Mylinking™ ネットワークパケットブローカー(NPB) ML-NPB-6400
48*10GE SFP+ と 4*40GE/100GE QSFP28、最大 880Gbps
投稿日時: 2022年10月18日