導入
近年、中国の産業界におけるクラウドサービスの比率は高まっています。テクノロジー企業は、新たな技術革命の機会を捉え、積極的にデジタルトランスフォーメーションを推進し、クラウドコンピューティング、ビッグデータ、人工知能、ブロックチェーン、IoTといった新技術の研究と応用を強化し、科学技術サービス能力を向上させています。クラウドおよび仮想化技術の継続的な発展に伴い、データセンター内のアプリケーションシステムが従来の物理キャンパスからクラウドプラットフォームに移行するケースが増えており、データセンターのクラウド環境における東西トラフィックは著しく増加しています。しかし、従来の物理トラフィック収集ネットワークでは、クラウド環境における東西トラフィックを直接収集することができないため、クラウド環境における業務トラフィックが第一の領域となっています。クラウド環境における東西トラフィックのデータ抽出を実現することは、もはや避けられない流れとなっています。クラウド環境における新たな東西トラフィック収集技術の導入により、クラウド環境に展開されたアプリケーションシステムは完璧な監視サポートを受けられるようになり、問題や障害が発生した場合には、パケットキャプチャ分析を用いて問題を分析し、データフローを追跡することが可能になります。
1. クラウド環境の東西トラフィックを直接収集できないため、クラウド環境のアプリケーション システムはリアルタイムのビジネス データ フローに基づいて監視検出を展開できず、運用保守担当者はクラウド環境のアプリケーション システムの実際の動作をタイムリーに検出できません。これにより、クラウド環境のアプリケーション システムの健全で安定した動作に一定の隠れたメリットがもたらされます。
2. クラウド環境の東西トラフィックを直接収集できないため、クラウド環境のビジネス アプリケーションで問題が発生した場合に、分析のためにデータ パケットを直接抽出することができず、障害箇所の特定が困難になります。
3. ネットワークセキュリティと、BPCアプリケーショントランザクション監視、IDS侵入検知システム、電子メールおよび顧客サービス記録監査システムなど、さまざまな監査の要件がますます厳しくなるにつれて、クラウド環境での東西トラフィック収集の需要もますます緊急になっています。 上記の分析に基づいて、クラウド環境での東西トラフィックのデータ抽出を実現し、クラウド環境に新しい東西トラフィック収集テクノロジーを導入して、クラウド環境に展開されたアプリケーションシステムが完璧な監視サポートも受けられるようにすることは、避けられない傾向になっています。 問題や障害が発生した場合、パケットキャプチャ分析を使用して問題を分析し、データフローを追跡できます。 クラウド環境での東西トラフィックの抽出と分析を実現することは、クラウド環境に展開されたアプリケーションシステムの安定した動作を確保するための強力な魔法の武器です。
仮想ネットワークトラフィックキャプチャの主要指標
1. ネットワークトラフィックキャプチャのパフォーマンス
東西トラフィックはデータセンタートラフィックの半分以上を占めており、完全な収集を実現するには高性能な取得技術が必要です。取得と同時に、重複排除、切り捨て、感度低下といった他の前処理タスクも各サービスごとに実行する必要があり、パフォーマンス要件はさらに高まります。
2. リソースのオーバーヘッド
東西トラフィック収集技術の多くは、サービスに使用できるコンピューティング、ストレージ、ネットワークリソースを占有する必要があります。これらのリソースの消費を可能な限り抑えるだけでなく、収集技術の管理実装にかかるオーバーヘッドも考慮する必要があります。特にノードの規模が拡大すると、管理コストも直線的に増加します。
3. 侵入レベル
現在一般的な取得テクノロジーでは、ハイパーバイザーや関連コンポーネントに取得ポリシーの設定を追加する必要があることがよくあります。これらのポリシーは、ビジネスポリシーとの潜在的な競合に加え、ハイパーバイザーやその他のビジネスコンポーネントへの負担をさらに増大させ、サービスSLAに影響を与えることがよくあります。
上記の説明から、クラウド環境におけるトラフィックキャプチャは、仮想マシン間のEast-Westトラフィックのキャプチャとパフォーマンスの問題に重点を置く必要があることがわかります。同時に、クラウドプラットフォームの動的特性を考慮すると、クラウド環境におけるトラフィック収集は、従来のスイッチミラーリングの既存のモードを打破し、柔軟で自動化された収集と監視の展開を実現し、クラウドネットワークの自動運用・保守の目標に適合する必要があります。クラウド環境におけるトラフィック収集は、以下の目標を達成する必要があります。
1) 仮想マシン間の東西トラフィックのキャプチャ機能を実現
2) キャプチャはコンピューティングノードに展開され、分散収集アーキテクチャを使用して、スイッチミラーによって引き起こされるパフォーマンスと安定性の問題を回避します。
3) クラウド環境における仮想マシンリソースの変化を動的に感知し、仮想マシンリソースの変化に応じて収集戦略を自動的に調整することができます。
4) キャプチャツールには、サーバーへの影響を最小限に抑えるための過負荷保護メカニズムが必要です。
5) キャプチャツール自体にトラフィック最適化機能がある
6) キャプチャプラットフォームは収集された仮想マシンのトラフィックを監視できる
クラウド環境における仮想マシントラフィックキャプチャモードの選択
クラウド環境における仮想マシントラフィックキャプチャには、コンピューティングノードに収集プローブを配置する必要があります。コンピューティングノードに配置できる収集ポイントの位置に応じて、クラウド環境における仮想マシントラフィックキャプチャモードは3つのモードに分けられます。エージェントモード, 仮想マシンモードそしてホストモード.
仮想マシンモード:クラウド環境の各物理ホストに統合キャプチャ仮想マシンをインストールし、キャプチャ仮想マシンにキャプチャソフトプローブを展開します。仮想スイッチ上の仮想ネットワークカードトラフィックをミラーリングすることで、ホストのトラフィックをキャプチャ仮想マシンにミラーリングし、その後、キャプチャ仮想マシンは専用のネットワークカードを介して従来の物理トラフィックキャプチャプラットフォームに送信され、各監視分析プラットフォームに分配されます。メリットは、既存の業務ネットワークカードと仮想マシンに侵入しないソフトスイッチバイパスミラーリングであり、特定の手段を通じて仮想マシンの変更感知とポリシー自動移行も実現できます。デメリットは、受動的にトラフィックを受信するキャプチャ仮想マシンでは過負荷保護メカニズムを実現できないこと、ミラーリングできるトラフィックサイズが仮想スイッチの性能によって決まるため、仮想スイッチの安定性に一定の影響を与えることです。KVM環境では、クラウドプラットフォームがイメージフローテーブルを統一的に発行する必要があり、管理と保守が複雑になります。特にホストマシンに障害が発生した場合、キャプチャ仮想マシンはビジネス仮想マシンと同じであり、他の仮想マシンとともに別のホストに移行します。
エージェントモード:クラウド環境のトラフィックをキャプチャする必要がある各仮想マシンにキャプチャソフトプローブ(Agent Agent)をインストールし、Agent Agentソフトウェアを介してクラウド環境の東西トラフィックを抽出し、各分析プラットフォームに配信します。利点は、仮想化プラットフォームから独立しており、仮想スイッチのパフォーマンスに影響を与えず、仮想マシンとともに移行でき、トラフィックフィルタリングを実行できることです。欠点は、管理する必要があるエージェントが多すぎること、障害発生時にAgent自体の影響を排除できないことです。トラフィックを分散するために既存の本番ネットワークカードを共有する必要があり、業務のやり取りに影響を与える可能性があります。
ホストモード: クラウド環境内の各物理ホストに独立した収集ソフトプローブを展開することで、ホスト上でプロセスモードで動作し、キャプチャしたトラフィックを従来の物理トラフィックキャプチャプラットフォームに送信します。完全なバイパスメカニズム、仮想マシン、業務用ネットワークカード、仮想マシンスイッチへの侵入なし、キャプチャ方法が簡単、管理が便利、独立した仮想マシンを維持する必要がない、軽量でソフトプローブ取得による過負荷保護を実現できるなどの利点があります。ホストプロセスとして、ホストと仮想マシンのリソースとパフォーマンスを監視し、ミラーリング戦略の展開をガイドできます。欠点は、一定量のホストリソースを消費する必要があり、パフォーマンスへの影響に注意する必要があることです。また、一部の仮想プラットフォームでは、ホストへのキャプチャソフトウェアプローブの展開をサポートしていない場合があります。
現在の業界の状況から見ると、仮想マシン モードはパブリック クラウドで適用されており、エージェント モードとホスト モードはプライベート クラウドで一部のユーザーが利用しています。
投稿日時: 2024年11月6日