導入
近年、中国の産業におけるクラウドサービスの割合は増加しています。テクノロジー企業は、新たな技術革命の波に乗ってデジタル変革を積極的に進め、クラウドコンピューティング、ビッグデータ、人工知能、ブロックチェーン、IoTなどの新技術の研究開発と応用を増やし、科学技術サービス能力を向上させています。クラウドと仮想化技術の継続的な発展に伴い、データセンターのアプリケーションシステムはますます従来の物理キャンパスからクラウドプラットフォームに移行し、データセンターのクラウド環境における東西トラフィックは大幅に増加しています。しかし、従来の物理トラフィック収集ネットワークではクラウド環境における東西トラフィックを直接収集できないため、クラウド環境におけるビジネストラフィックが最初の領域となり、クラウド環境における東西トラフィックのデータ抽出を実現することが必然的な流れとなっています。クラウド環境に新しい東西トラフィック収集技術を導入することで、クラウド環境に展開されたアプリケーションシステムも完璧な監視サポートを受けることができ、問題や障害が発生した場合は、パケットキャプチャ分析を使用して問題を分析し、データフローを追跡することができます。
1. クラウド環境の東西トラフィックは直接収集できないため、クラウド環境のアプリケーションシステムはリアルタイムの業務データフローに基づく監視検出を展開できず、運用保守担当者はクラウド環境のアプリケーションシステムの実際の動作をタイムリーに発見することができません。これは、クラウド環境のアプリケーションシステムの健全で安定した動作に一定の隠れた利点をもたらします。
2. クラウド環境における東西トラフィックは直接収集できないため、クラウド環境のビジネスアプリケーションで問題が発生した場合に、分析用のデータパケットを直接抽出することができず、障害特定に一定の困難が生じます。
3. ネットワークセキュリティの要求がますます厳しくなり、BPCアプリケーションのトランザクション監視、IDS侵入検知システム、電子メールや顧客サービス記録監査システムなど、さまざまな監査が求められるようになるにつれ、クラウド環境における東西トラフィック収集の必要性もますます高まっています。上記の分析に基づくと、クラウド環境における東西トラフィックのデータ抽出を実現することは必然の流れとなっており、クラウド環境に新しい東西トラフィック収集技術を導入することで、クラウド環境に展開されたアプリケーションシステムも完璧な監視サポートを受けられるようになります。問題や障害が発生した場合、パケットキャプチャ分析を使用して問題を分析し、データフローを追跡できます。クラウド環境における東西トラフィックの抽出と分析を実現することは、クラウド環境に展開されたアプリケーションシステムの安定稼働を保証する強力な武器となります。
仮想ネットワークトラフィックキャプチャの主要指標
1. ネットワークトラフィックキャプチャのパフォーマンス
データセンターのトラフィックの半分以上は東西方向のトラフィックであり、完全な収集を実現するには高性能な取得技術が必要です。取得と同時に、さまざまなサービスに対して重複排除、切り捨て、感度低減などの前処理タスクも完了させる必要があり、これにより性能要件がさらに高まります。
2. リソースオーバーヘッド
東西トラフィック収集技術のほとんどは、サービスに活用できるはずのコンピューティング、ストレージ、ネットワークリソースを占有する必要がある。これらのリソースの消費を最小限に抑えることに加えて、収集技術の管理実装に伴うオーバーヘッドも考慮する必要がある。特にノードの規模が拡大するにつれて、管理コストも直線的に増加する傾向が見られる。
3. 侵入レベル
現在一般的に用いられているデータ取得技術では、ハイパーバイザまたは関連コンポーネントにデータ取得ポリシーの設定を追加する必要がある場合が多い。これらのポリシーは、ビジネスポリシーとの潜在的な競合に加え、ハイパーバイザやその他のビジネスコンポーネントへの負荷をさらに増大させ、サービスSLAに影響を与えることが多い。
上記の説明から、クラウド環境におけるトラフィックキャプチャは、仮想マシン間の東西トラフィックのキャプチャとパフォーマンスの問題に焦点を当てるべきであることがわかります。同時に、クラウドプラットフォームの動的な特性を考慮すると、クラウド環境におけるトラフィック収集は、従来のスイッチミラーリングという既存のモードを打破し、クラウドネットワークの自動運用保守目標に合致するよう、柔軟かつ自動的な収集および監視の展開を実現する必要があります。クラウド環境におけるトラフィック収集は、以下の目標を達成する必要があります。
1) 仮想マシン間の東西トラフィックのキャプチャ機能を実現する
2) キャプチャは計算ノードに展開され、スイッチミラーによって引き起こされるパフォーマンスと安定性の問題を回避するために分散収集アーキテクチャが使用されます。
3) クラウド環境における仮想マシンリソースの変化を動的に検知し、仮想マシンリソースの変化に応じて収集戦略を自動的に調整できます。
4) キャプチャツールには、サーバーへの影響を最小限に抑えるための過負荷保護メカニズムが備わっているべきである。
5) キャプチャツール自体にトラフィック最適化機能がある
6) キャプチャプラットフォームは、収集した仮想マシンのトラフィックを監視できます。
クラウド環境における仮想マシンのトラフィックキャプチャモードの選択
クラウド環境における仮想マシンのトラフィックキャプチャでは、コンピューティングノードに収集プローブをデプロイする必要があります。コンピューティングノードにデプロイ可能な収集ポイントの位置に応じて、クラウド環境における仮想マシンのトラフィックキャプチャモードは、次の3つのモードに分類できます。エージェントモード, 仮想マシンモードそしてホストモード.
仮想マシンモードクラウド環境の各物理ホストに統一キャプチャ仮想マシンがインストールされ、キャプチャソフトプローブがキャプチャ仮想マシンに展開されます。仮想スイッチ上の仮想ネットワークカードのトラフィックをミラーリングすることでホストのトラフィックがキャプチャ仮想マシンにミラーリングされ、その後、キャプチャ仮想マシンは専用ネットワークカードを介して従来の物理トラフィックキャプチャプラットフォームにトラフィックを送信します。そして、各監視分析プラットフォームに配信されます。利点は、ソフトスイッチバイパスミラーリングにより、既存のビジネスネットワークカードや仮想マシンに干渉することなく、仮想マシンの変更の認識やポリシーの自動移行を一定の方法で実現できることです。欠点は、キャプチャ仮想マシンがトラフィックをパッシブに受信することで過負荷保護メカニズムを実現できないこと、ミラーリングできるトラフィックのサイズが仮想スイッチのパフォーマンスによって決まり、仮想スイッチの安定性に一定の影響を与えることです。KVM環境では、クラウドプラットフォームはイメージフローテーブルを統一的に発行する必要があり、管理と保守が複雑です。特にホストマシンに障害が発生した場合、キャプチャ用仮想マシンは業務用仮想マシンと同じであり、他の仮想マシンと共に別のホストに移行します。
エージェントモード: クラウド環境でトラフィックをキャプチャする必要のある各仮想マシンにキャプチャソフトプローブ(Agent Agent)をインストールし、Agent Agentソフトウェアを介してクラウド環境の東西トラフィックを抽出し、各分析プラットフォームに配布します。利点は、仮想化プラットフォームに依存せず、仮想スイッチのパフォーマンスに影響を与えず、仮想マシンとともに移行でき、トラフィックフィルタリングを実行できることです。欠点は、管理する必要のあるエージェントが多すぎること、障害発生時にエージェント自体の影響を排除できないことです。既存の運用ネットワークカードをspatトラフィックに共有する必要があり、業務上の相互作用に影響を与える可能性があります。
ホストモード: クラウド環境の各物理ホストに独立した収集ソフトプローブをデプロイすることで、ホスト上でプロセスモードで動作し、キャプチャしたトラフィックを従来の物理トラフィックキャプチャプラットフォームに送信します。利点は、完全なバイパスメカニズム、仮想マシン、ビジネスネットワークカード、仮想マシンスイッチへの侵入なし、シンプルなキャプチャ方法、便利な管理、独立した仮想マシンの維持が不要、軽量でソフトプローブの取得により過負荷保護を実現できることです。ホストプロセスとして、ホストと仮想マシンのリソースとパフォーマンスを監視して、ミラー戦略のデプロイをガイドできます。欠点は、一定量のホストリソースを消費する必要があり、パフォーマンスへの影響に注意する必要があることです。さらに、一部の仮想プラットフォームでは、ホスト上でのキャプチャソフトウェアプローブのデプロイをサポートしていない場合があります。
業界の現状を見ると、仮想マシンモードはパブリッククラウドで利用されており、エージェントモードとホストモードはプライベートクラウドで一定のユーザーを獲得している。
投稿日時:2024年11月6日

