Read/Search this Article
Abstract
パケットサンプリング技術は,フロー統計をスケーラブルに計測する技術として欠かせないものになってきている.実際,今日のISPの多くはサンプルフロー統計をベースにネットワークを監視している.ところで,近年の研究によればフロー統計からトラヒッタパターンを分析することによって,ネットワークに生じる異常を検出できることが明らかになっている.たとえばサイズの小さなフローの数が急激に増加したら,それは大規模なワームの発生に関連している可能性がある.しかしながらパケットサンプリングから得られるフロー統計を分析する場合,そのようなパターンを正しく捉えられない可能性がある.なぜならサンプリングによって小さなフローの大多数がサンプルされないからである.本研究では,実計測データを用いサンプリングによって元のフロー統計がどの程度情報を失うかを示す.つぎに不完全データに対する最尤推定方法であるEMアルゴリズムを用いても,元のフロー統計を正しく推定できないことを実験例を用いて示す.最後に元のフロー統計に関する追加の情報(非サンプルプロー数)を導入することによって,元のフロー統計の推定精度が著しく向上し,結果としてサンプルプロー統計から元のトラヒックパターンの変化を捉えることが出来ることを示す.
Packet sampling has become a practical and indispensable means to measure flow statistics. Nowadays, most of major ISPs are monitoring their networks based on the sampled flow statistics collected at main routers. Recent studies have demonstrated that analyzing traffic patterns is crucial in detecting network anomalies. For example, sharp increase in the number of small flows may be related to an anomalous event such as worm outbreak. We may not be able to infer the original traffic patterns correctly from the sampled flow statistics because sampling process wipes out a lot of information about small flows, which play a vital role in determining the characteristics of traffic patterns. In this paper, we first show an example of how the sampling process wipes out the original statistics using measured data. Then, we show empirical examples indicating that the original traffic pattern cannot be inferred correctly even if we use a statistical inference method for incomplete data, i.e., the EM algorithm, for sampled flow statistics. Finally, we show that additional information about the original flow statistics, the number of unsampled flows, is helpful in tracking the change in original traffic patterns using sampled flow statistics.
Journal
- Technical report of IEICE. CQ [List of Volumes]
-
Technical report of IEICE. CQ 106(356), 43-48, 2006-11-09 [Table of Contents]
The Institute of Electronics, Information and Communication Engineers
Share