サンプルフロー統計から元のトラヒッタパターンを推定する方法(インターネットの品質評価・品質管理技術,ネットワーク品質,トラヒック計測,一般) Inferring original traffic pattern from sampled flow statistics

    • 森 達哉 MORI Tatsuya
    • NTTサービスインテグレーション基盤研究所:国立情報学研究所 NTT Service Integration Laboratories:National Institute of Informatics
    • 川原 亮一 KAWAHARA Ryoichi
    • NTTサービスインテグレーション基盤研究所:国立情報学研究所 NTT Service Integration Laboratories:National Institute of Informatics
    • 上山 憲昭 KAMIYAMA Noriaki
    • NTTサービスインテグレーション基盤研究所:国立情報学研究所 NTT Service Integration Laboratories:National Institute of Informatics

    • 原田 薫明 HARADA Shigeaki
    • NTTサービスインテグレーション基盤研究所:国立情報学研究所 NTT Service Integration Laboratories:National Institute of Informatics

Abstract

パケットサンプリング技術は,フロー統計をスケーラブルに計測する技術として欠かせないものになってきている.実際,今日のISPの多くはサンプルフロー統計をベースにネットワークを監視している.ところで,近年の研究によればフロー統計からトラヒッタパターンを分析することによって,ネットワークに生じる異常を検出できることが明らかになっている.たとえばサイズの小さなフローの数が急激に増加したら,それは大規模なワームの発生に関連している可能性がある.しかしながらパケットサンプリングから得られるフロー統計を分析する場合,そのようなパターンを正しく捉えられない可能性がある.なぜならサンプリングによって小さなフローの大多数がサンプルされないからである.本研究では,実計測データを用いサンプリングによって元のフロー統計がどの程度情報を失うかを示す.つぎに不完全データに対する最尤推定方法であるEMアルゴリズムを用いても,元のフロー統計を正しく推定できないことを実験例を用いて示す.最後に元のフロー統計に関する追加の情報(非サンプルプロー数)を導入することによって,元のフロー統計の推定精度が著しく向上し,結果としてサンプルプロー統計から元のトラヒックパターンの変化を捉えることが出来ることを示す.

Packet sampling has become a practical and indispensable means to measure flow statistics. Nowadays, most of major ISPs are monitoring their networks based on the sampled flow statistics collected at main routers. Recent studies have demonstrated that analyzing traffic patterns is crucial in detecting network anomalies. For example, sharp increase in the number of small flows may be related to an anomalous event such as worm outbreak. We may not be able to infer the original traffic patterns correctly from the sampled flow statistics because sampling process wipes out a lot of information about small flows, which play a vital role in determining the characteristics of traffic patterns. In this paper, we first show an example of how the sampling process wipes out the original statistics using measured data. Then, we show empirical examples indicating that the original traffic pattern cannot be inferred correctly even if we use a statistical inference method for incomplete data, i.e., the EM algorithm, for sampled flow statistics. Finally, we show that additional information about the original flow statistics, the number of unsampled flows, is helpful in tracking the change in original traffic patterns using sampled flow statistics.

Journal

Technical report of IEICE. CQ   [List of Volumes]

Technical report of IEICE. CQ 106(356), 43-48, 2006-11-09  [Table of Contents]

The Institute of Electronics, Information and Communication Engineers

References:  7

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110005717889
  • NII NACSIS-CAT ID (NCID) :
    AN1054106X
  • Text Lang :
    ENG
  • Article Type :
    ART
  • ISSN :
    09135685
  • NDL Article ID :
    8572369
  • NDL Source Classification :
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No. :
    Z16-940
  • Databases :
    CJP  NDL  NII-ELS 

Share