NIDS評価用データセット:Kyoto 2016 Datasetの作成  [in Japanese] Generating Kyoto 2016 Dataset for NIDS evaluation  [in Japanese]

Access this Article

Search this Article


サイバー攻撃に対する防御法として,ネットワークベース侵入検知システム(Network-based Intrusion Detection System:NIDS)による攻撃の検知があげられる.これまでさまざまなNIDSの高性能化に関する研究が行われ,特に機械学習によるNIDSの高性能化が議論されてきた.これまでNIDSの評価用に使われてきたデータセットには,DARPA Intrusion Detection Data SetsやKDD Cup 1999 Data,Kyoto 2006+ Datasetなどがある.しかしながら,これらのデータセットは作成から期間が経過して最新の攻撃傾向を反映できていないことや,データの収集期間が短いといった問題がある.このため我々は,Kyoto 2006+ Datasetの作成に使用され,現在も稼働し続けているハニーポットのデータを使用して新たにKyoto 2016 Datasetを作成した.本論文では,作成したKyoto 2016 Datasetについて基本的な統計情報を調査した結果を述べる.加えて,Kyoto 2016 Datasetを基本的な機械学習手法によって分類した結果を示すことで,ネットワークベース侵入検知に関する研究を行う研究者へKyoto 2016 Datasetに機械学習を適用する場合の分類精度に関する指標を与える.

Network-based Intrusion Detection System (NIDS) is widely used to counteract cyber-attacks, and thus various studies have been conducted on high-performance NIDS based on machine learning techniques. In the field of intrusion detection, we have famous datasets for evaluation like: DARPA Intrusion Detection Data Sets, KDD Cup 1999 Data, and Kyoto 2006+ Dataset. However, these datasets do not reflect recent trends of cyber-attacks because it has created in well before, and moreover they lack long-period observation. For this reason, we generated Kyoto 2016 Dataset from the traffic data obtained from the honeypot that was used to generate Kyoto 2006+ Dataset and continues operation. In this paper, we describe basic statistical information of Kyoto 2016 Dataset. Furthermore, we provide the results classified by several basic machine learning methods to give guidepost of classification precision for researchers in the field of network based intrusion detection in the case of applying these methods to Kyoto 2016 Dataset.


  • 情報処理学会論文誌

    情報処理学会論文誌 58(9), 1450-1463, 2017-09-15


  • NII Article ID (NAID)
  • Text Lang
  • Article Type
    journal article
  • ISSN
  • Data Source
Page Top