表層解析データを入力とするアンサンブルニューラルネットワークを用いたマルウェア検知

書誌事項

タイトル別名
  • Static Analysis Based Malware Detection Using Ensemble Neural Networks

抄録

近年表層解析データを入力とする機械学習を用いたマルウェア検知について勾配ブースティング決定木(GBDT)を用いることで高い精度を示すことが確認されている.一方同様のデータに対してDropoutを含む単一のニューラルネットワーク(NN)を用いる手法は研究されているが,バギングやGB のように複数のNNを組み合わせたアンサンブルNNを用いる手法は研究されていない.そこで本研究では従来のNNにバギングやGBを加えたモデル(GBNN)を提案手法として定義しGBDTベースのモデルを既存手法として精度の比較を行った.データセットにEMBER Dataset 2018を用いた検証の結果,全体的に既存手法が優れていたものの誤検知率(FPR)を低く設定した場合の検知率(TPR)について提案手法が優れており,さらに既存手法と提案手法の出力を組み合わせた複合モデルを用いることで全体的に既存手法と同程度の精度を維持しつつFPRを低く設定した場合のTPRを改善させること成功した.この時既存手法におけるFPR 0.01%時のTPRが68.0%であるのに対し複合モデルでは74.9%と5%以上の改善が確認されている.

Recently, gradient boosting decision tree (GBDT) shows high accuracy in static analysis based malware detection using machine learning. But, methods using ensemble NNs have not been studied. In this study, the method in which bagging and GB are added to the conventional NN (GBNN) is defined as the proposed method, and the accuracy is compared with using GBDT as the existing method. As a result of comparison using the EMBER Dataset 2018, the existing method was excellent overall, but the proposed method is excellent in terms of TPR when FPR is set low. Furthermore, it was confirmed that using a composite model combining the outputs of two methods improved TPR when FPR is set low while maintaining the same accuracy as the existing method overall. In this situation, TPR at 0.01% FPR in the existing method was 68.0%, while the composite model was 74.9%, an improvement of over 5%.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050011097134738560
  • NII論文ID
    170000184007
  • Web Site
    http://id.nii.ac.jp/1001/00208414/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ