ランダムフォレストを用いた名前難読化の耐タンパ化性能の評価

書誌事項

タイトル別名
  • An Evaluation for the Performance of Tamper Resistance Transformations for the Identifier Renaming Obfuscation Method Using Random Forest

この論文をさがす

抄録

ソフトウェア内部に含まれる秘密情報を保護するために,ソフトウェア保護技術が広く用いられている.その1つに,プログラム中の秘密情報を秘匿するために,プログラムを読みにくく変更する難読化手法がある.プログラム中のどの特徴に着目して,読みにくく変更するかにより,異なる手法が提案されている.そのなかでも特に広く使われている難読化手法が名前難読化である.プログラム中に含まれる識別子名を意味のない名前に変更することで,可読性を下げる手法である.しかし,名前難読化の耐タンパ化性能はこれまでに議論されたことはない.もし,識別子名の復元が可能であれば,名前難読化手法は脆弱な手法であり,そのことが知られないまま使い続けられていることになる.そこで,名前難読化の耐タンパ化性能の評価のために,逆変換を試みる.特にメソッド名に着目しての復元を試みる.復元のために,難読化手法では変更されにくいメソッドの命令列,そして,メソッド引数の型と戻り値の型に着目する.大量のプログラムを用意し,これらのデータを機械学習にかけ,復元モデルを構築する.そして,復元したいメソッドをモデルに適用し,メソッド名の復元を試みる.Maven Central RepositoryのJavaのデータからモデルを構築し,モデル構築に含まれなかったJavaプログラムを対象に復元を行った.その結果,全体の31.62%の動詞の復元に成功した.また,動詞の意味的な類似度に基づいた評価では,同義語では33.94%,上位語の関係では40.07%のメソッド名の動詞を復元できた.

The software protection is often used to protect the secret information in software. The one of the protection technique is the program obfuscation method. The obfuscation methods change the programs into hard to understand by preserving the input/output specification in order to hide the secret information. Various obfuscation methods were proposed focuses on a specific part of programs. One of them, there is the identifier renaming method. The identifier renaming method (IRM) changes the names of identifiers to meaningless names. IRM is often used because it is easy to implement. However, the performance of tamper resistance transformation of the IRM is not discussed. If we can restore the identifier names, the IRM has a serious vulnerability. Therefore, this paper evaluates the performance of tamper resistance transformation of the IRM by de-obfuscation. Especially, we try to restore the method names. We focus on opcodes, parameter types and return type as the clues of the restoration, which are hard to change by the identifier renaming method. The restoration model is constructed by the random forest from them. In the proposed method, we succeeded in restoration at the rate of 31.62%. On the evaluation based on the semantic similarity of the verb, in the synonym, the method restored at 33.94%. In the relation of hypernym, the restoration was succeeded at 40.07%.

収録刊行物

詳細情報 詳細情報について

  • CRID
    1050282813268911360
  • NII論文ID
    170000150282
  • NII書誌ID
    AN00116647
  • ISSN
    18827764
  • Web Site
    http://id.nii.ac.jp/1001/00195412/
  • 本文言語コード
    ja
  • 資料種別
    journal article
  • データソース種別
    • IRDB
    • CiNii Articles

問題の指摘

ページトップへ