機械学習を利用した構文情報に基づく自動生成ファイルの特定

下仲, 健斗, 鷲見, 創一, 肥後, 芳樹, 楠本, 真二

近年，ソースコード解析に関する研究が盛んに行われている．解析対象のソースファイルの中にはしばしば自動生成ファイルが含まれており，多くの場合自動生成ファイルは解析の対象にはならず除外される．自動生成ファイルを除外する方法として，自動生成ファイル内に存在する特有のコメント文を文字列検索することにより特定するという方法がある．しかしこの方法では，自動生成ファイル特有のコメント文が消された場合に，自動的に自動生成ファイルを特定することができない．また，ソースファイルが自動生成ファイルであるかどうか，1 つずつ目視で特定するのは時間的コストが大きい．そこで本研究では，機械学習を用いて任意の自動生成ファイルを自動的に特定する手法を提案する．提案手法では，ソースファイルの構文情報を学習することで自動生成ファイルであるかどうかを判定する．また，提案手法を評価するために，4 つの自動生成プログラムから生成された自動生成ファイル群を対象に実験を行った．その結果，90%以上の高い精度で自動生成ファイルを特定できることを確認した．

機械学習を利用した構文情報に基づく自動生成ファイルの特定

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

機械学習を利用した構文情報に基づく自動生成ファイルの特定

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について