大規模なソフトウェア群を対象とするメソッド単位でのコードクローン検出

石原, 知也, 堀田, 圭佑, 肥後, 芳樹, 井垣, 宏, 楠本, 真二

書誌事項

タイトル別名

ダイキボナソフトウェアグンオタイショウトスルメソッドタンイデノコードクローンケンシュツ
Method Clone Detection for a Large Number of Software Systems

この論文をさがす

抄録

ソフトウェア間にまたがるコードクローンを検出することは，多くのプロジェクトに頻出する処理のライブラリ化による開発効率の向上やライセンスに違反したソースコード流用の特定などの観点から有益である．しかし，既存の研究ではこのようなコードクローンの検出に多大な時間を必要とし，また高速に検出を行うファイル単位の検出手法でもファイルの一部がコードクローンである場合は検出できないという問題点をかかえている．本研究では，大規模なソフトウェア群からメソッド単位のコードクローンを高速に検出する手法を提案する．実験の結果，提案手法は約3億6千万行のソースコードから約4.45時間でコードクローン検出を終了し，検出したコードクローンの40%はファイル単位の手法では検出できないことが確認できた．

Detecting code clones across software systems is useful from the viewpoint that we can discover source code license violations or improve work efficiency by merging common functions into libraries. However, existing methods need much time to detect code clones from software systems and file-based code clone detection, quickly detects code clones from software systems, cannot detect partially-duplicated files. In this research, we propose a method that detects method-based code clones in a huge data set. As a result of experiments, it took about 4.45 hours to detect code clones from about 360 million lines of source code by using the proposed method. Also, we found that 40% of code clones cannot be detected by using file-based code clone detection.

収録刊行物

情報処理学会論文誌

情報処理学会論文誌 54 (2), 835-844, 2013-02-15

東京 : 情報処理学会

詳細情報詳細情報について

CRID: 1050845762833258368

NII論文ID: 110009537081

NII書誌ID: AN00116647

ISSN: 18827764; 18827837; 03875806

NDL書誌ID: 024294990

Web Site: http://id.nii.ac.jp/1001/00090290/; https://ndlsearch.ndl.go.jp/books/R000000004-I024294990

本文言語コード: ja

資料種別: journal article

データソース種別

IRDB
NDL
CiNii Articles

大規模なソフトウェア群を対象とするメソッド単位でのコードクローン検出

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報詳細情報について

書き出し

問題の指摘

大規模なソフトウェア群を対象とするメソッド単位でのコードクローン検出

書誌事項

この論文をさがす

抄録

収録刊行物

キーワード

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について