木編集距離を用いた類似コード検索器における深層学習モデルの性能評価

抄録

近年の IT 社会の発展によって IT 人材の不足が深刻になり,プログラム自動生成を含むソフトウェア開発の自動化が求められている.多くの研究が行われている中で,プログラム自動生成をより実用的なものとするために,自動生成の過程でソースコード検索器を使用している研究がある.その研究では,求めるソースコードに木構造が近いと推測される類似ソースコードを検索し,自動生成の雛形としている.この手法を用いることで,プログラミングコンテスト AtCoder の解答ソースコードの自動生成において,検索を行わない場合と比較して自動生成できた件数が増加したと報告されている.本研究では,木編集距離を学習に用いたソースコード検索器に着目した.ソースコード検索器の性能に影響を与える要因を調査することで,プログラム自動生成の精度向上への知見を得ることを目指す.調査では,検索精度に影響を与える要因として,深層学習モデルの構造,ソースコードの入力形式,問題の複雑度の 3 つを対象とし,AtCoder の問題を使用して検索精度の比較を行った.調査の結果,類似ソースコード検索において Transformer は有効であることが期待できること,AtCoder の問題に対して抽象構文木の使用は有効性が低いこと,問題の複雑度は検索精度に影響を与えることを示した.

収録刊行物

関連プロジェクト

もっと見る

キーワード

詳細情報 詳細情報について

  • CRID
    1050292572093163264
  • NII論文ID
    170000185278
  • Web Site
    http://id.nii.ac.jp/1001/00212578/
  • 本文言語コード
    ja
  • 資料種別
    conference paper
  • データソース種別
    • IRDB
    • CiNii Articles
    • KAKEN

問題の指摘

ページトップへ