トピック抽出に基づく開発者の活動に着目したリポジトリ可視化手法  [in Japanese] Repository Visualization Technique Based on Developer Activity Using Topic Analysis  [in Japanese]

Search this Article

Author(s)

Abstract

ソフトウェア開発プロジェクトでは,個々の開発者の活動がソフトウェアの品質に影響を与えると考えられており,開発プロセスの改善にはプロジェクト全体ではなく開発者単位でも行われるべきと考えられている.しかし,開発者の活動を逐一記録するのは困難である.通常ソフトウェア開発では構成管理システムが利用されており,開発で作成・編集されるソースコードや開発における不具合の修正履歴などを記録している.そこで,構成管理システムの 1 つであるバージョン管理システムに記録されたデータから活動を可視化する手法を提案する.まず,ソースコードのコメントや識別子名,システムのコミットログからコミット単位でドキュメントを作成し,それを LDA (latent Dirichlet allocation) を用いてトピックの抽出を行う.次にドキュメントの基になったコミットを行った開発者とドキュメントのトピック分布を用いてトピックの変化を可視化する.最後に抽出されたトピックと可視化されたトピックの変化から開発者の活動を推定する.本論文ではオープンソースソフトウェアプロジェクトの Columba に提案手法を適用し得られた一部の特徴的なトピックを中心に結果と考察を述べる.

During a software development, the activity of an individual developer is considered to affect software quality. Process improvement should be performed on not only a project but also an individual developer. However, it is difficult to keep the record of the activity of a developer continuously. Recent software development uses configuration management systems that keep the record of source file creation and modifications as well as also bug fixes. In this paper, we propose an approach to visualize the activity of an individual developer using the record in a version control system. In the approach, at first, documents for the input of the Latent Dirichlet Allocation are generated from comments and identifiers involved in source code as well as commit logs, and then topics are derived from generated documents. Finally, the evolutions of derived topics are visualized by linking the information on each developer who contributed to the source code and each topic. A user of the proposed approach is expected to understand the activity of a developer from the visualization of the derived topics and their distributions. The case study mainly presents the topics derived from an open source project Columba and the discussion on them.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 2012-SE-178(17), 1-7, 2012-10-25

    Information Processing Society of Japan (IPSJ)

Codes

  • NII Article ID (NAID)
    110009465434
  • NII NACSIS-CAT ID (NCID)
    AN10112981
  • Text Lang
    JPN
  • Data Source
    NII-ELS 
Page Top