開発履歴からのトピック抽出に基づく開発者活動の可視化ツール

山田 悠太 (1151112)


オープンソースソフトウェア(OSS)の開発が活発であり,その品質は商用利用が可能なものであるが,品質の保証やサポートの不備などの課題を抱えている. そのため,不具合が発生した場合,企業はOSSプロジェクトの開発者に連絡を取ることが考えられ,連絡を取るべき開発者を探す必要がある. しかし,多大なソフトウェア開発履歴から特定の開発者を探すのは困難である.
通常,ソフトウェア開発では構成管理システムが利用されており,開発で作成・編集されるソースコードや開発における不具合の修正履歴などを記録している. 本研究では,構成管理システムの1つであるバージョン管理システムに記録されたデータを用い,開発者の活動履歴を可視化する手法を提案する. まず,システムのコミット単位でコミットログコメントから文書を作成する. それを潜在的ディリクレ配分法を用いて文書からトピックを解析する. 解析されたトピックの単語分布と文書に対するトピック分布を用いてトピックメトリクスを求める. そして,求めた解析データから可視化ツールを用いてトピックの変化の可視化を行う.
本発表ではApache Ant, CAROL, jEdit, WALAの4つのオープンソースソフトウェアプロジェクトのリポジトリを対象にトピック解析データを作成し,可視化ツールで開発履歴の情報を提供する. また,リポジトリの情報から問題を作成し,可視化ツールを用いる場合とgitやgrepなどのUNIXコマンドのみを用いる場合の2つの方法で被験者に解答してもらうことで,提案手法の有用性の評価と考察を行った. その結果,可視化ツールはコマンドを用いる場合よりも早く必要な情報を見つけ出すことができることが分かった.