情報検索技術を用いた開発支援システム間の情報統合

谷 宗一郎 (1151067)


本研究では,ソフトウェア開発における保守作業を効率化するために,複数の開発支援システムが各々で管理する情報を自動的に関連づけることを目的とする. ソフトウェア開発プロジェクトでは,不具合票やソースコードを一元管理するバグ管理システムや版管理システムを異なる開発支援システムとして使用していることが多い. 開発者は複数のシステムに関連情報を登録する場合,登録内容に手動で関連タグを付する例えば, 不具合修正のためにソースコードを変更した場合,不具合票にソースコード名,及び,ソースコード(コミット記録)には不具合番号を付する. しかしながら,開発者の多くは関連タグを付しておらず,修正内容の追跡が困難となっている. 本研究では,不具合票やコミット記録などのテキストに含まれる単語を用いて,各システムから自動的に関連情報を抽出するシステムを構築した. そして,そのシステムでの推定のための3種類の検索エンジンを実装,評価した. 検索エンジンは,開発者の経験によって抽出された単語に基づく推定技術,形態素解析によって抽出された単語に情報検索手法TF-IDFによって評価値を与える推定技術,潜在意味解析に基づく推定技術を実装した. オープンソースプロジェクト(なでしこプロジェクト,Eclipseプロジェクト)を対象に評価実験を行った結果,潜在意味解析に基づく推定技術が,バグ管理システムと版管理システムにおける共通する開発コンテキストの推定にもっとも有用であることを確認した.