ソフトウェアバグ予測モデル構築のためのモジュール分類と選定

盛 慎 (1151135)


近年,ソフトウェアの大規模化・短納期化が進んでおり,短期間でソフトウェアの品質を向上させることが求められている. そのため,テスト工程を効率化すべく,Fault-prone モジュール予測の研究がこれまでにも数多くなされている. Fault-prone モジュール予測を行う際は,過去の開発データなどを学習用データとした,予測モデルと呼ばれる数学的な確率モデルを構築する. 一般に,未知データである予測対象データと類似した性質を持つデータを用いて構築した予測モデルは,予測精度が高いとされている. しかし,予測対象と類似したデータをどのようにして作成,または準備するかについては,従来ほとんど研究されていない.

そこで本稿では,Fault-prone モジュール予測の精度向上を目的として「分類」と「選定」という2つの手法を提案する. 評価実験を行った結果,旧バージョンから流用して使われている「流用」モジュールの欠陥を予測する際に,分類を行うことによって,AUC が最大で約 0.02 上昇した. また選定については,最大で約 0.01 上昇した. 一方で,モジュールの少ないデータセットに対しては,分類も選定も逆効果であることが分かった.