ソフトウェアバグ予測モデル構築のためのモジュール分類と選定
盛 慎 (1151135)
近年,ソフトウェアの大規模化・短納期化が進んでおり,短期間でソフトウェアの品質を向上させることが求められている.
そのため,テスト工程を効率化すべく,Fault-prone モジュール予測の研究がこれまでにも数多くなされている.
Fault-prone モジュール予測を行う際は,過去の開発データなどを学習用データとした,予測モデルと呼ばれる数学的な確率モデルを構築する.
一般に,未知データである予測対象データと類似した性質を持つデータを用いて構築した予測モデルは,予測精度が高いとされている.
しかし,予測対象と類似したデータをどのようにして作成,または準備するかについては,従来ほとんど研究されていない.
そこで本稿では,Fault-prone モジュール予測の精度向上を目的として「分類」と「選定」という2つの手法を提案する.
評価実験を行った結果,旧バージョンから流用して使われている「流用」モジュールの欠陥を予測する際に,分類を行うことによって,AUC が最大で約 0.02 上昇した.
また選定については,最大で約 0.01 上昇した.
一方で,モジュールの少ないデータセットに対しては,分類も選定も逆効果であることが分かった.