Fault-proneモジュール判別のための相関ルールの絞り込み
西川 朋希 (0951090)
ソフトウェア開発において,限られた開発期間で十分な品質を確保することの重要性が高まってきている.
近年,モデルベース手法であるロジスティック回帰分析,ランダムフォレスト,サポートベクターマシン等を
用いたfault-proneモジュール(バグを含む確率の高いモジュール)判別手法が提案されている.しかし,モ
デルベース手法は,モデル式を見ても理解しにくいため,開発現場に受け入れられにくい.そこで本論文では,
ルールベース手法である相関ルール分析を用いたfault-proneモジュール判別に着目する.相関ルールは
「ある条件⇒fault prone」の形式で表され,バグを含む条件が明確である.ただし,ルールが大量に生成されるため,
どのルールに着目すればいいのか分からない点が問題である.そこで,本論文では,判別精度をできる限り下げず
に相関ルールを絞り込むアルゴリズムを提案する.Eclipse Mylynを用いた実験の結果,提案アルゴリズムにより
ルールの数を6065個から62個に減らすことができ,判別精度を表すF1値は0.737から0.731へと0.006の低下に
抑えることができた.