Fault-proneモジュール判別における外れ値除去法の実験的評価
柗本 真佑 (0651117)
本論文では,fault-proneモジュール判別モデルの構築における課題の一つである,データセット中の外れ値(特異なモジュール)による判別性能の低下を改善することを目的とする.
そのために,1つの母集団に対する代表的な外れ値除去法であるMahalanobis Outlier Analysis (MOA) とLocal Outlier Factor Method (LOFM) を2クラス(faultあり/なし)の判別に拡張した手法と,2クラスの判別を前提とした外れ値除去法であるRule-Based Modeling (RBM),及び,新たに提案するCross-Class Mahalanobis Outlier Analysis (CC-MOA) の効果を実験的に比較した.
実験では,NASA(アメリカ航空宇宙局)が公開している3つのプロジェクトのデータセットを題材として,MOA,LOFM,RBM,CC-MOAのそれぞれの適用の効果を,3つの代表的な判別モデル(線形判別分析,ロジスティック回帰分析,分類木)について交差検証法により評価した.
実験の結果,LOFMを除く3つの外れ値除去法を用いた場合,いずれの判別モデル,データセットに対しても判別精度が改善し,F1値の平均向上幅はMOAでは0.139,RBMでは0.137,CC-MOAでは0.123であった.