NAIST-IS-MT0651117: Shinsuke MATSUMOTO

Fault-proneモジュール判別における外れ値除去法の実験的評価

柗本真佑 (0651117)

本論文では，fault-proneモジュール判別モデルの構築における課題の一つである，データセット中の外れ値（特異なモジュール）による判別性能の低下を改善することを目的とする．そのために，1つの母集団に対する代表的な外れ値除去法であるMahalanobis Outlier Analysis (MOA) とLocal Outlier Factor Method (LOFM) を2クラス（faultあり／なし）の判別に拡張した手法と，2クラスの判別を前提とした外れ値除去法であるRule-Based Modeling (RBM)，及び，新たに提案するCross-Class Mahalanobis Outlier Analysis (CC-MOA) の効果を実験的に比較した．実験では，NASA（アメリカ航空宇宙局）が公開している3つのプロジェクトのデータセットを題材として，MOA，LOFM，RBM，CC-MOAのそれぞれの適用の効果を，3つの代表的な判別モデル（線形判別分析，ロジスティック回帰分析，分類木）について交差検証法により評価した．実験の結果，LOFMを除く3つの外れ値除去法を用いた場合，いずれの判別モデル，データセットに対しても判別精度が改善し，F1値の平均向上幅はMOAでは0.139，RBMでは0.137，CC-MOAでは0.123であった．

Fault-proneモジュール判別における外れ値除去法の実験的評価

柗本 真佑 (0651117)

柗本真佑 (0651117)