単語出現頻度を用いたバグ報告のグループ化によるレビューチェックリスト作成

渡邊 正隆(0951134)


ソフトウェアレビューは設計書やソースコードなどの中間成果物から目視で欠陥を見つける品質向上施策である. レビューの主要な支援方法の1つとして,確認すべき質問項目から成るチェックリストを用いて欠陥を発見するCheck-list based readingがある.チェックリストの作成は,熟練者が過去に起こったバグの経験を基に作成するのが一般的である.

本論文では,熟練者を必要としないチェックリストの作成手法を提案する.具体的には,バグの原因や解決方法を記したバグ報告に含まれる単語の出現頻度を用いて,バグ報告のグループ化を行い,チェックリストを作成する.提案手法の評価を目的として,オープンソースソフトウェアEclipseのプラグインGEFのバージョン2.xのバグ報告を用いて作成したチェックリストを用いて,バージョン3.xのバグが防げていたかを確認したところ,バージョン3.xのバグ報告86 件のうち,14 件が作成したチェックリストにより防げていた可能性を示す結果が得られた.また,バグ報告をグループ化する時の単語出現頻度の集計方法として単純に出現頻度とTFIDF を用いてグループ化した場合を比較したところ, TFIDFを用いるほうが低いコストでチェックリストが作成できる結果が得られた.