使用クラスに基づくソフトウェアの分類

牛窓 朋義 (0851013)


近年,SourceForgeなどのリポジトリサイトを用いたオープンソースソフトウェア開発が盛んに行われており,多数のソフトウェアが一般ユーザに公開されている.ただし,登録されているソフトウェアは必ずしも適切に分類されておらず,必要とするソフトウェアを探し出すことは容易でない.

本研究では,ソフトウェアを客観的に分類することを目的として,ソフトウェアが使用するライブラリクラスの種類と出現回数に基づく教師なし分類,および,教師あり分類を行う方法を提案する.評価実験において,52件のオープンソースソフトウェアを用いて教師なし分類を行った結果,52件のうち,19件のソフトウェアについて妥当な分類を行うことができ,ソフトウェアの分類カテゴリの発見に役立つことが分かった.同様に,教師あり分類を行った結果,52件のうち,40件のソフトウェアを正しく分類できた.このことから,分類カテゴリがあらかじめ決まっている場合には,より高い精度での自動分類が可能なことが分かった.