ネットワークからの情報抽出によるオントロジーの獲得支援

大杉 英一 (9551016)


近年、インターネットなどの情報ネットワーク上で提供される情報は急速に 多様化、大規模化おり、ユーザが必要とする情報を収集・整理・理解す ることは困難になっている。 そのような問題の解決策として、対象領域の概念の記述方法であるオントロジ ーを利用した情報抽出法が提案されている。 しかしこの方法は、オントロジ ーを手動で作成しなければならず労力を要する。

本研究では、ネットワークからの情報抽出を利用したオントロジー獲得支援 法を提案する。 最初に、手動で作成したオントロジーを利用して、サーチエンジンで収集・ 構築したデータ(WWWページ)から情報抽出を行なうIICA2システムを作成し、 評価実験を行なった。 その結果、オントロジーの獲得支援とサーチエンジンから構築したデータの 取捨選択が必要であることが判明した。 そこで、目的の概念に関しするページに共通に存在する重要な単語を、 情報量を用いて選ぶことにより、オントロジーの獲得支援を行なう方 法を考案した。 本手法の有効性を検証するため、本手法を用いて得た概念の構成要素 からデータ分類のための特徴ベクトル作成し、データの再分類実験を おこなった。 特徴ベクトルは空間モデル基づいて計算した。 その結果、本手法が従来法に比べ 高い精度で分類が可能であり、オントロジー獲得支援に 有効であることを発表する。