インスタンス抽出パターンの拡張による語彙獲得
白井 尊昭 (1251053)
特定の意味クラスに属するインスタンス(語彙)を獲得するタスクを語彙獲得と呼び、
「インスタンスと共起するパターン(文脈)の抽出」と
「パターンと共起するインスタンスの抽出」
を反復する、ブートストラップ法による語彙獲得が広く行われている。
ところが、従来の研究では、
1つのパターンは限られたインスタンスとしか共起しない。
本研究では、多くのインスタンスと共起するようにパターンを定義し、
インスタンスとパターンの共起頻度だけでなく、
「シードと共起している項」と「インスタンスと共起している項」
の類似度も用い、インスタンスのスコアを計算する。
評価実験では再現率が向上する場合としない場合があり、その原因について考察を行った。