インスタンス抽出パターンの拡張による語彙獲得

白井 尊昭 (1251053)


特定の意味クラスに属するインスタンス(語彙)を獲得するタスクを語彙獲得と呼び、 「インスタンスと共起するパターン(文脈)の抽出」と 「パターンと共起するインスタンスの抽出」 を反復する、ブートストラップ法による語彙獲得が広く行われている。 ところが、従来の研究では、 1つのパターンは限られたインスタンスとしか共起しない。 本研究では、多くのインスタンスと共起するようにパターンを定義し、 インスタンスとパターンの共起頻度だけでなく、 「シードと共起している項」と「インスタンスと共起している項」 の類似度も用い、インスタンスのスコアを計算する。 評価実験では再現率が向上する場合としない場合があり、その原因について考察を行った。