半教師ありクラスタリングを用いた動詞辞書への用例付与

上野 孝治 (0551014)


本発表では,クラスタリングを用いて効率的に動詞の語義が付与された用例を 作成する方法について述べる.クラスタリングには,制約付きK-Meansに距離 関数を学習する機構を統合したMPCK-Meansを用いる. さらに,従来のMPCK-Meansを拡張し,名詞といったシンボルを柔軟に素性として組み込めるようにする.

係り受け解析から作成した用例には,格及び格要素の省略がある. 例えば,「太郎は本を購入し,花子に与えた.」という文中の動詞「与える」には,「本を」が 省略されている. 本発表では,このような省略の問題を考慮し,語義の判別に有用な格要素のみを利用するクラスタリングアルゴリズムについても述べる.この手法は,格要素が帰属するメ タなクラスを考慮するための素性として,格要素の隠れクラスへの帰属 確率を用いる.評価実験では,様々な距離関数を用いたクラスタリン グアルゴリズムと比較し,提案手法が精度の観点から有効であることを示す.