コーパスからの共起情報を用いたシソーラス内の概念構造の再構築

平尾 努(9551089)


計算機による自然言語の理解のためには、膨大な量の語彙に関する知識が必要となる。 このような知識に関する重要な資源の一つとしてシソーラスが考えられる。 しかし、現存するシソーラスには語彙が不十分である、分類の観点が明確でない、などの問題点が指摘されている。

本発表では、機械可読であるテキストデータから得られる共起情報と動詞の働きに着目し、名詞クラスタの特徴を抽出することについて説明する。また、クラスタ間の上位/下位関係を類推し、さらにクラスタ内部の階層構造の決定法についても説明する。

一般に、シソーラスを人間が一から構築するには相当の労力が必要であるが、本研究の成果を用いることによりシソーラス構築時における人間の負担を軽減させることを示す。