文間の接続性を用いたテキスト分割

大島麻紀子(0051014)


自然言語処理の分野では、いままでに単語や文レベルでの解析が盛んに行われてきた。 形態素解析や係り受け解析などが、その例である。しかし、実際、自然言語を扱おうと すれば、単語、文レベルでの解析だけでなく、文章単位での解析も必要となる。そこで、 本研究では、研究対象として「文章」を扱う。文章構造の解析に関しては、様々な先行 研究が、理論面、工学面からなされている。 日本語を対象とした研究においても複数の研究がなされている。しかし、これまでの研究 の多くは、形式段落をベースにしたものや、表層的な情報を用いたものがほとんどである。 本研究では文間の接続関係を利用して、文章の構造を解析するモデルを提案する。 さらに、接続関係を利用することで、文章中の内容的なまとまり(セグメント)の抽出に 必要な要素/技術を検討し、意味セグメントの抽出の自動化に向けた実験を行なった。
発表では、論文で提案したテキスト構造モデルについて紹介し、構造モデルの要素 である意味セグメントの説明とその自動抽出に向けた試みについて述べる。