科学技術論文からのStructured Abstractの自動生成に関する研究

麻生栄樹 (1451005)


研究者にとって,最新の関連研究について把握し,自身が提案する の研究の位置づけを決めるため,学術論文を読むことは非常に重要である. 近年ではインターネットの発達に伴い,論文の検索および閲覧が,自宅からでも 容易に行えるようになった.これにより大量の関連研究を調査し,自身の研究に 役立てることができるようになったわけであるが,インターネットによって 閲覧できる論文の数は,検索による絞り込みを行ったとしても時として 読み切れない量となっており,論文の中から必要な情報を簡潔にまとめ、 抽出する技術の必要性が高まっている。これに応えるタスクが自動要約であり, 本研究で行う学術論文の自動要約となっている. 自動要約における問題の一つとして,文書の要約自体が難しく,人手による 評価にもばらつきがあるため,正解を規定することの難しいというものが挙げられる. この点,学術論文の自動要約においてはほとんどの論文に要約(Abstract)が存在するため, これを指標として要約を行うことができる.ただし、先述の通り要約の作成は人手でも 難しく,論文に付与されているすべての要約がよい要約である保証はない. そこで本研究では,structured abstractと呼ばれる優れた形式に沿った要約を 正解データとして用いることにより,より簡潔に整理された情報を持った要約を 生成することを目指すものである. structured abstract(構造化抄録)とはobjective, conclusions等の見出しによって 構造化され,項目ごとに内容が簡潔にまとめられたabstractの形式である. この形式に沿った要旨を生成することにより,論文内の情報を容易に引き出せることが 期待できる.

あとは、自由に HTML でつくってもらって結構です。なお、全体の分量として は、このページをプリントアウトした時に、A4 一枚程度になるようにしてく ださい。