テキスト情報の事実性解析研究の調査

森田 啓 (0751202)


Webから得た情報は,正しいのでしょうか?

Web上に蓄積された情報の中には,多種多様なテキスト情報が存在します. 人々は知りたい事があるとクエリによって検索をし,多くのページの中から 特定のアルゴリズムによってランキングされたテキスト情報を参照することがで きます. しかし,こうして収集された情報には偏りのあることが多く,多数派の情報にの み目が行き,少数派の情報に触れる機会が少なくなるおそれがあります.

我々は,整理された言論を提示する必要があると考えます. そこでは信憑性のある記述かどうか認識していることは大事なことであり, 各テキスト情報間で同じ事を言っているのか異なることを言っているのか,理由 や原因を述べているのかなどの関係を捉えることが大事であると考えています. そうしたテキストの関係を含めて提示する俯瞰図を,我々は言論マップと呼び,その言論マッ プ生成のために研究を進めています.

言論マップ生成のためには,まず書かれた内容が事実なのか仮定の話なのかを判定する必要があります. 書かれた内容が事実かどうかを判断するための基礎的な技術として, ある対象(トピック)に関して書かれた内容が,話者が断定しているのか推量し ているのかといったことや,そしてそれがいつ起こった出来事(や行為) なのかといった時間情報を判別する技術を開発しています. これらの情報を総じて事実性と呼び,我々はこうした事実性を解析する 実験を行ったので報告したいと思います.