情報連鎖に基づく情報処理の提案
-- 時事ニュースにおける情報連鎖抽出機構の試作 --

沼田 成弘 (9751083)


インターネット上の情報源の中には、次々と新しい情報を発信している 情報源が多く存在する。 例えば、新聞社などによってニュース記事が提供されているWWWサーバ がその一例である。 このような情報源においては、時間的に前後のつながりをもった情報が、 次々と出現する場合が多い。

時間的なつながりとは、例えば次のような ことである。すなわち、はじめ大まかな内容を伝えておいて、詳しい ことが分かりしだい、続報でさらに伝えるようなこと。 また、一つの原因から次々と別の結果に発展していくことである。 このつながりをもった情報のまとまりを とらえるために、情報連鎖を次のように定義する。

関連する情報の全体を把握するために情報連鎖をまとめて取り扱うことが望ましいが、 古い情報から順に削除されたり、別々の情報源に分散して存在していて、 まとめて取り出すことが難しいという問題がある。

本研究では上記の問題を解決するために、まず分散した情報を集めて蓄積し、 蓄積された情報の中から情報連鎖を抽出し、 情報連鎖に基づく情報処理、すなわち情報連鎖を一つのまとまりとして 情報の検索、表示といった処理を行うことを提案する。

また提案した処理が有効であることを確認するために、 時事ニュースを情報源として、 時間的につながりのある情報のまとまりとして情報連鎖を抽出する機構を 試作した。 これにより、 断片的な情報だけでは十分にわからなかった、関連する情報の 全体を把握することができるようになった。

関連が高い情報の集め方は、どのくらいの期間の 記事を同時に扱うかなどにより単語とその出現頻度から求めた類似度を 利用するのがよい場合や、キーワードを用いるのがよい場合がある。