災害時のTwitterネットワークにおけるクラスタリングを用いた重要アカウント抽出手法の提案と評価

秦 恭史 (1551080)


災害時,情報を広範囲に隅々まで広げることは重要であり,Twitterは情報流通ツールの一つとして有用であることが関連研究により明らかになっている.災害時の情報流通においては,迅速に情報拡散能力の高いアカウントを抽出することは,そのアカウントを基点として情報を広範囲に広げることにつながるため重要である.この課題に対し,石原らはTwitterネットワーク全体から重要アカウントを抽出している.しかし,Twitterネットワークは,ひとつの均質なネットワークではなく,複数のクラスタに分かれたネットワークと考えられる.そのため,ネットワーク全体で重要とされるアカウントが,すべての人々にとって重要であるとは限らない.また,石原らは次数中心性と媒介中心性に着目して重要なアカウントを抽出している.震災時のツイートネットワークは,リプライ,リツイートによるコミュニケーションネットワークとなっており,単にそのアカウントの次数や媒介性だけでなく,他のどのようなアカウントとつながっているかが重要となる.そのため,本研究では新たな重要アカウント抽出指標としてページランクに着目する.ページランクは,「有名なページは有名なページへリンクを張る」という考えに基づいてWebページ間のリンクから,Webページのランク付けを行う指標である.この考えを採用し,重要なアカウントは重要なアカウントとコミュニケーションをとるという考えに基づいて重要なアカウントの抽出を試みる.

本研究では,災害時に情報を広範囲に隅々まで広げる情報拡散手法を実現するために,ページランクを用いた重要アカウント抽出手法および,大規模なTwitterネットワークにおけるクラスタリングを用いた重要アカウント抽出手法を提案する.予備調査として,Twitterネットワークをクラスタリングした結果,578のクラスタに分かれることを確認した.また,情報の拡散具合を「関西電力の節電呼びかけチェーンメール」の事例に基づいて調査した結果,クラスタによって偏りがあることが確かめられたため,提案手法がうまく機能する可能性が示唆された.

提案手法の評価のために,東日本大震災前後である2011年3月10日と12日のデータを使用し検証を行った.評価は従来手法と提案手法を用いた場合の情報拡散度の比較により行った.検証の結果,媒介中心性に対してページランクの方がより高い拡散度を得ることがわかった.また,小規模なクラスタに対してはクラスタリングに基づく重要アカウントの抽出手法が有効であることが確認できた.