ベクトル空間モデルを用いた参考文献の同定

堀部史郎 (0151094)


ある文献が他のどの文献を参照しているか、 という文献の参照情報は、 その文献の参考文献一覧の各一文(参考文)が指し示している文献を、 文献データベースの中から同定することで獲得できる。 この同定を、 参考文と文献データの単なる文字列の完全一致判定で行なうことはできない。 データに表記の多様性や誤りが存在するためである。 本稿では、参照情報の自動獲得の第一歩として、 重み付きベクトル空間モデルを用いた対象データの絞り込み手法を提案した。 参考文の指す文献がデータベースに存在するものへの絞り込みと、 それに対する文献データ候補の絞り込みの双方で、 本手法の有効性を示した。 また、その次の段階として複数尺度を用いた同定手法を提案した。 尺度間の重みを機械学習によって調整した結果、F値0.989が得られた。