知識グラフ埋め込みを用いたエンティティリンキングの゙候補生成

堀口博 (1811244)


エンティティ・リンキングは,文書あるいは一文中に存在する曖昧性を持つ文字列(メンション)を,その周辺文脈などを手がかりに知識グラフ内に存在する実体(エンティティ)と紐付けるタスクである.従来のエンティティ・リンキングはその殆どがWikipediaとの紐付けを行っており,対象とされる文書もWikipediaが持つエンティティが現れる分野(一般分野)に限られる.メンションに紐付けする知識グラフ内エンティティの候補生成時には,同名辞書(Alias Table)が使用される.Alias TableはWikipedia内のハイパーリンクやウェブ上のコーパスから構成される.分野が一般分野と異なる場合,対象知識グラフがハイパーリンクを持つとは限らない.この場合,Alias Tableの構成にはメンションおよびエンティティの表層形が主に用いられ,一般分野と比して小規模なものとなる.これに起因して,当該分野のエンティティ・リンキングを行う際に,メンションに対するエンティティの候補生成が失敗する場合がある.本研究では生物医学分野におけるエンティティ・リンキングについて, 知識グラフ埋め込みを用いたエンティティの候補生成により,エンティティ・リンキング時における候補生成率および正解率の向上を目指す.提案手法を適用した結果,正解エンティティを候補集合内に含むメンションの増加および,リンキング正解率の向上に成功した.