国際会議WSDM 2017のコンペティション「WSDM Cup 2017」のTriple scoring taskにおいて、自然言語処理学研究室の佐藤元紀さん(博士前期課程1年)、進藤裕之助教と株式会社Studio Ousiaが共同で開発したシステムが準優勝しました。(2017/2/9)

2017年2月6日~10日、英ケンブリッジで開催された情報科学における著名な国際会議であるWSDM 2017のコンペティション「WSDM Cup 2017」のTriple scoring taskにおいて、自然言語処理学研究室の佐藤元紀君(博士前期課程1年),進藤裕之助教と株式会社Studio Ousiaが共同で開発したシステムが準優勝しました(賞金$750)。
この成果は、NAISTと株式会社Studio Ousiaとの共同研究における成果です。
本コンペティションには、世界中から21チームが参加し、提案した手法は、二位となりました。また、一位は中国の国立研究機関である中国科学院、三位は、情報科学の研究で著名な米イリノイ大学アーバナ・シャンペーン校が獲得しました。
sato&shindo
sato&shindo
  • 受賞研究テーマ
    "ディープラーニングを用いて、Wikipediaにある人物の職業や出身などの属性の妥当性を高精度に推定するモデルを開発 "
    Triple scoring taskは、Wikipediaなどの知識ベース上にある人物の属性についてのユーザから見た妥当性を推定するモデルの開発を目的としています。例えば、「Barack Obama」は、知識ベース上では、政治家、著者、弁護士、教授などの様々な職業が付与されていますが、大半のユーザは政治家として認識して検索等の処理を行ってほしいと考えることが想定されます。このタスクでは、クラウドソーシングを使って作成された少量のアノテーションから、任意の人物に対する属性の妥当性を、Wikipedia等から入手できるオープンな知識を解析することで、高精度に推定することが求められます。
    今回の手法は、ディープラーニングを用いたWikipedia解析の技術を用いて開発されました。また、モデルの特徴として、二つのステップでタスクを解く手法を採用しており、最初のステップで、複数の異なるディープラーニングの分類モデルでタスクを解いた後に、二つ目のステップで、それらの結果をベースにした別のモデル(Gradient Boosting)を学習させることで、高精度なシステムを実現しています。

  • 受賞者 Awardee:
    山田育矢(Studio Ousia)、佐藤元紀(博士前期課程1年)、進藤裕之(助教)

  • 外部リンク Links to:
    WSDM HP: http://www.wsdm-conference.org/2017/

>> 自然言語処理学研究室 Computational Linguistics lab.