自然言語処理学研究室の尾崎 慎太郎さん(博士前期課程1年)、北野 雄士さん(同1年)、坂上 温紀さん(同1年)、鈴木 刀磨さん(博士前期課程2年)、出口 祥之さん(博士後期課程3年)が、NLP若手の会 (YANS) 第19回シンポジウムにおいて表彰されました。(2024/9/6)
NLP若手の会は、自然言語処理、計算言語学および関連分野の、若手研究者および技術者の学問研究および技術開発の促進をはかり、参加者の相互交流および成長の場を提供し、培われた学問研究および技術開発の成果が実社会に応用されることを奨励し、この分野の学問および産業の進歩発展に貢献することを目的として、年に1度、研究シンポジウムを開催しています。第19回シンポジウムは、2024年9月4日-6日に、梅田スカイビル(大阪梅田)にて開催されました。
|
|
奨励賞:尾崎 慎太郎 (博士前期課程1年)
- 受賞研究テーマ Research theme:
"マルチモーダル大規模言語モデルは非言語コミュニケーションを理解しているか?"
人間のコミュニケーションのうち、多くが表情・視線・身振りなど用いた非言語コミュニケーションである。しかし言語や手話などと異なり、非言語コミュニケーションには形式的な規則が存在しないため、常識理解能力を伴う複雑な推論を必要とする。本研究では非言語コミュニケーションの一種である身体表現に焦点を当て、言語モデルが動画中の動作から理解可能かどうか調査することで、現状のVideoLLMの課題を明らかにする。
- 著者 Authors:
尾崎 慎太郎 (博士前期課程1年)、林 和樹 (博士前期課程2年)、大羽 未悠 (博士後期課程1年)、坂井 優介 (博士後期課程3年)、上垣外 英剛、渡辺 太郎
- 受賞者のコメント Awardee's voice
引き続き頑張りたいと思います。
奨励賞:北野 雄士(博士前期課程1年)
- 受賞研究テーマ Research theme:
"多言語モデルの埋め込み表現の理解に向けた独立成分分析による可視化 "
言語モデルの埋め込み表現は様々なタスクで有用だが、その解釈は困難である。従来は埋め込み表現の分析手法にPCAやt-SNEが用いられてきたが、表現の各軸を言語の意味として理解することが難しい。そこで、意味として解釈可能な成分に分離するために独立成分分析(ICA)を用いた分析手法が提案された。この手法を用いることで、各言語を独立に扱う単言語モデルの埋め込みは意味に基づく異方的な構造を持ち、その構造が言語を横断して普遍的であることが示されてきた。しかし、複数の言語を同時に扱う多言語モデルについても同様の構造や普遍性がみられるかは定かではない。
本研究では、ICAによる多言語モデルの埋め込み表現の可視化により、意味を横断した言語に基づく埋め込みの分離と、言語を横断した意味に基づく埋め込みの分離の可能性について検討する。
- 著者 Authors:
北野 雄士 (博士前期課程1年)、西田 悠人 (博士後期課程1年)、坂上 温紀 (博士前期課程1年)、上垣外 英剛、渡辺 太郎
- 受賞者のコメント Awardee's voice
奨励賞をいただいて大変嬉しく思います。
奨励賞をいただいたということは注目されている研究内容だと思うので、この受賞を糧に更に深ぼって研究を進めていきます。
奨励賞:坂上 温紀 (博士前期課程1年)
- 受賞研究テーマ Research theme:
"大規模言語モデルによる読"舌"術"
ことばを話す人間はある音を発音するときの舌の位置を説明できる。これは人間は発話のメカニズムを理解しているからである。テキストのみで学習された言語モデルもまた、ある音を発音するときの舌の位置を説明できる。ではこのような言語モデルも人間が音を発するメカニズムを理解しているのだろうか。本研究では画像や動画を理解可能な言語モデルを対象として、言語モデルが調音方法を理解しているかを明らかにする。具体的には日本語母語話者の母音の発音を記録したリアルタイムMRIを用いて、まず言語モデルが母音調音時の舌の位置を認識できるのかを確認する。次に言語モデルがMRIから母音を推定できるのかを確認する。
- 著者 Authors:
坂上 温紀 (博士前期課程1年)、坂井 優介 (博士後期課程3年)、上垣外 英剛、渡辺 太郎
- 受賞者のコメント Awardee's voice
この度奨励賞にご選出いただき光栄に思います。これも多くの方からいただいた意見があってこその賞であると思います。あらためて、数々の意見をくださった方々に感謝申し上げます。社会に貢献できるよう今後も精進してまいります。
株式会社博報堂テクノロジーズ賞(スポンサー賞):鈴木 刀磨(博士前期課程2年)
- 受賞研究テーマ Research theme:
"言語モデルは人々の意見分布をどのように予測するか "
アンケート調査のように明確な正解が存在しない問題では、その回答分布の予測が重要である。大規模言語モデルがどのように意見分布を予測できるかについて調査した、萌芽的な研究。
- 著者 Authors:
鈴木 刀磨 (博士前期課程2年)、片山 歩希 (博士前期課程2年)、郷原 聖士(博士前期課程2年)、辻本 陵 (博士前期課程2年)、中谷 響 (博士前期課程2年)、林 和樹 (博士前期課程2年)、上垣外 英剛、渡辺 太郎
- 受賞者のコメント Awardee's voice
自然言語処理学研究室に所属する修士2年の学生の共同プロジェクトとして、このような栄誉ある賞をいただけましたこと、大変光栄に存じます。
デモ賞、リクルート賞(スポンサー賞):出口 祥之 (博士後期課程3年)
-
受賞研究テーマ Research theme:
"柔らかいgrep/KWICに向けて:高速単語列マッチングの埋め込み表現による連続化"
パターンマッチングは、テキスト中の特定のパターンが出現する箇所を検索する技術であり、マッチした行を抽出するgrepコマンドや、コーパス言語学の観点で用例検索を行うkeyword in context (KWIC) のように、広く応用されている。最近では、大規模言語モデルの性質を学習事例に帰着させて分析するなど、テキスト検索のニーズが高まっている。既存技術の問題点として、表層的な文字一致に基づいているため、自然言語に顕著な表記揺れや同義語への言い換えに対応できない。一方で、密ベクトル検索は意味的な比較ができるものの、似たトピックの全く異なる文まで粗く検出することがある。本研究では、単語埋め込みを用いて、高速な文字列探索アルゴリズムを連続的に拡張し、柔らかい上に高速な単語列マッチングを実現する。
- 著者 Authors:
出口 祥之 (博士後期課程3年)、鴨田 豪 (東北大学)、松下 祐介 (京都大学)、慶田 開 (京都大学)、和賀 正樹 (京都大学)、横井 祥 (東北大学/理研)
- 受賞者のコメント Awardee's voice
このたびはデモ賞およびリクルート賞に選出いただき大変光栄に思います。今後とも自然言語処理や機械学習の分野に貢献できるよう努めてまいります。
>> 自然言語処理学研究室 Natural Language Processing lab