自然言語処理学研究室
人間の言葉、知識を構造化
教員
-
教授:渡辺 太郎
-
客員教授:須藤 克仁
-
准教授:上垣外 英剛
-
客員准教授:田村 晃裕
-
助教:坂井 優介
-
客員助教:東山 翔平
-
客員助教:寺西 裕紀
-
客員助教:小田 悠介
研究を始めるのに必要な知識・能力
人間が使っていることば(自然言語)を対象とした研究への熱意が重要です。そのために、数学やアルゴリズムに関する基礎知識、また、新しいことを常に学ぶ知的欲求が求められます。
研究室の指導方針
構文解析、意味解析、データマイニング、機械学習など自然言語処理の各分野に関する様々な勉強会が活動しており、学生はこれらの勉強会にて、研究進捗報告や論文紹介を定期的に行います。毎週全体の研究会を開催し、研究室全体に対する進捗報告も行います。研究テーマを決めた後、勉強会を主宰するスタッフに相談しながら、研究を進めます。研究室内で、専門書の輪読会や国際会議の論文紹介会を開催し、最新の知識や研究動向の把握にも努めています。このように、基礎分野および専門分野における活発な議論の場を設けることで幅広い知識の習得とともに、新しい研究の創出を目指します。
この研究で身につく能力
自然言語処理、機械学習に関する幅広い知識、および自分の研究分野に関する最新の深い知識を得ることができます。また、研究室内外での議論、日本語、英語での論文執筆や国内会議、国際会議での発表を通じて、問題の提起、関連研究の調査、解決法の提案、実験結果の分析といった、研究をする能力を養います。
修了生の活躍の場
大手メーカや様々なIT企業で活躍しています。この3、4年の博士前期課程の学生の就職先、内定先企業は:NTTドコモ、Yahoo!、シャープ、NEC、朝日新聞、ドワンゴ、富士ゼロックス、トヨタ自動車、日本IBM、PFN、ワークスアプリケーションズ、マイクロソフト、グーグル、理化学研究所、情報通信研究機構などです。
研究内容
計算機が言語を理解し言語を生成する、といった自然言語処理を通して、人間がどのように言語を理解し、知識を表現しているのかを解明することが研究テーマです。2020年4月より新しい指導教員となりました。以前の研究を継承しつつ、自然言語処理の基礎および応用分野、深層学習など機械学習の発展に貢献し、新しい研究を続ける予定です
自然言語を解析
自然言語の解析に必要な解析済みのデータ、辞書、文法などの基本的な言語データの構築を行っています。さらに、大規模テキストデータや多言語データを構築するためのツールの開発、および、検索・利用環境の構築を行っています。 アノテーション付きの言語データを利用し、形態素解析、係り受け解析、チャンキング、述語項構造解析などの基礎的な言語解析へ機械学習を適用します。また、深層学習を適用し、単語や文をニューラルネットワークによりモデル化し、大規模テキストデータから学習することで、意味表現および意味構成性に関する研究も行っています。
自然言語から知識獲得
科学技術論文や法律文など、専門分野の文書の言語解析に関する研究、および、知識獲得に関する研究を行っています。専門性の高い大規模な文書データのテキスト部および引用関係の解析と推論技術により、内容理解を伴った文書検索、文書要約、文書間関係解析技術とその実応用環境を構築しています。いくつかの応用分野の研究者との協働による実証研究を通じて、大規模な文献データに隠れた科学的発見、重要文書検索、関連分野の研究動向調査など専門家への強力な支援のみならず、科学政策立案等の動向予測など政策立案者にも利用可能な統合的環境の構築を目標としています。
自然言語を生成
深層学習による機械翻訳や要約、キャプション生成の研究を行っています。対訳データなどの学習データから文章生成に必要な構造を自動的に導出したり、様々な知識を統合することにより、高精度な文章生成の実現を目指しています。
自然言語の教育・学習支援
日本語を母語としない日本語学習者や、英語を母語としない英語学習者を対象に、作文支援や自動誤り検出・訂正、読解支援などの研究を行っています。
研究設備
GPUマシンやマルチコアのクラスタマシンなど多数有しています。
研究業績・共同研究・社会活動・外部資金など
研究業績については次のページを参照してください。
https://nlp.naist.jp/ja/publications
外部資金は、科学技術研究費補助金若手研究Bを獲得するとともに、大型研究費として、JST-CRESTの「構造理解に基づく大規模文献情報からの知識発見」「社会脳科学と自然言語処理による社会的態度とストレスの予測」の主たる共同研究者、および、NEDO委託事業「材料データ構造化AIツール開発」の主たる共同研究者として活動しています。