自然言語処理学研究室

人間の知能の本質・言語を読み解く

教員

  • 教授:松本 裕治

    教授:
    松本 裕治

  • 准教授:新保 仁

    准教授:
    新保 仁

  • 助教:進藤 裕之

    助教:
    進藤 裕之

E-mail { matsu , shimbo , shindo }[at] is.naist.jp

研究を始めるのに必要な知識・能力

数学やアルゴリズムに関する基礎知識、それを学ぶことに関する知的欲求が重要です。深層学習をはじめとする様々な機械学習法を適用することが多いので、機械学習の知識も重要です。言語に関する興味ももちろん重要です。

研究室の指導方針

データマイニング・機械学習・リンク解析、構文解析、意味解析、自然言語処理応用など様々な研究グループ(勉強会と呼んでいます)が活動しており、学生はこれらの勉強会の少なくとも一つに正式に属して、研究進捗報告や論文紹介を定期的に行います。毎週全体の研究会を開催し、研究室全体に対する進捗報告も行います。前期課程の秋までに研究テーマを決め、勉強会を主宰するスタッフに相談しながら研究を進めます。研究室内で、専門書の輪読会や国際会議の論文紹介会を開催し、最新の知識や研究動向の把握にも努めています。

この研究で身につく能力

自然言語処理全般に関する広い知識と自分の研究分野に関する最新の深い知識を得ることができます。系列や構造を入出力とする機械学習に関する知識を得ることができます。研究成果は学会発表や論文投稿を積極的に進めており、日本語、英語での論文執筆や口頭発表、ポスター発表の仕方に関する指導もしています。

修了生の活躍の場

大手メーカや様々なIT企業で活躍しています。昨年および今年の博士前期課程の学生の就職先、内定先企業は:NTTドコモ、 Yahoo!、シャープ、NEC、朝日新聞、ドワンゴ、ウェザーニュース、ブレインパッド、ジャストシステム、富士ゼロックス、トヨタ自動車、日本IBM、PFN、ワークスアプリケーションズ、マイクロソフトなどです。

研究内容

人間の知能の本質である言語の理解を対象に、その基盤となる言語解析技術と自然言語処理の応用に関する研究をしています。言語理解のための知識の獲得や知識の体系化なども重要な研究テーマです。

自然言語の解析技術とその支援環境の構築および解析済みデータの蓄積

自然言語の解析に必要な解析済みのデータ、辞書、文法などの基本的な言語データの構築、言語解析のためのツールの開発、および、そのための大規模テキストデータの検索・利用環境の構築を行っています。さらに、多言語辞書管理システムCradle や解析済みの言語データ管理システムChaKiなどを開発し、辞書やコーパスを利用するための様々な支援環境の整備を行っています。また、日本語、英語、中国語辞書の構築を行っています。

統計的機械学習に基づく自然言語処理

近年大規模な言語データの入手が容易になってきており、それを解析したタグ付きデータ
の蓄積も進んでいます。これらのデータを利用し、形態素解析、係り受け解析、チャンキング、述語項構造解析などの基本的な言語解析法へ統計的機械学習法を適用する研究を行っています。

専門分野の文書からの知識獲得に関する研究

科学技術論文や法律文など、専門分野の文書の言語解析に関する研究、および、知識獲得に関する研究を行っています。専門性の高い大規模な文書データのテキスト部および引用関係の解析と推論技術により、内容理解を伴った文書検索、文書要約、文書間関係解析技術とその実応用環境を構築しています。いくつかの応用分野の研究者との協働による実証研究を通じて、大規模な文献データに隠れた科学的発見、重要文書検索、関連分野の研究動向調査など専門家への強力な支援のみならず、科学政策立案等の動向予測など政策立案者にも利用可能な統合的環境の構築を目標としています。

深層学習を用いた単語と文のモデリング

近年盛んになっている深層学習技術を用いて、言語処理への応用を探求しています。主
に単語や文をニューラルネットワークによってモデル化し、大規模テキストデータから単語や言語表現の意味および意味の構成性に関する研究をしています。

言語教育・言語学習支援

日本語を母語としない日本語学習者や、英語を母語としない英語学習者を対象に、作文支援や自動誤り検出・訂正、読解支援などの研究を行っています。

研究設備

GPUマシンやマルチコアのクラスタマシンなど多数有しています。

研究業績・共同研究・社会活動・外部資金など

研究業績については次のページを参照してください。
http://cl.naist.jp/index.php?%B8%A6%B5%E6%C8%AF%C9%BD%B0%EC%CD%F7
 外部資金は、科学技術研究費補助金基盤A、基盤B、若手研究Bを獲得するとともに、大型研究費として、JST-CRESTの「構造理解に基づく大規模文献情報からの知識発見」の代表者、「社会脳科学と自然言語処理による社会的態度とストレスの予測」の主たる共同研究者として活動しています。
 また、理化学研究所の革新知能統合研究センターの知識獲得チームのチームリーダとしての研究活動も行っています。