データ駆動知識処理研究室(国立研究開発法人情報通信研究機構)

ビッグデータにどっぷり浸かって、知的で大規模な自然言語処理システムを作り、社会問題の解決に貢献しよう。

教員

  • 教授:樋口 隆弘

    教授:
    鳥澤 健太郎

  • 准教授:飯田 龍

    准教授:
    飯田 龍

E-mail{ torisawa, ryu.iida } [at] nict.go.jp

研究を始めるのに必要な知識・能力

数学やプログラミングの知識があれば有用ですが、知識がなくても一から勉強できます。むしろ、物事を大胆かつ精密に、またしつこく集中して考えること、そして新しい知識の吸収に貪欲になることが重要です。

研究室の指導方針

本研究室の教員は、情報通信研究機構(NICT)・データ駆動知能システム研究センター(DIRECT)に勤務しており、そこにはACL等の有力国際会議で論文を多数発表している研究者や、プログラマ、言語学者が在籍し、多くの自治体、企業等と連携しつつ、ビッグデータを使った自然言語処理の研究開発を行っています。ビッグデータ、自然言語処理や深層学習等の専門知識や社会貢献に関して、教員だけでなく、これらの人たちとも議論をし、多様な視点を学んでもらえればと思います。また、希望者は自治体の防災訓練等、実社会での応用の現場経験もできます。

この研究で身につく能力

近年、自然言語処理、人工知能の分野では深層学習が注目を集めており、精度の高いニューラルネットワークを設計できる能力が重要になっています。本研究室ではそうした能力を養ってもらう他、ビッグデータを取り扱う大規模自然言語処理システムをデザイン、開発するための大局的視点も学んでもらいたいと思います。これは解決すべき社会問題や自然言語処理、人工知能の将来像を深く考え、それをもとにシステムのアーキテクチャを決定するということです。我々は50名以上の専属の作業者にオリジナルの機械学習用学習データを作ってもらう体制を持っているため、解くべき問題の設計とそれに基づいた学習データの作成から研究を開始することが可能ですが、これは日本ではまれな経験だと思います。

修了生の活躍の場

今年度より発足する研究室ですので奈良先端大での修了生はまだいませんが、教員の前職である複数の大学で指導した学生や、過去に情報通信研究機構に在籍し、教員の指導を受けた研究者は、大学教授、大手ネット企業からベンチャーに至るまで様々な職場で活躍しています。

研究内容

ビッグデータを用いた知的な対話システムに関する研究

NICT・DIRECTでは、社会に貢献できる自然言語処理システムを目指し、Web40億ページに書かれた知識を用いて雑談も含めた対話を行い、多様な知識を提供できる音声対話システムWEKDA (https://www.nict.go.jp/press/2017/10/24-1.html)や、 SNS上の災害情報を分析するDISAANA(https://disaana.jp/にて公開中)、D-SUMM(https://disaana.jp/d-summ/)を開発してきました。今後はこれらをベースに、健康で充実した生活をおくってもらうために高齢者と対話する対話システムや、災害時に被災者からの被害情報の収集・提供を行えるスマホ上の対話システムを研究開発するプロジェクトを推進していきますが、本研究テーマではそれらのプロジェクトには拘らず、ビッグデータを使った知的な対話やディベートを行う技術一般を研究します。研究課題の例としては、「教育目的の対話システムの対話制御技術」、「雑談破綻時の話題・対話戦略修正技術」等が考えられます。

ビッグデータを用いた質問応答、仮説生成手法に関する研究

大規模なWebページ等から知識を取り出す質問応答技術や、取り出された知識からイノベーティブな仮説を生成する技術を研究します。DIRECTの質問応答システムWISDOM X (https://wisdom-nict.jp/#top)は「なぜ」や「どうなる」等の質問にWeb40億ページを元に回答する他、仮説の生成も可能で、科学論文を先取りする仮説を作ることにも成功していますが、ここでの仮説は科学的仮説には限りません。小説のストーリーも一種の仮説と考えられます。対話システムが仮説として生成されたストーリーを勝手に語り始めたら面白いと思いませんか? 研究課題の例としては「長文の回答を要する質問に高精度で回答できる質問応答技術」、「質問応答技術を用いた仮説生成によるストーリー生成技術」等が考えられます。

ビッグデータに適用するための自然言語処理基盤技術の研究

これまでに説明してきた技術には自然言語処理の基盤技術である構文解析や意味解析、文脈解析等が必要です。本テーマでは、ビッグデータに適用可能なそうした基盤技術を研究します。

研究設備

500台以上のサーバー、500枚以上のGPGPU、200億件のWebページ、Twitterに関しては日本語ツイートの10%をリアルタイムで取得。

研究業績・共同研究・社会活動・外部資金など

研究業績は、https://direct.nict.go.jp/publications/をご覧ください。 特に平成30年度には国のフラッグシッププロジェクトで、以下の二件のプロジェクトを開始しました。

I. 内閣府・戦略的イノベーション創造プログラム(SIP)第2期「ビッグデータ・AIを活用したサイバー空間基盤技術」:
「Web等に存在するビッグデータと応用分野特化型対話シナリオを用いたハイブリッド型マルチモーダル音声対話システムの研究」(分担者) 、研究開発責任者:KDDI株式会社 滝島 康弘、初年度予算総額8.5億円。詳細はhttps://www.nict.go.jp/info/topics/2018/12/10-1.htmlを参照

II. 内閣府・戦略的イノベーション創造プログラム(SIP)第2期「国家レジリエンス(防災・減災)の強化」:
「テーマI 対話型災害情報流通基盤の研究開発」(分担者)、研究責任者:(国研) 防災科学技術研究所(NIED) 臼田裕一郎、2018年度全体予算1億円

特にIIでは、神戸市において実証実験を実施しております。詳細は以下をご覧ください。また、本実証実験は平成31年1月17日放映のNHKスペシャルで放映されました。

https://www.nict.go.jp/info/topics/2019/01/16-1.html
https://www.sankei.com/west/news/190113/wst1901130012-n1.html

そのほか、テレビ、新聞、Web等でWEKDA、DISAANA、D-SUMM等に関して平成30年度だけで100件以上の報道がなされています。