ロボット対話知能(理化学研究所)

「人と共生するロボット・システムの対話知能」を目指して

教員

  • 吉野 幸一郎

    教授:吉野 幸一郎

  • 湯口 彰重

    助教:湯口 彰重

研究を始めるのに必要な知識・能力

本研究室で取り扱う内容は複合領域であることから、分野外からの受験生も歓迎します。一番必要なのは、人間の知能に対する興味や好奇心、興味を持った内容を明らかにしたいという熱意、そしてそれを何としてもやり遂げるという覚悟です。

研究室の指導方針

特に1年目前期は、教員と面談を繰り返して、自身の興味と研究室での取り組みを照らし合わせながら研究の大まかな方向性を決めます。必要な授業を終えたら、拠点を連携研究室に移して研究を進めます。皆さんの好奇心を大切にしつつ、自身の問題(研究テーマ)に対して主体的に取り組む能力を伸ばすことを重視します。数学、情報学の基礎(アルゴリズム、データ構造、情報理論など)、コンピュータプログラミング(特にPython)などの勉強をしておくと、入学後のテーマ選択の幅が広がるでしょう。

この研究で身につく能力

学生の皆様には、研究活動を通じて物事の多様な見方と論理的思考法、特に問題の切り取り方や仮説の立て方、実証の仕方、そして議論や言語化の方法といったスキルを身に着けて頂きたいと考えています。物事に対して論理的に向き合い、言語化を行い、また議論によって異なるロジックと対峙する方法は、人生の中でどのような分野に進んでも重要な能力です。今後の人生で、学生時代に取り組んだ研究とは異なる分野・内容に進む人も多いでしょう。そうした中で、上記のような論理的に物事を整理し考え実証できる力は、どのような分野に行っても役に立ちます。また、この研究室で取り組む研究内容は非常に学際的で、様々な異分野を統合し、物事を俯瞰的に見る力も身に付きます。そうした様々な分野に触れる経験の中で、絶えず自身の価値観を更新し、多様な物事に好奇心を持って取り組んでいけるような感性を磨いて頂きたいと思います。

修了生の活躍の場

2022年4月から発足した研究室なので修了生はいません。過去にNAISTで指導を行った学生は、博士課程修了者は大手企業の研究所(NTT、NEC、Hondaなど)、国立の研究所(理研など)、大学(NAIST、海外の大学など)などで活躍しています。修士課程修了者の就職先もDocomo、Panasonic、SHARP、Yahoo!JAPAN、サイバーエージェント、コナミ、その他大手企業のIT部門など、様々です。博士進学者は3割程度で、特に研究職に就きたい方には博士進学をお勧めしています。

研究内容

「人と共生するロボット・システム」の対話知能を実現するという目標の元で研究を進めています。対話機能の実現のため、理解、制御、生成のそれぞれの課題について取り組みます。実世界で動作する対話機能を実現するため、理解・生成の研究ではそれぞれ言語を中心に、音声、画像、ロボット動作などの多様なモダリティを利用します。対話制御、思考、推論、知識構造などの仕組みについても取り扱います。

言語理解・状況理解

言語理解というのは、自然言語で記述された内容を機械が扱うことができる形にすることを指します。こうした言語・発話の内容理解を中心に、言語以外の様々な情報も入力として用いて、対話の場におけるユーザの状況を正しく理解するための研究を行っています。この中で、自然言語処理における形態素、係り受け、述語項構造、照応、共参照、談話構造解析などのテーマにも取り組みます。

知識獲得・記憶のメカニズムの解明

対話や日々の観測を通じて保存した知識は、人やそれを取り巻く状況を正しく理解する上で重要です。対話を通じた知識獲得の形を研究し、長期的に人と共生するロボット・システムの構築に役立てる研究を行っています。また、こうした構成論的研究を通じて人の記憶のメカニズムを解明することも目標です。

意図、対話モデル、推論、制御、意思決定

理解や知識の獲得結果をもとに、ある目的に応じて対話システム・ロボットがどのような応答をすればよいのか、どのように振る舞うべきか決定する研究を行っています。特に強化学習を用いて意思決定の長期的な影響を利用することに興味があるほか、強化学習のアルゴリズムそのものについても問題に合わせた適切な形を模索します。また、対話の様々な現象、たとえばポライトネスやエントレインメントを考慮することでどのように対話モデルや意思決定モデルが影響を受けるかについても調査します。

言語、音声、動作の生成

ニューラルネットワークの登場により、自然な言語、音声などが容易に生成できるようになりました。本研究室では生成システムを生成された意図に基づいて動作させるため、生成システムの制御性と、制御結果が対話相手である人に及ぼす影響についての研究を行います。意図に応じて、言語のほか、ロボットの動作についても生成を行います。

研究設備

  • 深層学習向けGPUサーバシステム(NVIDIA GTX3090など30GPU)
  • 高速オールフラッシュストレージシステム(100TB SSD)
  • 深層学習用ストレージシステム(100TB HDD)
  • アンドロイド型ロボットNikola、アンドロイド型ロボットERICA(ATRより借用可能)
  • 自律型ロボットぶつくさ
  • ピッキングロボットStretch
  • コミュニケーションロボットCommU、SOTA
  • 高速収録システムを備えたリビング型実験室
  • モーションキャプチャー室
  • 音響実験室
  • 工作室
  • 各実験室と理研オフィスを模した仮想環境

研究業績・共同研究・社会活動・外部資金など

おもな研究業績:

https://grp.riken.jp/labs/knowl_acqui_dialogue/

外部資金等:

理化学研究所所内の基盤研究費のほか、科研費基盤研究 (B) (代表: 吉野 幸一郎)、科研費新学術(対話知能学)を獲得しており、これまでもJST-さきがけなどの獲得実績があります。また、民間企業との共同研究も行っています。