ロボットラーニング研究室

ロボットを高度に知能化する機械学習・人工知能を極める

教員

  • 特任准教授:松原 崇充

    特任准教授:
    松原 崇充

E-mail { takam-m }[at] is.naist.jp

研究を始めるのに必要な知識・能力

ロボットラーニング(ロボットのための機械学習)は、機械学習・人工知能やロボット工学、制御工学や信号処理、最適化やメカトロニクスなど、様々な分野の融合領域です。自分の得意分野やスキル・経験(ロボットコンテストやプログラミングコンテスト、工作など)を活かして、独自のアプローチを開拓できる可能性もあります。是非、ロボットラーニング研究に挑戦してください。

研究室の指導方針

修士課程では、教員と相談しながら研究課題を設定し、解決方法の探索、数値シミュレーションから実ロボットを用いた実験検証を行います。教員の指導の下で、国際会議発表や英語論文執筆を行い、研究成果を世界に発信することを目指します。博士課程では、意義高い研究課題の発掘から英語論文執筆までを自力で行える自立した研究者への成長をサポートします。

この研究で身につく能力

ロボットラーニングに関する様々な知識に加えて、実ロボットやセンサ、システムインテグレーションおよびデータ収集コスト感覚など、実世界ロボットラーニングシステム構築に関わる様々なスキルとセンスを身に着けられるように指導します。また、研究活動を通じて、基礎・応用研究の進め方、まとめ方、発表の仕方など、社会で活躍できる技術者・研究者に必要な技能を一通り育成します。海外研究機関との連携・交流・インターンを通じて、海外で活躍する人材を育成します。その他、産学共同研究に参画することで、実践的な技能やセンスを育成します。初学者のために、適宜教科書輪講や最新論文リーディンググループを実施します。

修了生の活躍の場

2019年1月に新設された研究室なので修了生はいませんが、ロボットラーニング分野の人材は様々な業界から注目されており、これからの社会に活躍の場は多いと思います。

研究内容

人中心環境で活躍するロボットの高度な知覚・判断・行動機能の実現に向けて、機械学習とロボティクスの融合領域であるロボットラーニング技術とその実世界応用に関する研究を進めています。確率・統計やベイズ理論、ガウス過程や深層学習を用いたロボット応用向きの強化学習アルゴリズム設計から、最先端ロボット設備(Nextage, Baxter, UR5, OP3 Humanoidなど)を用いた次世代産業用ロボットや福祉・介護用人支援ロボットの実用技術および産学共同研究を通じた機械学習・人工知能の社会実装にも挑戦しています。

  • 強化学習
  • 深層強化学習
  • 模倣(見まね)学習
  • 人ロボット協調作業
  • 人支援ロボット
図1:深層強化学習による布操作獲得

図1:深層強化学習による布操作獲得

図2:ガウス過程に基づく物体探索

図2:ガウス過程に基づく物体探索

図3:触覚センシングに基づく形状確率モデリング

図3:触覚センシングに基づく形状確率モデリング

研究業績・共同研究・社会活動・外部資金など

研究業績

(原著論文)
  • Y. Tsurumine et al. :“Deep reinforcement learning with smooth policy update: Application to robotic cloth manipulation,” Robotics and Autonomous Systems (2019)
  • Y. Cui et al. : “Environment-adaptive Interaction Primitives through Visual Context for Human-Robot Motor Skill Learning,” Autonomous Robots (2018)
  • Y. Cui et al. : “Kernel Dynamic Policy Programming: Applicable Reinforcement Learning to Robot Systems with High Dimensional States,” Neural Networks (2017)
  • T. Matsubara et al. : “Spatio-Temporal Synchronization of Biped Walking Patterns with Multiple External Inputs by Style-Phase Adaptation,” Biological Cybernetics (2015)
  • T. Matsubara et al. : “Latent Kullback Leibler Control for Continuous-State Systems using Probabilistic Graphical Models,” The 30th Conference on Uncertainty in Artificial Intelligence (2014)
  • T. Matsubara et al.: “Bilinear Modeling of EMG Signals to Extract User-Independent Features for Multi-User Myoelectric Interface,” IEEE Transactions on Biomedical Engineering (2013)
  • T. Matsubara et al.: "Learning Parametric Dynamic Movement Primitives from Multiple Demonstrations,” Neural Networks (2011)
(解説記事)
  • 松原崇充: ガウス過程に基づくロボットの運動制御・学習-解析的モーメントマッチングによる近似推論, システム制御情報学会誌, Vol. 60, No. 12, pp. 515-520, 2016.
  • 松原崇充: 確率最適制御の近年の動向-確率推論による解法, システム制御情報学会誌, Vol. 59, No. 10, pp. 369-374, 2015.

国プロ等

NEDO 次世代人工知能・ロボット中核技術開発、NEDO 戦略的イノベーション創造プログラム、JST 未来社会創造事業

科学研究費補助金

若手研究A(H28-30)、卓越研究員補助金(H30-31)

企業共同研究

横河電機、東芝、古野電気、日立造船、豊田中央研究所

連携・協力

ATR、産業技術総合研究所、信州大学、立命館大学、関西大学、大阪大学、東北大学、シドニー工科大学(豪)、ラドバウド大学(蘭)、カールスルーエ工科大学(独)、エディンバラ大学(英)など