本文へジャンプ

研究室紹介

>>研究室一覧へ

<客員研究室>神経計算学研究室

沖縄を拠点に脳の機能を解き明かす

本研究室は、沖縄県恩納村の沖縄科学技術大学院大学(OIST)神経計算ユニットと連携して、脳の柔軟な学習機構の理論化、その神経回路と物質機構の実験的検証、ロボットによる行動学習と進化に関する研究を進めている。課程前半では、基幹研究室にて関連分野の基礎知識を習得し、課程後半からは、主に沖縄を拠点として各自の研究テーマを実施する。


〈教 員〉 教 授 : 銅谷 賢治
准教授 : 吉本 潤一郎
研究室ホームページ
銅谷 賢治 教授
銅谷 賢治 教授

主な研究テーマ

ベイズ推定と強化学習

人間や動物、ロボットが、センサ信号から外界の状況を把握し、試行錯誤をもとに新たな行動を学習する機構を考える上で、ベイズ推定と強化学習は有力な理論的枠組である。特に大脳皮質はベイズ推定に、大脳基底核は強化学習に関与していると考えられ、その実体の解明に向け行動学習中のヒトやラットの脳神経活動記録実験を行っている。また、強化学習課題における報酬期待値、シナプス可塑性を担う細胞内分子反応系など、脳科学のさまざまなレベルで生じる隠れ変数やパラメタの同定問題に対して、ベイズ推定に基づく数理解法を開発し、理論的考察を実験結果と対応づけるための研究を行っている。

ベイズ推定と強化学習イメージ
メタ学習と神経修飾物質

脳における学習の自動調節、すなわち「メタ学習」の機構を理解することは、真に自律的な学習機械を作るためにも、人間の行動と情動の本質的な理解のためにも重要である。脳幹から脳全体に広く投射する「神経修飾物質系」がメタ学習に関与するという仮説をもとに、ドーパミン、セロトニンなどの物質系の機能モデルを構築する。その検証に向け、ラットの脳幹神経核の活動記録、脳内物質濃度計測などの実験を行っている。

メタ学習と神経修飾物質イメージ
学習、進化とコミュニケーション

生物にとって自己保存と自己複製は最も基本的な要請であり、脳神経系、特に報酬系のデザインは、この2つの要請に密接に根ざしている。そのデザイン原理の理解に向け、電池パックの捕獲による自己保存と、赤外線通信によるプログラムの自己複製が可能なロボット「サイバーローデント」を開発し、その多様な環境のもとでの適応に必要な学習と進化、コミュニケーションのメカニズムを探る実験を行っている。

左:サイバーローデントロボット集団、右:学習・進化する歩行ロボット
左:サイバーローデントロボット集団、右:学習・進化する歩行ロボット
視覚-眼球運動系の多階層神経シミュレーション

視覚入力から眼球運動へ至る一連の経路は、脳の感覚と運動制御、注意と情動の機構を探る良いモデルシステムである。各サブシステムのどのような相互作用によってこれらの機構が実現されているのかを解明するために、視覚に関わる様々なレベルのモデルを統合した多階層シミュレーションの実現およびそれに必要な数理手法の開発を行っている。

研究設備

  • 32ch神経活動記録装置
  • 脳内ドーパミン・セロトニン計測装置
  • 「サイバーローデント」ロボット集団

研究室の魅力

脳の学習のしくみを知りたい、脳のように学習する機械をつくりたい、という夢を追って、神経生理学、ロボティクス、機械学習理論、経済学など多様な背景を持つメンバーが集まり日々研究活動に励んでいます。

2012年開学準備中の沖縄科学技術大学院大学(OIST)の東シナ海を望む新キャンパスは、研究員や学生の約半数は海外出身と国際色も豊か、セミナーなどは英語が公用語でまさに国内留学を体験できます。

毎日夕方にはコーヒーブレークの時間を設け、研究上の議論ばかりでなく日常生活の出来事もざっくばらんに話し合うなど非常にアットホームな研究室です。

研究メンバー
研究メンバー

共同研究機関・研究プロジェクトなど

  • 沖縄科学技術研究基盤整備機構 神経計算ユニット
  • 理化学研究所 次世代計算科学研究開発プログラム
    脳神経系研究開発チーム
  • ATR脳情報研究所
  • 玉川大学脳科学研究所
  • Honda Research Institute

卒業生からのメッセージ

2010年3月博士後期課程修了 大塚 誠 さん

研究拠点としているOISTは、生まれも育ちも違う研究者が世界各国から集まる、まさにチャンプルー(沖縄弁で「ごちゃまぜ」の意)状態の研究機関で、本研究室はその中でも特にチャンプルー化がすすんでいる研究室です。強化学習という大きなトピックに対し、各メンバーが持ち味を活かしながら、工学と理学の両方向からアプローチをかけ、研究を進めています。特に本研究室では、最先端の研究を行いつつも、常に、その基礎となる知識を大切にする風潮があります。これは僕の大好きなところで、数々のセミナー等を通して築いた機械学習から計算神経科学にいたる分野の基礎は、今では僕の大きな財産です。沖縄には責任に裏打ちされた本物の自由があります。研究したいことを突き詰めるための、リソースはほとんど揃っています。責任を持ってこの自由を使うと、沖縄で過ごす時間は、人生におけるとても実りの多き季節となることでしょう。

最近の学位論文

博士論文
Makoto Otsuka. (2010). Goal-Oriented Representations of the External World: A Free-Energy-Based Approach.
Takashi Nakano. (2010). Electrophysiological and Molecular Mechanisms of Corticostriatal Synaptic Plasticity.
上岡 拓未. (2009). モジュール構造を利用したニューロコントローラの進化的構造探索法および複数報酬強化学習法の提案. 要旨PDF論文PDF
Tetsuro Morimura. (2008). Efficient Task-independent Reinforcement Learning Methods based on Policy Gradient.
修士論文
木村 慎志. (2010). センサフィードバックを用いたCPG 制御における環境ダイナミクスと観測の不確定性の影響.
小林 幹浩. (2009). 感覚情報の能動的低次元化による強化学習. 論文PDF
Alan de Souza Rodrigues. (2008). Model-Free and Model-Based Reinforcement Learning Strategies in the Acquisition of Sequential Behaviors. 論文PDF
吉田 岳彦. (2008). 遅延と確率的報酬獲得に関わる行動とそのメカニズムの研究.
大塚 誠. (2007). 近傍成分分析による行動指向的状態表現の獲得. 論文PDF
中野 高志. (2007). 線条体シナプス可塑性の分子機構の動力学モデル. 論文PDF