ゼミナール発表

日時: 5月25日(金)3限 (13:30-15:00)


会場: L1

司会:栗田
ALALI BASEL D 応用システム科学 杉本 謙二 石井 信 平田 健太郎
発表題目:Feedback Error Learning of Writing One Stroke Characters by Two-Link Manipulator. 発表概要:We consider a version of problem how to teach robots to write characters in actual environment. In particular, one must design a feedforward controller for two-link manipulators with good tracking performance in the face of limited knowledge of the surroundings. We employ an adaptive scheme, MIMO-FEL (Multi-Input Multi-Output Feedback Error Learning) to achieve our objective. The effectiveness of proposed method is demonstrated with an experiment.
 
谷口 雄基 1回目 論理生命学 石井 信
発表題目:内部状態を用いた強化学習によるマルチエージェント系における協調行動の獲得
発表概要:マルチエージェント系に対して、強化学習を用いて協調行動を実現さ せようとする研究は広く行われてきた。しかしそのほとんどは、環境の観測が完 全であるマルコフ決定過程を想定したものであり、その環境のもとでは、各エー ジェントは他エージェントの状態を完全に観測できる。しかし実世界における問 題の多くは観測が限定される部分観測環境にあり、他エージェントの状態は部分 的にしか観測できない。本発表では、 方策ベースの強化学習法にマルコフ性を持つ内部状態を導入したIState-GPOMDP を用いることにより、その様な部分観測環境のもとで協調行動を実現できることを実験により示す。また観測を記憶しておくメモリを用いたモデルと比較して、IState-GPOMDPが部分観測環境における協調行動の学習に優れていることを示す。
 
Rodrigues Alan de Souza 1回目 神経計算学 石井 信 銅谷 賢治
発表題目:A Neural Reinforcement Learning Mechanism of Predictive Decision Making
発表概要:Decision making (DM) can be viewed as an action selection process dependent on the agent’s life history, and the demands of the context. Processes such as learning, planning, emotion, and recognition work as sub-components of DM. The goal of my research is to understand how these components interact and what are the neural mechanisms for them. In order to guide agents in the selection of optimal actions based on how future states can be affected, agents have the ability to predict the outcome of actions and to implement actions successfully or at least, to explore action repertoires in order to learn which actions best solve a current problem. In the neuroscience context, it is widely accepted that different brain structures are involved in the process of DM, e.g. prefrontal cortex for attention and planning, striatum for the formation of habitual responses, and amygdala for coding the emotional significance of stimuli. The aim of this study is to investigate, under the approach of the computational theory of reinforcement learning, how the aforementioned neural systems interact to each other while human subjects perform a DM task and have their brains’ activity recorded by fMRI. In addition, we intend to extend our results by investigating how the hippocampus, a memory consolidation system, participates in initial and later stages of DM, a role that is not understood.
 
町北幸太郎 1回目 視覚情報メディア 横矢 直和
発表題目:論文紹介 "Hybrid images"(Aude Oliva and Antonio Torralba SIGGRAPH2006)
発表概要:物を認識する上で人間の視覚は環境により、様々なとらえ方をする。本研究では、視点距離によって物の認識が変わってくる点に着目し、遠距離と近距離によって解釈の違う画像を作成する。手法として2つの画像から遠距離と近距離において認識しやすい情報を取り出し、それらを合成させるという方法を用いる。