強化学習法によるシステム同定誤差を考慮した非線形制御手法

時田 陽一 (0451078)


強化学習(RL)法は制御対象に関する知識を持たずとも制御則を自動的に獲得できる という利点があるため, 近年,cart-poleのバランス制御問題などの自動制御問題に広く適用されている. しかしながら,多くの実問題は非線形で高自由度なダイナミクスを有するため, 「次元の呪い」と呼ばれる問題が発生する. この問題のために,強化学習法による制御則の獲得が困難になる. 本研究では,制御理論などの先見的な知識を利用した強化学習法を提案し, acrobotの自動制御課題に適用した. その結果,我々の開発した手法がシステム同定の誤差に対してロバストな 良い制御器を自動的に獲得できたことを示す.