反復型軌道積分最適制御の近似解法に関する検討

安並健太郎 (1151109)


動的システムの挙動が確率的に決定される非線形確率最適制御問題に対する最適制御則の導出方法の一つである軌道積分確率最適制御法(PI:Path Integral control)では, 最適解を既知関数の期待値の形で効率的に求められるが,制御対象とコスト関数に特殊な仮定を要するため適用対象が制限される. この制限を取り除くため,近年,そのクラス拡張手法である反復型軌道積分確率最適制御法(IPI:Iterative Path Integral control)が提案された.この手法は上述の制限を解除し,より広いクラスの問題を扱えるようにするだけでなく,PIの数値計算上の問題にも対処できる可能性があるが, その計算にはシステムの動作軌道のサンプルが膨大に必要なため,実用的な近似解法が重要であると考えられる.

本発表では,IPIの近似解法として,局所LQA(Linear Quadratic Approximator)に基づく近似解法と, 最近傍回帰に基づく近似解法という2種類の解法について提案し,有効性を検証するためのシミュレーション結果と今後の展望について述べる.