カルバック・ライブラー制御の合成理論に基づく最適制御問題の高速近似解法

名前 朝倉高也 (学籍番号1451003)


 現代社会においてロボットが求められる実応用の需要は急速に高まってきている. この50年,産業用ロボットが活躍する場面は溶接,塗装, 組立,物品搬送と拡大の一途をたどってきた.
近年では人間とのインタラクションを考慮した柔軟で安全なロボットの開発なども期待されている.

しかしながら一般にこれまでのロボットの制御はロボットに目標動作を与えてそれを再現させる だけにとどまることが多く,周囲環境や外的要因による自己状態の変化に対応した動作をする 事は難しかった. 動的環境下におけるロボットの制御では決められた動作の繰り返しだけではなく,状況に応じて目的を 達成するための動作を高速に計画することが求められる.

これに対して近年,最適制御をロボット制御に用いる研究が注目されている. 最適制御とは制御対象の望ましい状態(目標)をコストにより記述し, そのコストを最小化するような制御則を生成する制御手法を指す. コストによって現実の問題を柔軟に記述できることから,多様な目標への動作制御に応用できる.

一般に最適制御問題はHJB方程式を解くために 数値解析手法や, 制御対象を解析解の導出できる近似モデルで表した近似的な解析解を得る方法が多く用いられる. しかしながらそれら数値解析手法はいずれも一般的に何らかの繰り返し計算を有するため, 複雑な制御対象の解析を実時間で行うことは難しい.

 そこで本研究では事前に求めておいた複数の最適制御則の線形結合を取ることで 新しい最適制御則を求める手法に注目する. そのような最適制御則の合成を行える枠組みとしては 確率最適制御の特殊クラスであるカルバック・ライブラー制御(KL制御)と 呼ばれる手法が存在する.

KL制御は問題設定に特定の制限を付けることで ベルマン方程式を線形な関係で記述することが可能となる特殊な最適制御クラスである. 制限の一つとして離散状態空間におけるKL制御においては逐次コストをKLコストとして与えるためKL制御と呼ばれる. またKL制御においては線形ベルマン結合法(Linear Bellman Combination:LBC)によって あらかじめ複数のコスト関数(基底コスト関数)について最適制御則(基底制御則)を求めておけば, それら基底制御則の線形結合によって 新しいコスト関数(合成コスト関数)の最適制御則が得られる. 単純な線形結合によって合成コスト関数の厳密な最適制御則を導出できることから, ロボットの新たな動作生成を行う場合に過去の類似動作を再利用するなどといった計算時間の短縮が見込まれる. 本研究ではそれら過去の線形ベルマン結合の理論研究を生かした実用的なアルゴリズムの開発を目指す.