本研究では、 この問題点を解決することを目指して、 実問題であるていど制御対象のダイナミクスが既知である場合を想定し、 不完全制御器を利用した強化学習法を提案する。 ここで、不完全制御器とは システムの部分線形化や経験則によって 設計された制御器で、それ単体では大域的な制御を行なう能力 を有しない制御器のことを指す。
検証実験として、単振子とacrobotの倒立制御課題に 本手法を適用した。 ここで、acrobotとは第二リンクの間接にのみアクチュエータ を持つ二重振子のことであり、強い非線形性をもった制御課題で ある。 この結果、各部分空間において適切な制御器が選択されるようになり、 非線形力学系に対しても良い制御を実現できることが示された。