そこで, 本研究では, 強化学習の中でも連続かつ高次元な状態を扱える, ガウス過程方策を用いた方策探索を提案する. 具体的には, 2つの手法を提案する. 1つ目に, データの効率的使用と過学習の回避を目標に, スパースガウス過程方策を用いた変分推論法を提案する. 2つ目に, ガウス過程方策の単峰性という課題を解決するために, 重複混合ガウス過程方策を用いた方策探索を提案する.
まず, 2つの提案法それぞれに対して, 複数のシミュレーションを行い, 提案法の有効性を確認する. 次に, 実機実験として, 4つ折りに折りたたまれた布の展開タスクを行い, 提案法のロボット制御への有効性を確認した.