強化学習を用いた動的光パス設定の公平性改善に関する研究
小渕 周 (0951056)
WDM ネットワークに光パスを動的に設定する時,伝送ホップ数の違いによって,棄却率に差が生じてしまう.特に,分散制御環境では,送受信ノード間の伝送ホップ数が未知であるため,伝送ホップ数に関する公平性を改善することは容易ではない.そこで本発表では,光パス設定の不公平性を改善するために,強化学習とベイズ推定を用いた動的光パス設定法を提案する.提案手法では,光パス設定要求を受けとったノードが経過ホップ数の情報を基にベイズ推定によって伝送ホップ数を推定する.そして推定した伝送ホップ数から,強化学習によって光パス設定要求の受け入れ可否を決定する.この強化学習では,伝送ホップの長い光パス設定を受け入れることで,多くの報酬を獲得できるため,公平性の改善が期待できる.提案手法の性能をシミュレーションによって評価し,提案手法の効果について述べる.