ゼミナールI講演

日時(Date): 平成28年7月20日(水)3限 (13:30 -- 15:00)
Wed., July 20th, 2016 (3rd Period, 13:30 -- 15:00)
場所(Location): L1
司会(Chair): 中村哲(Satoshi Nakamura)

講演者(Presenter): 南 泰浩(電気通信大学)
Yasuhiro Minami (The University of Electro-Communications)
題目(Title): 強化学習による対話処理
Spoken Dialog Processing by Reinforcement Learning
概要(Abstract): 現在の対話システムでは,対話制御の手法をルールで記述することが一般的である.しかし対話を制御するルールをシステム開発者がすべて手で書くのには限界がある.このため.対話処理の手順を自動的に獲得できる強化学習には大きな期待がかかっている.特に,観測マルコフ決定過程(Partially Observable Markov Decision Process: POMDP)を仮定した対話処理では音声認識や言語処理といったフロントエンドの処理に誤りを含んだ入力に対してその環境下で最も適切な対話制御方策を獲得できるため,その応用が期待されている.本講演では,POMDPによる簡単な対話制御を通してその原理を説明し,ケンブリッジ大学などで行われた研究について述べる.その後,明確なタスクを仮定しない対話にPOMDPを応用したNTTの研究について説明する.POMDPによる対話処理はまだ確立された技術とはいえない.講演者はこの講演を通して,これまで,どういうことを考え,何に悩んできたのかを率直にお話する.

ゼミナール I, II ページへ