機械学習を用いたノンバーバル発話の意図自動識別

吉川 哲史 (0651143)


本研究では,ノンバーバル発話の意図識別を実現するために,ノンバーバル発話の意図識別を機械学習によって行う手法を提案する. 近年,音声対話システムが実際に運用されるようになるなど,音声対話についての研究が盛んに行われている. しかし,現状の対話システムは文字情報をベースに対話を行っており,不自然さが残っている. 実際の対話では,「あー」や「んー」などのノンバーバル発話が多く用いられており,これらがリズムをもたらし,対話を円滑にしている. よって,より自然な対話を実現するには,ノンバーバル発話の利用が必要である. しかし,ノンバーバル発話を利用するためには,ノンバーバル発話の持つ,バリエーションが多い,発音が曖昧と言った問題点を解消する必要がある. そこで本研究では,ノンバーバル発話の語彙的に意味を持たない,発音に曖昧性があると言う部分に着目する. 同じ意図を含んだノンバーバル発話は,その発話スタイルに共通の特徴を持つと言う仮説を立て, 同一話者同一表現,他話者同一表現,他話者他表現について,実際に共通性が見られるかを検証する. 本研究では,「肯定・相槌・否定」の3意図に着目する. SVM,HMMを用いた機械学習によって3意図について,同一話者多表現,他話者同一表現,他話者多表現での識別実験を行った結果,発話スタイルの共通性を確認できた.