非語彙的音声コミュニケーション における韻律の研究

田中 俊光 (0251062)


本研究は, 人間同士の対話音声における自然な発話に近い音声対話システムを見据えた基盤的な研究であり, 将来的には従来の韻律が一意的に決まってしまう読み上げや朗読音声では実現できない自然で表現豊かなシステムの応答を目指すものである.

日常な自然な会話の分析を行い、従来十分使われていなかった非語彙情報(言語的な情報以外)を活用できるように, 発話の機能的側面について調べる. 音声における非語彙情報は主に韻律で表現されると考えられるため研究対象として発話が持つ機能的側面と韻律情報の関連について大規模自然電話対話データベースから統計的な学習を行う.

そこで統計的な学習の手法として基準となり、説明変数同士の関連性への頑健性を考え決定木C4.5を用い, 発話の持つ機能的役割を目的変数とした. この際に説明変数として韻律情報を用い, 発話機能は人の判断が最終的な基準となるため人手付与の発話機能を使用し統計的な識別可能性を検証した.

始めに発話機能について基礎的な分析を行い,複数の発話機能の間での識別の可能性を示し, 対人による発話機能についての影響を調べ相手話者の性別によって発話機能の韻律には明らかに分布が違うことを示す. その後, 6種類の発話機能のフィルターを韻律情報をもとに作成した. その結果各々のフィルターは交差検定を行い8割程度の識別性能を示し、気付きと吸気ノイズについては9割を超え, 説明変数の改良などによりフィルタとして実用化の可能性があるといえる. また韻律情報については直前の発話の発話時間長などは作成した決定木に反映されており, 発話機能に関した文脈のような構造があることも示唆ができる.