発話「うん」の音響的特徴に基づくパラ言語・非言語情報の分析

梅野淳史 (0151015)


本論文は、 音声合成技術による対話音声の制御を目的として、 対話における音声の役割を調べたものである。 音声とパラ言語・非言語情報との関連、 及びパラ言語・非言語情報間の関係を観点とし、 実発話音声を対象に分析を試みた。 音声資料は150時間の会話音声コーパスから抜き出した5時間のデータであり、 パラ言語・非言語情報のラベリングを行なったあいづち発話を選んだ。 音響的特徴には韻律と声質を考慮した。 またテキスト表現の違いによる音声への影響を排除するべく、 分析対象は発話「うん」(2500発話)に限定した。 ラベルと音声の相関、及びラベル間の関係を観察することにより、 以下のことが明らかになった。 (あ)聞き手は話者の状態と対人態度情報を分離して聞いていることが、 ラベルに対する主成分分析により明らかになった。 (い)対人態度ラベルと音声の相関により、 話し手は聞き手との関係を意識した発話を行なっていることを音響的に確認した。 さらに、談話上の文脈が音声へ及ぼす影響を実験を行ない調べた。 「うん」は談話上の意味を3つの異なる応答(肯定・否定・あいずち)として定義できることから、 3種類の応答に基づいた文脈を設計した。 20名の被験者についてその文脈に合った音声の聞き分けの実験を行なった。 その結果、発話が文脈に合わせて音響的に制御されていることが実証された。