話し言葉の言語的個人性の変換

水上 雅博 (1251101)


個人性とは人間がそれぞれ持つ話者としての特徴である. このような特徴は声に関する音響的特徴,話し方に関する言語的特徴の二つが存在し,それぞれが個人性を表す重要な役割を持っている. 個人性を制御することは,円滑なコミュニケーションを実現する上で重要である.

音声対話システムにおける個人性の制御は声質に関して多く行われている一方で,話し方に関する個人性の制御は多く研究されておらず,性格などの心理学的要因に基づいて話し方の個人性を制御するルールベースによる発話文生成の研究などに限定される. しかしながら,ルールベースによる発話文生成では,ルールが心理学的要因に基づいて汎化されているために,再現可能な話者の基準は「心理学的要素をどの程度持つか」という尺度に抽象化される. そのため,「特定の性格を持つ話者」の発話は生成できるが,「ある特定の個人」独特の発話は再現できない点や,ステレオタイプの話者特徴を表現できない等の問題がある.

本発表では,発話文生成を行うのではなく,発話文に対して言語的個人性の変換を行うことで個人性を制御する個人性変換の手法を提案する. 提案手法では,個人性の変換を「ある特徴を持った日本語」から「別の特徴を持った日本語」への同言語間の翻訳問題とみなし,統計的機械翻訳の技術を用いてこれを解決する. 統計的機械翻訳では本来,同じ意味で変換したい要素が異なる文章対(以下,パラレルデータと呼ぶ)を用いて翻訳規則を学習する.

しかしながら,言語的個人性変換においては同じ意味で異なる個人性を持つ発話文対を集めることは困難であり,単純に機械翻訳を利用することはできない. そこで,翻訳規則をパラレルデータ以外の言語資源から獲得する手法を合わせて提案し,これらを用いて個人性変換を行う. この場合,翻訳規則は同言語間における同じ意味で異なる表現の語彙対、すなわち言い換えであると言える.言い換え表現の獲得の代表的な手法には,シソーラスを用いた同義語の獲得や,n-gram 分布を利用した類似語クラスタリング,また対訳コーパスを用いた言い換え抽出などがあげられる.

本発表では,先述の3手法を用いて言い換え表現を獲得し,それらを用いて個人性変換を行う. 提案手法によって個人性が変換できたかどうかを評価するために,言語モデルを用いた客観的評価と,被験者による主観的評価を行い,その両者の結果から提案手法の有効性を示す.