NAIST-IS-MT1551119: Yoshikawa Masashi

音声認識結果文に対する係り受け構造と言いよどみ箇所の同時推定

吉川将司 (1551119)

音声言語処理において, 言い淀み検出を行うことは重要である.近年の言い淀み検出の手法では, 係り受け解析と同時に解くものが高い精度を示しているが、それらの研究は, 人手で書き起こされたコーパス上で実験を行っており, 実際の応用場面では音声認識プログラムの出力に対して言い淀み検出を行う必要性を考えると, 非現実的な仮定を有している.実際には, 音声認識結果には言い淀みに加え音声認識の誤りが加わるということを考慮しなければならない.本研究では, 音声認識結果に対しても対処することのできる shift-reduce 法に基づく係り受け構造, 言い淀み箇所の同時推定手法を提案する.また, 本手法を評価するためには, 音声認識結果に対して係り受け, 言い淀み箇所の情報が付与されたコーパスが必要であるが、そのようなコーパスは存在しない.そのため、音声認識結果と書き起こし文のアライメントに基づく音声認識結果を用いたデータ作成手法も提案する. Switchboard コーパス上での実験において, 提案手法は従来手法に対して係り受け, 言い淀み検出の両方で精度を上回った.