中間言語モデルを用いた多言語機械翻訳の精度向上

三浦 明波 (1451101)


統計的機械翻訳において,特定の言語対で十分な文量の対訳コーパスが得られない場合,中間言語を用いたピボット翻訳が有効な手法の一つである. 複数のピボット翻訳手法が考案されている中でも,特に中間言語を介する2つの翻訳モデルを合成するテーブル合成手法で,高い翻訳精度を得られることが知られている. ところが,従来のテーブル合成手法では,フレーズ対応推定時に用いた中間言語の情報は消失し,翻訳時には利用できない問題が発生する. 本研究では,合成時に用いた中間言語の情報も記憶し,ピボットの言語モデルを追加の情報源として翻訳に利用する新たなテーブル合成手法を提案する. また,欧州議会議事録による多言語コーパスを用いた実験により,本手法で評価を行った全ての言語の組み合わせで従来手法よりも有意に高い翻訳精度が得られた.