機械翻訳システムの誤り分析のための誤り箇所選択手法

赤部 晃一 (1351002)


機械翻訳システムの精度向上には、その翻訳システムが抱える問題を把握することが必要不可欠である。機械翻訳システムの誤りを自動的に分析する手法は、様々なものが提案されているが、それらの手法の多くは単純にシステムの翻訳結果と人手により事前に作成された正解訳の差異のみに着目して分析を行うものであり、誤りとして特定されるものが機械翻訳システムの改善に有用とは必ずしも言えなかった。本研究の目的は、翻訳システムの誤り箇所特定手法を新たに提案することで、機械翻訳システムの人手による誤り分析を効率化することである。 本論文ではまず、先行研究における機械翻訳システムの自動的な誤り分析手法、及び人手による誤り分析手法を説明し、自動的な分析と人手による分析の比較を行う。次に、機械翻訳システムの誤り箇所選択手法を新たに提案し、人手による誤り分析の効率化を図る。誤り箇所選択手法は、機械翻訳の誤り箇所を精度良く選択する必要があるが、誤り箇所選択精度を評価するための枠組みは未だ十分なものが提案されていない。本論文では誤り箇所選択精度を評価する手法を新たに提案することで、誤り箇所選択手法の評価・比較を行う。 実験の結果、提案法により機械翻訳システムの誤り箇所選択精度が向上した。また、実際に誤り分析を行った際に提案法を適用することで、システムの改善に有用な誤りを多く検出し、誤り分析をより効率的に行うことができた。