近年,交通手段や通信手段の発展に伴い,母国語以外でのコミュニケーションをとる機会が増加している.しかしながら,母国語以外の言語を一つまたは複数習得するには多大な労力を必要とする.このような問題を解決する手段の一つに音声翻訳技術が存在する.
音声翻訳技術は,ある言語の音声を異なる言語の音声に翻訳する技術であり,長年の研究によりその性能は改善しつつある. しかし,文単位で翻訳する従来の音声翻訳が講演のような発話が長い場面に使用される場合,発話開始から翻訳開始までの時間(以降,遅延時間)が長くなる. この遅延時間の問題を解決するために,同時音声翻訳の研究が行われている.
同時音声翻訳は文の途中で翻訳を開始するため,遅延時間を短縮することができる. 同時音声翻訳で重要となるのは,翻訳精度をできるだけ維持しつつ遅延時間を短縮することであるが,遅延時間を減らせば減らすほど,翻訳に利用できる文脈情報も減るため,翻訳精度が劣化することが知られている. この中で翻訳精度と遅延時間の相対的な重要度は比較的言及されてこなかった. このことから,各遅延時間と翻訳精度を備えたどのシステムが人にとって最適であるかは明らかではない.
本研究では同時音声翻訳システムの自動評価や最適化を可能にするために,翻訳精度と遅延時間を同時に考慮した評価尺度の構築方法を提案する.