同時通訳データを利用した同時音声翻訳システムの提案

清水 宏晃 (1251051)


近年,国際化に伴い,母国語が異なる人々とコミュニケーションを取る機会が増加している.このような国際的なコミュニケーションを支援するために音声翻訳が開発され,性能は年々改善されている.しかし,現状の音声翻訳は文末を待つ必要があるため,講演のような一文が長い場面に音声翻訳が使用される場合,発話開始から翻訳開始までの時間(遅延時間)は長くなってしまう.この問題を解決するために,文の途中で翻訳を開始する同時音声翻訳の研究が行われている.本研究の目的は,この同時音声翻訳における遅延時間の短縮である.そのために,我々は同時通訳者が遅延時間を短縮するために駆使している様々な技術に着目する.これらの技術を同時音声翻訳に利用して,同時通訳者のような同時音声翻訳を構築することによって,遅延時間を短縮できると考える.具体的には,まず同時通訳者が同時通訳したデータ (以降,同時通訳データ)を収集する.次に,同時通訳者のように訳出する同時音声翻訳を構築するために,同時音声翻訳の機械翻訳部の学習に同時通訳データを利用する.最後に,分析した同時通訳者の訳出タイミングを基に,同時通訳者の技術を取り入れた訳出タイミング決定手法を提案する.実験では,英日方向において,翻訳精度と遅延時間の観点から同時音声翻訳の性能を評価する.