-
自然言語処理学研究室
出口 祥之WEBサイト
Hiroyuki Deguchi
主辞駆動句構造文法に基づくニューラル機械翻訳の高度化
自然言語処理 機械翻訳 構文解析 -
翻訳器から「ありえない間違い」をなくしたい
近年の機械翻訳は、ニューラルネットワークによって自律的に学習し精度を高めていく“ニューラル機械翻訳(Neural Machine Translation; NMT)”が主流となっています。
しかし、現時点ではまだ「ありえない間違い」の発生リスクが存在します。たとえば「赤い靴を履いた少女」を、「girl wearing red shoes」ではなく「red girl wearing shoes」と出力する可能性があるのです。これは、対訳データの学習のみでは単語の係り受け関係(構文)を正しく認識できず、「red」が「girl」ではなく「shoes」に係っていると判断できないためです。
翻訳の精度がどれほど向上しても、人間が絶対に起こさない間違いの可能性があるなら、それは排除すべきです。そこで私は本研究を開始し、修士ではNMTに依存文法を組み込んだ、新しい翻訳器の開発に成功しました。
計算速度は落とさず、より正確な翻訳を目指す
博士の研究ではさらに、文や単語の意味に着目しました。たとえば、原文に「ドライバー」という単語があった場合、それが車の運転手なのか、ネジを締める道具なのかは、前後の文脈から判断しなければいけません。そこで言語学の知見を生かし、道具であれば「ドライバーで◯◯する」となるため動作主の存在を推測する、「ドライバーは◯◯した」であればドライバー=動作主(運転手)と判断する、といった制約を与えるモデルを提案しました。
ただし、本研究のゴールは文や単語の意味の解析ではなく、高精度な翻訳器の実現です。文の構造や各単語の考慮によって翻訳速度が低下することは回避しなければなりません。そのためにも、計算方法を工夫して設計していくことが重要と考えています。
目の前の研究を最後までやり遂げて、より充実した研究へ
フェローシップによる支援は、書籍やパソコン周辺機器の購入、学会参加の諸費用などに充てています。知識や作業効率の向上はもちろん、「支援いただいている」という事実に力強く背を押され、さらに日常生活の金銭的な心配が解消されたことで、より研究に打ち込める環境になりました。休日には長年続けているジャズピアノの演奏活動を行うなど、趣味にも全力で取り組んでいます。
修士の頃、私は3つの研究に取り組み、全て論文にして学会に提出しました。現在の研究はその積み重ねの上にあるものですから、これまでの努力が実ったという嬉しさでいっぱいです。一人でも多くの学生が、いま取り組んでいる研究を最後までやり切り、研究成果を積み重ねて、充実した研究生活が送れるようになることを願っています。
(取材・撮影:ライティング株式会社 酒井若菜)