Cross-Domain and Cross-Lingual Parsing with Adversarial Training

佐藤元紀 (1651053)


構文解析は,多くの自然言語処理にとって重要なタスクである. しかし,構文解析器を訓練するには,言語専門家による構文木のアノテーションが必要である. 本論文では,アノテーション作業を容易にするために,対象ドメイン上のアノテーションツリーの限定された量しか利用できない状況下における分野適応について考える. 近年の構文解析器はニューラルネットワークをベースとなるものが多く使われており,双方向LSTMで得られた文全体の文脈情報を利用する. 我々は,このような最新の構文解析器を分野適応へ応用する. 我々のアプローチは,個別のLSTMを用いてドメイン不変およびドメイン特有の表現を獲得することを目的としている. ベースラインに用いた構文解析器は,双方向LSTMを用いた最高精度の構文解析器である. Universal Dependencies 2.0の実験では,単一言語の設定において,ターゲットドメインのパフォーマンスを一貫して向上させることがわかった. 我々の手法は,ソース言語がターゲット言語と類似している場合に,低リソース言語の学習に有益であることもわかった.