機械読解における Answer Sentence Selection の再考

佐々木 俊樹( 1751048 )


システムに人間と同等の言語理解力を与えることは,自然言語処理や人工知能 における中心的な課題である.機械の読解力 (Machine Reading Comprehension, MRC) テストや質問応答 (Question Answering, QA) はその問題に着目した主要 なタスクであり,昨今急速な発展を遂げている.しかしながら現在の多く のシステムは,回答に必要な情報が記述されたテキスト部分を参照して回答するな どのように判断根拠を示すものはない.

MRC における根拠の提示に着目した研究の一つに,推論時に必要となる文を与 えられた説明文 (コンテキスト) や多数の文の候補から選択する Answer Sentence Selection (ASS) というタスクが提案されている. ASS は MRC や QA の回 答精度を向上させるために,回答を 1 つに選択する一段階前の処理としてしばしば 用いられている.ASS にて選択された文はシステムの意思決定の要因と考えるこ とができ,ASS で示される根拠はミスの許されない医療システムなどを考える際に はとても重要な情報の一つであると考えられる.しかしながら ASS を評価するタ スクやデータセットが少ないことや,これまでの読解問題の研究では回答精度のみ が重要視され ASS は軽視されてきた.

そこで,本研究では既存の MRC データセットに対して,質問に回答するために 必要となる文をアノテーションすることで ASS をタスクとした新たなデータセッ トを作成した.この ASS タスク実際にに取り組むことにより,良い ASS システ ムの開発にはどのような能力・情報が必要であるかを調査し,MRC における ASS の重要性を検討する.