コーパスを用いた英語習得度の推定

坂田浩亮 (0651041)


言語教育に携わる教師にとって,学習者の言語習得度を知ることは重要な職務である. しかし,多くの学生に対して客観的に評価をすることは容易ではない. もし,機械的に評価を下すことができれば教師の労力は軽減されるだけではなく,学習者は教師がいなくても随時自分の言語習得度を評価できるため学習効率の向上につながると考えられる. 英語の場合,TOEIC等の試験により自動的に英語の実力を評価できる手段は存在するが,自由英作文に対しては純粋に英語の能力を評価することはできない. 近年,安田らが英語コミュニケーション能力を推定する手法を考案している. しかし,評価ができるのは選択問題や語彙穴埋め問題に対してであり完全な自由英作文に対しては評価を下すことが出来ていない. 本論文では,安田らの研究を自由英作文の評価に応用していくつかの手法を提案した. 提案手法では学習者コーパスを利用し,類似度およびn-gramの出現頻度の素性を手がかりに機械的に評価を下す. 1281人の日本人による英語を収録したNICT JLEコーパスとの最大類似度で推定した場合と類似度素を回帰学習の素性に用いた場合の推定精度はそれぞれ14.4%,84.5%であった. この実験結果から,類似度を素性にした場合は機械学習を適用する手法が有効であることが確認できた. さらに,NICT JLEコーパスのn-gram出現頻度を素性に用いて実験した場合は90.8%となり,結果的に類似度を素性に用いるよりもn-gram出現頻度を用いた方が良い結果が得られることが分かった.