自然言語処理学研究室の岩國 巧さん(博士前期課程2年)らが、情報処理学会 第264回自然言語処理学会研究発表会において優秀研究賞を受賞しました。(2025/7/7)

  自然言語処理研究会は、計算機を用いた言語処理に関わる諸技術(形態素解析、統語解析、意味解析、談話解析、自然言語生成、対話、言語知識表現・獲得、機械翻訳、その他言語解析の応用)および、そのための言語資源(言語資料・統計、辞書、文法等)を研究分野としています。第264回研究発表会は、2025年7月6-7日、早稲田大学の西早稲田キャンパスにてハイブリッド開催されました。
 優秀研究賞は、各回の研究会において投稿される予稿の中から新規性、有用性、斬新性、将来性等の点で特に優れたものを表彰するものです。表彰件数は全体の10%程度とし、研究会の幹事と運営委員からなる選考委員会が選考します。
image
  • 受賞者/著者 Awardees /Authors:
     岩國 巧(博士前期課程2年)、出口 祥之(NTTコミュニケーション科学基礎研究所)、永田 昌明(NTTコミュニケーション科学基礎研究所)、上垣外 英剛、渡辺 太郎

  • 受賞研究テーマ Research theme:
    "誤り単語の混入による単語単位翻訳誤り検出の頑健性評価"
     機械翻訳の発展により、翻訳精度や流暢さは飛躍的に向上したが、依然として固有表現や数値といった重要な単語の誤訳は深刻な問題である。特に金融や医療などの専門領域では、こうした誤訳が重大な経済的損失や社会的リスクを引き起こす可能性があるため、翻訳評価指標には単語レベルの誤りに対する頑健な誤り検出能力が求められる。本研究では、翻訳誤りの中でも固有表現および数値の誤りに着目し、その誤り検出性能の頑健性を評価する。具体的には、対訳コーパスを利用して大規模言語モデル(LLM)により翻訳文を生成し、数値や固有表現を書き換えた擬似誤訳文を自動的に作成し、誤り単語に置換したトークンをBAD、それ以外をOK とする単語単位の誤訳検出用データセットを構築した。構築したデータセットを用いて、ニューラルベースの翻訳評価指標XCOMETに対して、誤り検出性能を、文レベルおよびトークンレベルの両面から検証した。金融ドメインの英日翻訳コーパスTimely Disclosure Documents Corpus (TDDC)において評価した結果、XCOMET は誤りを含まないトークンまで誤ってBAD と判定する傾向が強く、特に文頭において誤判定が多発していることが判明した。これにより、XCOMET は一部の誤訳には高い感度を示すが、エラー位置の正確な特定や局所的な過検出の制御に課題を残していることが明らかとなった。

  • 受賞者のコメント Awardee's voice:
     この度は優秀研究賞という栄えある賞をいただき、大変光栄に思います。本研究会の運営に携わった方々、共著者の方々、そしてご指導くださった先生方に心より感謝申し上げます。
     今回の受賞を励みとして今後の研究に精進してまいります。

  • 外部リンク Links to:
     - 第264回 自然言語処理学研究発表会 HP: https://www.ipsj.or.jp/kenkyukai/event/nl264.html

>> 自然言語処理学研究室 Natural Language Processing lab