マルチカルチュラル・マルチモーダル自然言語処理研究室

(国立研究開発法人情報通信研究機構)

誰もが分かり合えるコミュニケーションへ

教員

  • 内山 将夫

    教授:内山 将夫

  • 丁 仁

    准教授:丁 仁

研究を始めるのに必要な知識・能力

以下の3つの条件のうち、いずれか1つ以上を満たすこと。

  • - 数学: 例えば、解析、線形代数、数理統計等に関する知識。
  • - プログラミング: 少なくともPython、好ましくは、C/C++、及び、機械学習ライブラリに関する知識。
  • - 語学: 母語以外の2つ以上の言語に関する知識。

研究室の指導方針

AI技術がデータと計算の巨大化に依拠して進化し続ける現代世界では、多文化への感性、及び異なる形式の情報を統合して処理できる技術の両方が分かる研究者・開発者が必須となる。 

多様な分野出身の学生に対して個々が有する知識に応じて育成していきたい。 

NICTでのインターン活動も可能であり、その場合、AI技術の社会実装も視野に入れた研究現場での実習、及び多様なステークホルダーとの議論により、大局的な視点を持てるようになる。

この研究で身につく能力

  • 情報学、又は一般的な理工学部出身の学生
    論理的な考え方、プログラミングの技術に長けていることは前提としつつ、研究対象への感性・理解力を深める。自然言語は厳密ではない抽象的な符号体系であって、その「規律」と「適当さ」を体得し、自律的に自然言語の研究開発ができるようにする。
  • 言語学、又は一般的に言語を研究対象とする文系出身の学生
    特定の言語現象、または人文的な分析の枠組みに詳しいことは前提としつつ、工学的な考え方・手法を習得する。最先端のAI技術の仕組を理解した上で利用、評価する能力を身に着ける。
  • 留学生
    一般に、留学生は2つ以上の言語に精通している。その母語・他言語の能力を生かしつつ、言語処理技術の仕組を習得する。帰国後、その国の言語処理を支える人材を育成する。

修了生の活躍の場

本研究室はAIの発展を見据えて2024年度に設置するものであり、修了生はまだない。本研究室の教員は、情報通信研究機構(NICT)に長年勤務しており、過去に指導したインターン生、研究員は国内外の大学、研究所、大手企業からベンチャーまで、様々な職場で活躍している。

研究内容

 

主要な研究方向を以下に挙げる。多様な研究課題も可能なので、気軽に相談ください。

多文化データの構築

多言語データに基づいて多文化処理に必要な学習データを構築する。これは英語・日本語のような大量なデータがすでに整備されている言語だけでなく、多数ある未開拓な言語及びその文化を反映できるデータの整備に注目している。

多文化情報の生成

人間にとって分かりやすい文章・画像を計算機で生成するのは、情報処理における最重要の一つとされている。文化の多様性への対応、入力揺らぎへの頑健性、及び、生成結果の説明性を重視して研究を行う。

マルチモーダル情報の処理

画像・音声とテキスト情報の融合、及びこれらの情報を用いる処理も、取り組んでいる。 

研究設備

NICTのインターンとして、NICTの計算設備を利用できる。

研究業績・共同研究・社会活動・外部資金など