鱸 尚晃 | M, 2回目発表 | 知能コミュニケーション | 中村 哲, 渡辺 太郎, 作村 諭一 |
title: *** Representing `how you say' with `what you say': English corpus of focused speech and text reflecting corresponding implications ***
abstract: *** In speech communication, how something is said (paralinguistic information) is as crucial as what is said (linguistic information). As a type of paralinguistic information, English speech uses sentence stress, the heaviest prominence within a sentence, to convey emphasis. While different placements of sentence stress communicate different emphatic implications, current speech translation systems return the same translations if the utterances are linguistically identical, losing paralinguistic information. Concentrating on focus, a type of emphasis, we propose mapping paralinguistic information into the linguistic domain within the source language using lexical and grammatical devices. This method enables us to translate the paraphrased text representations instead of the transcription of the original speech and obtain translations that preserve paralinguistic information. As a first step, we present the collection of an English corpus containing speech that differed in the placement of focus along with the corresponding text, which was designed to reflect the implied meaning of the speech. Also, analyses of our corpus demonstrated that mapping of focus from the paralinguistic domain into the linguistic domain involved various lexical and grammatical methods. The data and insights from our analysis will further advance research into paralinguistic translation.*** language of the presentation: *** Japanese *** | |||
大友 寛之 | M, 2回目発表 | 自然言語処理学 | 渡辺 太郎, 中村 哲, 大内 啓樹 |
title: Toward building an analysis system for travel routes
abstract: Since long time ago, people have visited various places and written down their experiences and impressions in the form of natural language. If we can link the places, which people visited, to the points on a map, and estimate travel routes, we can apply this information to various applications, such as sightseeing spot recommendations. In addition, it is becoming increasingly important to understand people's travel routes, due to COVID-19. The purpose of this research is to grounding the travel routes onto a map by analyzing sentences. Currently, we are building a dataset for training and evaluation of the analysis system for travel routes. In this presentation, we will introduce the overview of travel routes analysis and the progress of this research. language of the presentation: Japanese 発表題目: 旅行者の移動経路解析システム実現に向けた取り組み 発表概要: 古来より,人々はさまざまな場所に訪れ,その経験や感想を自然言語という形で書き留めてきた.それらの文章を読み解き,訪問した場所と地図上の地点を紐づけ,移動経路を推定できれば,観光地推薦などのさまざまな応用が可能となる.また,昨今ではCOVID-19の影響もあり,人の移動経路を把握することがますます重要となっている.本研究では,文章を解析することで,人の移動経路を地図上に描くことを目的としている.現在は,移動経路解析システムの学習および評価に用いるデータセットの作成を行っている.本発表では,移動経路解析のタスク概要と本研究の進捗について報告する. | |||
早川 明男 | M, 2回目発表 | 自然言語処理学 | 渡辺 太郎, 中村 哲, 大内 啓樹 |
title: Operation-Controllable Text Simplification
abstract: Text Simplification (TS) aims to rewrite texts for easier understanding. Simplified texts can benefit various people such as children and non-native speakers. However, appropriate simplification for one type of user can not be appropriate for another, which makes the purpose of TS obscure. The purpose of this presentation is to report my plans and progress on: (1) dataset creation targeted at a specific population; (2) operation - how we rewrite texts - controllable TS. language of the presentation: Japanese 発表題目: 操作を制御可能なテキスト平易化 発表概要: テキスト平易化は、テキストを理解しやすいように書き換えることである。平易なテキストは子供や非母語話者など多様な人々に恩恵を与えうる一方、理解しやすいテキストは読者によって異なるゆえ、テキスト平易化は目的が曖昧であるという一面ももつ。本発表では、その対応策として、(1)特定の属性をもつ集団に向けた平易化データセットの作成について、(2) 書き換えの方法(操作)を制御可能なテキスト平易化についてを中心に、現段階の構想と進捗について報告する。 | |||
芳沢 久志 | M, 2回目発表 | 自然言語処理学 | 渡辺 太郎, 中村 哲, 大内 啓樹 |
title: Evaluation of Metaphor Paraphrase Task with MRPC
abstract: Metaphorical expressions are used in communication to help illustrate and explain something by comparing it to something else. Metaphor paraphrase is one of NLP tasks related to metaphor. Previous studies on metaphor paraphrase have tried to evaluate the quality of paraphrased text with already existing evaluation matrices. One problem here is that these old matrices have very low or almost no correlation to human evaluation. The purpose of this presentation is to propose a new evaluation method with MRPC and to show my progress so far. language of the presentation: Japanese 発表題目: MRPCを用いたメタファーパラフレーズの評価 発表概要: メタファー(隠喩)表現は物事を喩えることで簡潔かつ効率的な情報伝達を実現することができる。このメタファー表現に対する自然言語処理のタスクの一つとしてメタファーパラフレーズが存在する。既存の研究では、メタファーパラフレーズの評価指標として機械翻訳などの既存の手法を用いてきた。しかし、これら既存の評価手法は人手評価との相関が低く、適切な評価を行うことができていなかった。本発表では、メタファーパラフレーズタスクのための新たな評価指標としてGLUEベンチマークのタスクの一つであるMRPCを用いることを提案し、また現段階での結果を報告する。 | |||