平野 颯 | M, 2回目発表 | 自然言語処理学 | 渡辺 太郎, | 中村 哲, | 進藤 裕之 | |
Linguistic Typological Aware Multilingual Machine Translation
Recent development of machine translation makes it possible to supply high-quality translation survices not for single language-pair but multiple language-pairs. Previous work reused translation model with single language-pair and showed competitive performance just adding a sign representing target language. In this work, we aim to clarify what characteristics of each language the multilingual translation models acquire and reflect it to translation results. At the first step, we examined how training processed in the setting using multiple target language signs. Also we examined the affection changing part of the symbol at inference time. language of the presentation: Japanese 言語類型論に動機づけされた多言語機械翻訳 近年の機械翻訳技術の進歩により、単一言語間のみならず複数言語間での機械翻訳サービスを高品質に提供できるようになってきている。 先行研究では、翻訳先を示す記号を文に追加することにより、単一言語間の翻訳モデルを複数言語間のものに流用できることが知られている。 本研究では、多言語翻訳モデルが各言語の特徴をどのような形で獲得し、 また獲得された情報を翻訳結果に反映させることができるかを明らかにすることを目指す。 足がかりとして、翻訳先を示す記号を複数種類に増やした場合に、学習がどのように進むのか、推論時にその記号の一部を入れ替えることが出力に影響を及ぼすのかについて検証した。 | ||||||
吉成 祐貴 | M, 2回目発表 | 自然言語処理学 | 渡辺 太郎, | 中村 哲, | 進藤 裕之 | |
アノテーションツールを用いた学習の効率化の検討 アノテーションツールを用いた学習の効率化の検討 自然言語処理技術の発展により、データセットの量が十分であれば、人間と遜色ない性能を発揮する言語モデルが開発されつつある。しかし、実世界のデータセットには十分な量がないものもある。少ないデータセットで学習するための一つの手法に、データセットの一部を人間にアノテーションしてもらう学習手法であるアクティブラーニングがある。本研究では、アノテーションツールの違いが学習にどのような影響を与えるかを調べる。 Study of Active Learning with different Annotation Tools With the development of natural language processing technology, perfoemance of recent language models is camparable to human, as long as the amount of data set is sufficient. However, real-world datasets may not have sufficient amount of data. One method for learning with a small dataset is Active Learning, which is a learning method in which a part of the dataset is annotated by some people. In this study, I investigate how different annotation tools affect active learning. | ||||||
濱口 真太朗 | M, 2回目発表 | 光メディアインタフェース | 向川 康博, | 中村 哲, | 舩冨 卓哉, | 藤村 友貴 |
title: Region matching of line drawing regions using semi-supervised learning.
abstract: In recent years, long working hours for animators have become a problem, and demand for automation of the animation production process is increasing. Therefore, in this research, we propose an automatic coloring method using feature matching in order to reduce the cost of the line drawing coloring process in animation production. As a conventional method of auto colorization of line drawing, auto colorization using deep learning can be mentioned. To solve this problem, we consider the approach of coloring some of the line drawings and auto colorization remaining the line drawings based on the colored line drawings. In order to estimate the region matching among line drawings by machine learning, we created a dataset from a set of colored line drawings. Here, pairs of regions with different colors can be determined as negative cases, but positive cases are not obvious because the same region may be divided depending on how the character is drawn. In order to learn region matching using such data, we tried to apply semi-supervised learning and compared its accuracy with that of supervised learning. In this experiment, we estimated the region matching of line drawing regions. This experiment, we examined the features to be used and the learning method. For the features, we compared the area and coordinates obtained directly from the image with those obtained by extracting features from a different model, and compared results by using supervised learning with results by using semi-supervised learning. language of the presentation: Japanese 発表題目: 半教師付き学習を用いた線画領域の対応付け 発表概要: 近年,アニメーターの長時間労働が問題となっていおり,アニメ製作工程の自動化に対する需要が高まっている.そこで本研究では,アニメ制作における線画の着色工程のコストを下げるために,特徴マッチングを用いた自動着色手法を提案する.線画の自動着色の従来手法として,深層学習を用いた自動着色が挙げられる.しかし,登場頻度が少なく十分な学習データを用意できないキャラクタには適用できない課題があった.そこで,同じキャラクタが描かれた一連の線画群に対し,一部の線画を着色し,これを基に残りの線画を自動着色するアプローチを考える.機械学習によって線画間で領域の対応付けを推定するため,着色済線画群からデータセットを作成した.ここで,色が異なる領域の組は負事例と断定できるが,キャラクタの描かれ方によっては同じ領域が分割される場合などがあり,正事例は自明ではないという問題がある.このようなデータを用いて対応付けを学習するため,半教師付き学習の適用を試み,通常の教師付き学習に対する精度の比較を行った.今回の実験として,実際に線画領域の対応付けを推定した.この実験では,用いる特徴量,学習方法についての検討を行った.用いる特徴量については,画像から直接得られる面積・座標と,別モデルから特徴抽出を行って得られる特徴を用いた際の比較,半教師付き学習を用いた場合との比較を行った. | ||||||