コロキアムB発表

日時: 11月28日(月)3限(13:30-15:00)


会場: L1

司会: 大内 啓樹
西川 勇太 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 須藤 克仁
title: Improving Robustness for Noise and Speaker of Speech Representation from Self-Supervised Learning
abstract: Recently, self-supervised learning (SSL) methods for speech have achieved remarkable results and have attracted a great deal of attention. SSL models of speech learn to output generic speech representations including information such as speech content, speaker information, environmental sounds, and paralinguistic information. Therefore, SSL mdoels can be fine-tuned for kany tasks to achieve a high accuracy with little data. However, unnecessary information in downstream tasks is often included in the speech representation from SSL models. Speaker information, environmental sounds, and paralinguistic information are unnecessary information in automatic speech recognition (ASR) and hinder learning. Hence, research has been conducted to obtain robust speech representations for environmental sounds and robust speech representations for speaker variations. On the other hand, these studies have not targeted both at the same time. In this study, we aim to obtain robust speech representations for both environmental sounds and speaker information.
language of the presentation: Japanese
発表題目: 自己教師あり学習から獲得される音声表現のノイズ及び話者に対する頑健性の向上
発表概要: 近年音声の自己教師あり学習手法が目覚ましい成果を上げており、大きな注目を浴びている。音声の自己教師あり学習モデルは、発話内容、話者情報、環境音、パラ言語といった情報を含んだ、汎用的な音声表現を出力するように学習する。 そのため、1つのモデルで多様なタスクに微調整を行うことにより、少ないデータで高い精度のモデルを実現することが可能である。 しかし、下流タスクにおいて不要な情報を音声表現の中に含んでいる場合が多い。 音声認識においては話者情報や環境音、パラ言語情報は不要な情報であり、学習の妨げとなる。そこで、環境音に対して頑健な音声表現や話者のバリエーションに対して頑健な音声表現を得るための研究が行われてきた。 しかし、これらの研究は両方を対象としたものではない。 そこで本研究では、環境音と話者情報の両方に対して頑健な音声表現の獲得を目指す。
 
蒔苗 茉那 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 須藤 克仁
title: Examination about the Evaluation for Simultaneous Interpretation
abstract: It is important to evaluate the outputs of simultaneous interpretation to keep its quality. It also works for the improvement of the simultaneous interpretation ability for both humans and machines. However, the standard for evaluating simultaneous interpretation does not exist in the current situation. Therefore, this research investigates whether it is reasonable to apply translation quality standard, Multidimensional Quality Measurement(MQM), to simultaneous interpretation quality standard focusing on accuracy.
language of the presentation: Japanese
発表題目:同時通訳品質評価方法の検討
発表概要:同時通訳結果の評価基準の存在は、通訳そのものの質の向上や安定、そして評価基準を元に人間・機械による通訳能力の改善に繋がることから重要である。しかし、通訳結果の内容の良し悪しを判断する基準は現在のところ存在しない。そこで本研究では、既に存在する翻訳の品質評価基準の中の「正確さ」に注目し、この基準が通訳の品質評価基準にも適用可能か調査する。
 
泉 健太 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 田中 宏季
title: Implementation and Evaluation of a Generation-Based Conversational Agent for the Mental Healthcare
abstract: Mental disorders are a growing global issue and many mobile healthcare apps have been developed to improve this situation. Conversational agents play the main role of them and most of them are rule-based systems based on psychological techniques. However, it's pointed out that this conversational flow leads to a limited understanding of the user utterances and weak user engagement. In this situation, recent developments in natural language generation are expected to improve the quality of the agent's responses. In this research, the generation-based systems based on Cognitive Behavioral Therapy are implemented and we evaluated whether their responses are improved compared with the rule-based systems.
language of the presentation: English
発表題目: メンタルヘルスケアを目的とした生成ベース対話システムの実装と評価
発表概要: 精神疾患は世界的な問題であり、この状況を改善するために多くのモバイルヘルスケアアプリが開発されている。 その中でも中心的なのは対話エージェントであり、その多くは心理学的手法に基づくルールベースのシステムである。 このような対話エージェントでは、ユーザーの発話に対する理解度が低く、ユーザーとのエンゲージメントが低下するという指摘がなされている。 このような状況において、近年の自然言語生成の発展により、エージェントの応答の質を向上させることが期待されている。 本研究では、認知行動療法に基づく生成ベースシステムを実装し、ルールベースシステムと比較して、その応答が改善されるかどうかを調査する。
 
石川 隆太 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 須藤 克仁
title: Improving divide-and-combine neural machine translation method for long-form translation.
abstract: With the advent of neural machine translation, it has become possible to generate translations as fluent as human translators. However, when the sequence length of the input sentence becomes long or the sentence structure becomes complicated, duplicate translations that output words or clauses of the input sentence repeatedly, or translation omissions that do not translate part of the input sentence may occur. In previous research, a method has been proposed to generate natural translations by dividing a long sentence into segments and translate them, then combining the translated segments with tokens representing the relationship between the segments, and reordering and combining the segments using a neural network model that is separate from the translation model. This method has been suggested to be effective in preventing translation omissions. This study attempts to improve the divide-and-combine method in machine translation for long sentences by increasing the accuracy of segment translation and the accuracy of segment reordering and integrating.
language of the presentation:Japanese
発表題目:長文翻訳のための分割統治ニューラル機械翻訳の改善
発表概要:ニューラル機械翻訳の登場により、人間の翻訳者のように流暢な翻訳文を生成できるようになった。しかし、入力される文の系列長が長くなる、または文構造が複雑になると、入力文の単語や節を繰り返し出力する重複訳や、入力文の一部を訳出しない訳抜けが発生することがある。先行研究において、長文を分割して翻訳し、翻訳されたセグメントをセグメント同士の関係性を表すトークンで結合し、翻訳モデルとは別のニューラルネットワークモデルを用いてセグメントの並べ替えと編集を行うことで自然な訳出を生成する分割統治的手法が提案されており、訳抜けを防ぐために有効である可能性が示唆されている。本研究では、セグメント翻訳の精度、セグメントの並べ替えと編集の精度を上げることにより、長文のためのニューラル機械翻訳における分割統治的手法の改善を試みる。
 
成浦 拓音 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 品川 政太朗, 須藤 克仁
title: Using visual information to improve colloquial language translation
abstract: While machine translation using neural networks has been the mainstream in recent years, colloquial language often contains ambiguous pronouns, metaphors, jokes, and other non-explicit expressions, which are different from those in written language. As an approach to these problems, translation methods using visual information have been considered in recent years. In this study, we conduct experiments using a video subtitling corpus dataset proposed in an existing study, and investigate how to improve the translation accuracy by using visual information.
language of the presentation: Japanese
発表題目: 話し言葉翻訳の改善に向けた視覚情報の活用
発表概要: 近年ではニューラルネットワークを用いた機械翻訳が主流である一方, 話し言葉には書き言葉と異なる問題として場面の状況を加味した曖昧性を含む代名詞や比喩・冗談といった明示的で無い表現が含まれることが多い. それらの異なる問題に対するアプローチとして,近年では視覚的情報を用いた翻訳手法が検討されている.本研究では既存研究で提案された映像の字幕翻訳コーパスデータセットを用いて実験を行い,視覚的情報を用いて翻訳精度を改善することを検討する.
 
岡本 夏旺 M, 1回目発表 知能コミュニケーション 中村 哲, 吉野 幸一郎(客員教授), 品川 政太朗
title: Analysis of the user's responses when the dialogue system shares an image that differs from the user's request.
abstract: In recent years, research has been conducted on dialogue systems that share images during conversations. Such dialogue systems have the advantage of being able to convey detailed information that cannot be conveyed using verbal information alone by sharing images. However, dialogue systems are not always able to share contextually relevant images, and sharing images that are out of context can be very confusing to users. Therefore, dialogue systems should perform dialogue recovery when dialogue systems shared out-of-context images. As a first step toward achieving dialogue recovery, this study analyzes how users react when images are shared that are not appropriate for the context.
language of the presentation:Japanese
発表題目: 対話システムがユーザーの要望と異なる画像を共有した場合のユーザーの返答分析   
発表概要: 近年、会話の際に画像を共有する対話システムの研究が行われている。このような対話システムは画像を共有することで、言語情報だけでは伝えることができない詳細な情報伝えることができるというメリットが存在する。しかし対話システムが常に文脈に沿った画像を共有することができるとは限らず、文脈にそぐわない画像を共有した場合、ユーザーを大きく困惑させうるということが考えられる。そのため、対話システムは文脈にそぐわない画像を共有した場合、対話の回復に努めるべきである。本研究では、対話の回復を実現するための第一段階として、文脈にそぐわない画像を共有した際に、ユーザーがどのような反応をするのかの分析を行う。
 

会場: L2

司会: 中畑 裕
山岡 厚仁 M, 1回目発表 ソフトウェア工学 松本 健一, 笠原 正治, 石尾 隆, KULA RAULA GAIKOVINA, 嶋利 一真
title:Software maintenance support for library updates with execution traces
abstract: Libraries are essential for software development. However, libraries are updated independently of the software . Therefore, updating the library on the software side may cause the software to stop working properly if the library usage functions are not backward-compatible. In previous research, static analysis of library source code was used to detect changes of functions in library . In this study, we propose a method to dynamically detect changes of function in library by executing a program and using an execution trace, which is a sequence of instructions from the beginning to the end of the program.
language of the presentation: Japanese
発表題目:実行トレースを用いたライブラリ更新に伴うソフトウェア保守支援
発表概要:ソフトウェアの開発にはライブラリの利用が欠かせない.ただし,ライブラリは使用されているソフトウェアとは独立にアップデートされている.このためライブラリが後方互換性を持たないとき,ソフトウェア側のライブラリをアップデートすることでソフトウェアが正常に作動しなくなる可能性がある.先行研究ではライブラリのソースコードを静的に解析することでライブラリの変更箇所を検知している.本研究ではプログラムを動かすことで動的に変更箇所を検知する手法を提案する.
 
DAMRONGSIRI HATHAICHANOK M, 1回目発表 ソフトウェア工学 松本 健一, 笠原 正治, 石尾 隆, KULA RAULA GAIKOVINA, 嶋利 一真
title: An Empirical Study of Topics Used to Teach The Python Language for Experts and Newcomers
abstract: Python is a multi-purpose programming language that is used in a wide range of industries including both academic and business fields. There is a number of materials and resources, making it difficult to know where to start learning. Experts may unintentionally depend on their experiences and documents to construct their teaching techniques, while newcomers may unintentionally overlook the fundamentals of being unsure which topic should be prioritized. This research examines the topics that have been used to teach Python by digesting Python books available on the market and clustering in order to identify important and common topics in the teaching sequence.
language of the presentation: English
 
岡井 光輝 M, 1回目発表 ソフトウェア工学 松本 健一, 中島 康彦, 石尾 隆, KULA RAULA GAIKOVINA, 嶋利 一真
title: Investigation of single-letter variable usage focusing on syntactic information
abstract: Since variable names are related to the readability and comprehensibility of source code, it is important in naming a variable that the name fully and accurately describe the entity the variable represents. However, single letter variables also appear in the source code, as the variable named "i" is often used for the index of a loop. Previous research has investigated the percentage of single letter variables used by analyzing the number of times variable names are used. In this study, we investigate the usage of single letter variables by focusing on the syntactic information of the source code.
language of the presentation: Japanese
発表題目: 構文情報に着目した1文字変数利用状況の調査
発表概要: 変数名はソースコードの可読性・理解度に関係するため,変数の命名においてはその変数が表す実体を完全かつ正確に表す名前であることが重要である.しかし,ループのインデックスにはiという名前の変数がよく使われるように,ソースコードには1文字変数も現れる.先行研究では,変数名の利用回数の分析によって1文字変数が使用される割合を調査している.本研究では,ソースコードの構文情報に着目して1文字変数の利用状況を調査する.
 
田中 慎之佑 M, 1回目発表 ソフトウェア工学 松本 健一, 飯田 元, 石尾 隆, KULA RAULA GAIKOVINA, 嶋利 一真
title: Development of a tool to assist novice’s program correction using a probabilistic model with N-gram
abstract: One of the many difficulties faced by the novice students from the start are programming errors, and it is important to provide clues that enable them to solve errors by themselves. These days, fault localization techniques for student programs usually fall into one of the following categories: learning-based approaches and spectrum-based approaches. However, the former considers test coverage as the most effective input, so it is difficult to consider syntactic information of source codes. Also, the latter ignores the semantic information of programs such as test coverage or execution traces. Moreover, these code error detection methods often focus only on specific errors and cannot cover all errors.In this study, we construct a probabilistic model using N-grams to develop a tool to assist novice programmers in modifying their programming errors. In addition, we also propose a program correction method and a correction support method, and evaluate the methods and the tool by comparing them with existing methods and introducing the tool to the programming class we give every year.
language of the presentation: Japanese
発表題目: 確率モデルを用いた初学者向けコードエラー修正支援ツールの開発
発表概要: プログラミング初学者のコーディングにおいてエラーの発生は大きな障壁となりやすい.初学者のデバッグ能力を向上させるためには,初学者自身でエラーを解決できるような手がかりの提供が大切である.現状,プログラムのエラー検知手法はスペクトルベースと学習ベースの研究が多く為されている.しかし,スペクトルベースの手法ではテストケースでの結果を最優先にするため,構文的な情報を考慮しにくい.また,学習ベースの手法ではテストカバレッジやトレースの実行といった情報を無視してしまう.加えて,既存のコードエラー検知手法は特定のエラーにのみ焦点を当てていることも多く,全てのエラーを網羅できないことが難点である.本研究では,Python初学者が直面するコードエラーの修正支援ツールを開発するために,コードエラー修正のためのN-gramを用いた確率モデルを構築する.加えて,独自のコード修正手法及び修正支援手法を提案した上で,既存の手法との比較や実際のプログラミング授業への導入によって,開発した手法及びツールの評価を行う.
 
篠原 遼太郎 M, 1回目発表 ソフトウェア工学 松本 健一, 飯田 元, 石尾 隆, KULA RAULA GAIKOVINA, 嶋利 一真
title: Analysis of Error Correction Time in Python novices ​
​ abstract: In programming education, it is very important for educators to understand what difficulties novice students face and what processes they go through to solve them.By providing appropriate advice to novice learners who encounter difficulties, educators can achieve efficient education and maintain the motivation of novice learners.In this study, we analyze the errors faced by novice python students during programming classes and we analyze the time it takes to resolve errors, and aim to identify the characteristics of errors that are difficult for novice python students to resolve.
​ language of the presentation: Japanese ​
​ 発表題目: Python初学者におけるエラー修正時間の分析
​ 発表概要: プログラミング教育において,初学者がどのような困難に直面し,どのような過程を経てそれらを解決しているかを理解することは,教育者にとって非常に重要である.困難に陥った初学者に対して適切なアドバイスを行うことで,教育者は効率的な教育を実現し,初学者のモチベーションを維持することができる.本研究では,Python初学者がプログラミング授業中に直面したエラーを解析し,エラー解決までの時間を分析することで,Python初学者にとって解決が困難なエラーの特徴の特定を目指す.
 

会場: L3

司会: Chen Na
石山 時宗 M, 2回目発表 ユビキタスコンピューティングシステム 安本 慶一, 加藤 博一, 諏訪 博彦, 藤本 まなと
title: Proposal of a micro-activity recognition method during cooking using vibration information obtained from piezoelectric sensors
abstract: Currently, methods using cameras and wearable devices have been proposed for sensor-based home behavior recognition. However, these existing methods have difficulty in recognizing activity such as cooking due to blind spots, privacy and the burden on the wearer, and are not fully capable of recognizing activities that are a combination of activities (micro-activity). In this study, we propose a new activity recognition system that can recognize micro-activity during cooking by using a piezosensor as a sensor that acquires vibrations caused by actions and has the advantage of being an installed sensor that has no blind spots and protects privacy. Through experiments, we show that it is possible to visualize the characteristics of vibration caused by activities and to identify cooking behaviors by vibration.
language of the presentation: Japanese
発表題目: ピエゾセンサを用いた振動によるマイクロ行動認識手法の提案
発表概要: 現在,センサによる宅内行動認識は,カメラやウェアラブルデバイスを用いる手法が提案されている.しかし,これら既存手法では,死角やプライバシー、装着者での負担から、料理行動などの認識は難しく、動作が複合される行動(マイクロ行動)の認識が完全ではない.本研究では,行動による振動を取得し、死角がなくプライバシーを保護する設置型センサという利点を持つセンサとしてピエゾセンサを用いることで,料理中のマイクロ行動を認識できる新たな行動認識システムを提案する.実験により、行動による振動の特徴を可視化し、振動による料理行動の識別が可能であることを示す。