コロキアムB発表

日時: 12月5日(月)3限(13:30-15:00)


会場: L1

司会: PERUSQUIA-HERNANDEZ Monica
野口 龍平 M, 1回目発表 インタラクティブメディア設計学 加藤 博一, 向川 康博, 神原 誠之, 藤本 雄一郎, 澤邊 太志
title: 3D human body model for analysis of running form and runnning parameters of short-distance runners
abstract: In short-distance track and field events, running posture is measured and analyzed to improve performance. Currently, a simple running posture estimation technique that can be performed only with a camera has been established underr the condition that a higly accurate 3D human body model and personal running data have been obtained. However, the creation of a highly accurate 3D human body model is expensive , and it is considered difficult to spuread the measurement and analysis of driving posture. This study describes a deformation and generation technique for 3D human body models with the same estimation accuracy as in previous studies that reduces the cost of creating 3D human body models.
language of the presentation: Japanese
発表題目: 短距離走者の走行フォームと走行パラメータ分析のための三次元人体モデル
発表概要: 短距離陸上競技では、パフォーマンス工場のために走行姿勢の計測・分析が行われている。現状、高精度な三次元人体モデルと個人の走行データが取得されているという条件のもとカメラのみで行える手軽な走行姿勢の推定技術が確立されている。しかし、高精度な三次元人体モデルの作成は高コストであり、走行姿勢の計測・分析の普及は困難であると考えられる。本研究では、三次元人体モデルの作成コストを低減した従来研究と同等の推定精度を持つ3次元人体モデルの変形、生成方について述べる。
 
田村 優次郎 M, 1回目発表 ヒューマンロボティクス 和田 隆広, 清川 清, 織田 泰彰, 劉 海龍
title: Generation of visual information to reduce motion sickness based on Mathematical Models
abstract: Motion sickness is one of the concerns when automated driving vehicle is put into practical use. Motion sickness is thought to be caused by a discrepancy between vision and vestibular perception, and Several studies have attempted to suppress motion sickness by unifying visual information and vestibular perception. There is the 6DOF-SVC+VIS model that estimates the probability of motion sickness (MSI) using visual information and head motion as input. And it has been shown that MSI is reduced by inputting visual information that is not consistent with the vestibular system. My study aims to generate visual information that is more effective in suppressing motion sickness in automated driving vehicle based on the 6DOF-SVC+VIS model. For that purpose, I verify the effect by presenting the generated visual information to the passenger in the virtual space.
language of the presentation:Japanese
発表題目:数理モデルを基にした動揺病を低減する視覚情報の生成
発表概要:動揺病は自動運転車が実用化された際に懸念されている問題の一つである。  動揺病は視覚と前庭系の知覚のズレによって生じると考えられており、いくつかの研究において視覚情報と前庭系の知覚を統一することで動揺病の抑制を図っている.  視覚情報及び,頭部運動を入力とした動揺病の発生確率(MSI)を推定する6DOF-SVC+VISモデルが存在し,前庭系と一致しない視覚情報を入力することでMSIが低減されることが示されている.  本研究は6DOF-SVC+VISモデルを基に,自動運転車での動揺病を抑制するより効果の高い視覚情報の生成を目的とする.そのために,生成した視覚情報を仮想空間上で搭乗者に提示することでその効果を検証する.
 
松尾 隆志 M, 1回目発表 ヒューマンロボティクス 和田 隆広, 池田 和司, 織田 泰彰, 劉 海龍
title: An HMI to help drivers understand the object and reason of RtI for calibrating their trust in ADS
abstract: A request to intervene (RtI) of a Level 3 automated driving system (ADS) asks the driver to take over driving task when the ADS falls into a system limitation (SL) or out of its Operational Design Domain (ODD). However, if the driver does not correctly understand RtI, overtrust and reliance on the system may occur. When ADS issues RtI on a certain scene, there are multiple conceivable reasons of RtI, but the driver may have difficulty understanding or misunderstanding (1) what is the issued against of RtI? (object of RtI) and (2) why RtI is issued? (reason of RtI). Thus, the driver may easily to inappropriately trust the ADS, which may lead to an accident. To solve this problem described above, this study proposes a Human Machine Interface (HMI) that provides information about the objects and reasons of RtI to the driver. Using the proposed HMI, the driver learns the objects and reasons of RtI, aiming to calibrate trust for the ADS. To verify the effectiveness of the proposed HMI for trust calibration, it is planned to reproduce a scene in a driving simulator which has multiple objects and reasons of RtI. As a preliminary study, the scene has two objects of RtI which are the fog and a car stopping in it. Through the HMI providing information about the object of RtI, participants are hoped to appropriately trust the system and take over the driving task.
language of the presentation: Japanese
発表題目: ドライバのADSに対する信頼感の適切化のためにRtIの対象・理由を学習させるHMI
発表概要: レベル3自動運転システム(ADS)の介入要請 (RtI) は,自動運転システムがシステム制限 (SL) に陥った場合,または運用設計領域 (ODD) 外に陥った場合に,ドライバに発行する運転引継ぎの要求である. ただし,ドライバがRtIを正しく理解していない場合,システムへの過信や依存が発生する可能性がある. ある特定のRtIが発行される場面においてもRtIの理由は複数考えられ, (1) 何に対してRtIが発行されるのか (RtIの対象) , (2) なぜRtIが発行されるのか (RtIの理由) をドライバが理解しにくかったり誤解したりすると,ドライバがADSを不適切に信頼し,事故につながる可能性がある. 以上の問題点に対して,本研究では,ドライバにRtIの対象・理由を提示するHMI(Human Machine Interface)を提案する.提案するHMIを利用し,ドライバにRtIの対象・理由を学習させ,ADSに対する信頼感の適切化を目指す. ドライビングシミュレータでRtIの対象が複数あるように見えるシーンを再現し,HMIによるRtIの対象・理由提示の効果を検証する予定である. まず,予備検討として,霧とその中で停車する車両が存在する(複数のRtIの対象がある)シーンを構築し,HMIによるRtIの対象提示の効果を検証する.
 
ZHANG SI YUAN M, 1回目発表 光メディアインタフェース 向川 康博, 加藤 博一, 舩冨 卓哉, 藤村 友貴, 北野 和哉

title: Predicting appearance of metal cutting surface based on normal map

abstract: when cutting the metal, machining defects occur due to tool vibration and other factors. Therefore, it is necessary to evaluate the appearance of the metal cutting surface for quality control of metal parts. In this study, we try to predict the appearance of metal cutting surface based on normal map. Normal map is a kind of texture that stores the normal and allows for increasing the visual complexity of a surface without increasing the complexity of its geometry. We try to use the normal map to get more realistic appearance of metal cutting surface.

language of the presentation: English 

 
日垣 輝大 M, 1回目発表 光メディアインタフェース 向川 康博, 加藤 博一, 舩冨 卓哉, 藤村 友貴, 北野 和哉
title: Adaptive sampling for lightweight light-field measurements
abstract: A light field camera is a camera that records information on rays of light in four dimensions incident on the camera, and realizes image processing such as refocusing and synthetic aperture by recording the direction of incidence of rays of light that would be integrated in a normal camera. In conventional measurement methods, four-dimensional data is measured by developing parallax images of the top, bottom, left, and right sides on an image sensor. Usually, disparity images have a problem that there are redundant areas in some scenes because of small disparity. In this research, we propose a light-feild imaging method that efficiently records only disparity changes. Specifically, we observe changes in luminance values produced by an optical system that modulates the direction of light rays over time, and recover the light field from these temporal changes. This allows adaptive recording of the light ray space in a scene, thereby reducing the amount of data. As progress to date, we have constructed the optical system and captured partial aperture images as a preliminary experiment.
language of the presentation: Japanese
発表題目: 適応的サンプリングによる軽量な光線空間計測の実現
発表概要: ライトフィールドカメラは、カメラに入射する四次元の光線情報を記録するカメラであり、通常のカメラでは積分される光線の入射方向を記録する事でリフォーカスや合成開口等の画像処理を実現する。 従来の計測手法では、上下左右の視差画像をイメージセンサに展開する事で四次元のデータを計測している。通常、視差画像群は微小な視差であるためにシーンによっては冗長な領域が存在する問題がある。 本研究では、視差変化のみを効率的に記録する光線空間撮影手法を提案する。 具体的には、光線方向を時間的に変調させる光学系によって生じる輝度値の変化を観測し、その時間変化から光線空間を復元する。これにより、シーン中の光線空間を適応的に記録する事ができるため、データ量を削減できる。 現在までの進捗として、光学系の構築と予備実験として部分開口画像の撮影を行った。
 
大武 一平 M, 1回目発表 光メディアインタフェース 向川 康博, 清川 清, 舩冨 卓哉, 藤村 友貴, 北野 和哉
title: Accelerating Dynamic Projection Mapping System Using Event-based Camera
abstract: We are developing a dynamic projection mapping system that links the movement of the performer and the projection mapping in a scenario where a transparent screen called a Fusion Wall is set up in front of the performer. However, the base system using Azure Kinect has a problem of high latency and low frame rate. This study aims to solve this problem by using an Event-based Camera with lightweight and high-speed processing for correction and interpolation.
language of the presentation: Japanese
発表題目: Event-based Cameraを用いた動的プロジェクションマッピングシステムの高速化
発表概要: 演者の前方にFusion Wallと呼ばれる透過型スクリーンが設置されるシナリオでの,演者の動きとプロジェクションマッピングがリンクするような動的プロジェクションマッピングシステム開発を行っている.しかしAzure Kinectを用いたベースシステムには,レイテンシが大きくフレームレートが小さいという問題があった.これを本研究ではEvent-based Cameraを用いた軽量高速処理による補正・補間によって解決することを目指す.
 

会場: L3

司会: 藤本 大介
浦上 大世 M, 2回目発表 ネットワークシステム学 岡田 実, 林 優一, 東野 武史
title: Efficient Beam Prediction for Intelligent Reflecting Surface-Assisted mmWave Systems based on Memory Driven Simple Transformer Deep Learning Model
abstract: In this presentation, we propose a memory driven simple transformer (MDST) deep learning (DL) model with the autoregressive module and spatial attention method, and channel matrix compression method to realize the high accuracy with small data collecting and low training overhead for intelligent reflecting surface (IRS)-assisted millimeter wave (mmWave) wireless communication system. Specifically, in the channel matrix compression, we convert the channel state information (CSI) into the sparse angular-delay domain, then the data size is significantly compressed in the delay domain. In the MDST-DL model, first, compressed CSI is input to the gated recurrent unit (GRU) to extract the frequency features. After that, these frequency features are input to the simple spatial attention to obtain the global features based on the frequency features extracted from each element. As the results show, in the case of compressed channel, the MDST-DL model can achieve the sufficient average accuracy of 80.0% with 17min 12s in comparison with the average accuracy of original channel of 85.7% with 22min 10s.
language of the presentation: Japanese
発表題目: Memory Driven Simple Transformerを用いたIntelligent Reflecting Surface支援mmWaveシステムにおける効率的な高信頼ビーム予測
発表概要: 本発表では、Intelligent Reflecting Surface(IRS)支援millimeter wave(mmWave)無線通信システムにおいて、小さなデータ収集と低い学習オーバーヘッドで高精度なビーム予測を実現するために、自己回帰モジュールと空間アテンションを用いたMemory Driven Simple Transformer(MDST)Deep Learning(DL)モデル、およびチャネル行列圧縮法を提案する。具体的には、チャネル行列圧縮法では、Channel State Information(CSI)をスパースな角度-遅延領域に変換し、遅延領域でデータサイズを大幅に圧縮する。MDST-DLモデルでは、まず圧縮されたCSIをGated Recurrent Unit(GRU)に入力し、周波数特徴量を抽出する。その後、この周波数特徴量をシンプルな空間アテンションに入力し、IRSの各素子から抽出された周波数特徴量に基づき、グローバル特徴量を取得する。その結果、圧縮チャネルを用いた場合、MDST-DLモデルは17分12秒で80.0%の平均精度を達成し、オリジナルチャネルを用いた場合の22分10秒で85.7%と比較して、小さいオーバーヘッドで十分な精度を達成しており、提案DLモデルとチャネル行列圧縮法の有効性が確認できた。
 
西田 悠人 M, 1回目発表 自然言語処理学 渡辺 太郎, 中村 哲, 上垣外 英剛
title: Generating diverse translation with kNN-MT
abstract: It is important for a machine translation system to output multiple diverse candidate translations for an input sentence in terms of the usability of candidates for post-editing. However, it is known that the multiple candidate sentences differ only slightly from each other when using beam search, which is the standard search algorithm for neural machine translation systems that are currently widely used. Therefore, we focus on the fact that kNN-MT, an example-based machine translation method, is highly effective when there are multiple possible translations of the input sentence, and propose a method that applies the kNN-MT. The proposed method is expected to diversify the candidate translations by kNN-MT, which allows probabilistic consideration of tokens that would not normally be included in the candidate translations. Experimental results show that the proposed method improves the diversity of candidate translations.
language of the presentation: Japanese
発表題目: kNN機械翻訳による多様な翻訳候補の生成
発表概要: 機械翻訳システムが入力された文に対して複数の多様な訳の候補を出力することは、翻訳の後編集に活用できるなどの点から重要である。 しかし、現在広く用いられているニューラル機械翻訳システムの標準的な探索アルゴリズムであるビームサーチには、出力される複数の候補文がほとんど同一になってしまう多様性低下の問題が存在する。 そこで、本研究では用例ベースの機械翻訳手法であるkNN機械翻訳が入力文に複数の訳があり得る際に高い翻訳精度を達成するという点に着目し、kNN機械翻訳の手法を応用した手法を提案する。 提案法では、k近傍探索によって通常は翻訳候補に入らないようなトークンを考慮できるため、翻訳精度を維持しつつ翻訳候補の多様化が期待できる。 実験の結果、提案法によって翻訳精度を維持しつつ翻訳候補の多様性が向上することを示した。
 
富村 勇貴 M, 1回目発表 自然言語処理学 渡辺 太郎, 中村 哲, 上垣外 英剛
title: Coreference resolution for long documents
abstract: Coreference resolution is the task of analyzing clusters of words that refer to the same entity in a document. We analyze the characteristics of CoNLL2012, a common dataset used for coreference resolution, and point out the possibility of model training problems for long sentences. Then, we examine whether the accuracy of machine learning models currently used for coreference resolution, especially for long sentences, can be improved by managing the loss function based on the training data.
language of the presentation: Japanese
発表題目: 長い文書に対する共参照解析
発表概要: 共参照解析は、文書中の同じ実体を参照する単語のクラスタを分析するタスクである。我々は、共参照解析によく用いられるデータセットであるCoNLL2012の特徴を分析し、長文に対するモデル学習の問題が発生する可能性を指摘する。そして、現在共参照解消に用いられている機械学習モデルについて、学習データに基づく損失関数の管理により、特に長文に対する精度を向上させることができるかどうかを検討する。
 
田中 康紀 M, 1回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, 須藤 克仁
title: Tokenization using pre-trained token-free model's attention
abstract: ByT5, a token-free model, does not require tokenization into subwords and eliminates out-of-vocabulary by using UTF-8 input directly. On the other hand, it has the disadvantage of longer sequence lengths compared to the subword model. In particular, the Transformer's attention calculation requires O(n²•d) of computational complexity. The proposed method preserves UTF-8 as input and combines tokens using the encoder's self-attention, allowing the token-free model to reduce the computational complexity in fine-tuning downstream tasks and inference.
language of the presentation: Japanese
発表題目: 事前学習済みトークンフリーモデルのattentionを用いたトークン結合
発表概要: トークンフリーモデルであるByT5は、Transformer encoderの入力をUTF-8に分解して置き換えることで、サブワードへのトークン化を必要とせず、未知語を無くした。一方で、サブワードと比べて、シーケンス長が長くなる欠点がある。特に、Transformerのattentionの計算はO(n²•d)の計算量が必要となる。提案する手法は、入力はUTF-8を保持したまま、encoderのself-attentionを利用してトークンを結合し、トークンフリーモデルが下流タスクへのfine-tuningと推論で計算量を減らすことを可能にする。
 
上里 勇希 M, 2回目発表 知能コミュニケーション 中村 哲, 渡辺 太郎, Sakriani Sakti