コロキアムB発表

日時: 11月26日 (水) 2限目(11:45-12:30)


会場: Group B

司会:
御前 賢斗 M, 1回目発表 インタラクティブメディア設計学 加藤 博一 和田 隆広 澤邊 太志 Isidro Butaslac
title: Surrounding Pedestrian Anomaly Detection Method for Realizing a Comfortable Vehicle Environment
abstract: To support the safe driving of vehicles, collision avoidance with pedestrians is essential. Most conventional methods for pedestrian-vehicle collision avoidance recognized pedestrians positioned in front of the vehicle. However, it is difficult to secure enough time for avoidance actions with this approach. As a countermeasure, research is also being conducted to estimate the future trajectory of pedestrians and predict collisions in advance. However, this method cannot take into account diverse potential dangers, such as people staggering or children running beside the road. Furthermore, since the majority of the data used for training is from normal situations, there is a possibility that the prediction accuracy may decline in rare scenarios like collisions. To solve these problems, this study takes an approach of detecting pedestrians at risk of collision as anomalies. By doing so, it becomes possible to treat diverse potential dangers collectively. Furthermore, since only data from normal pedestrians, which means pedestrians not at risk of collision, is used during training, problems caused by the scarcity of collision data can be resolved.
language of the presentation: Japanese
発表題目: 快適な車両環境実現のための周辺歩行者の異常検知手法
発表概要: 車両の安全な運転を支援するためには,対人衝突回避が不可欠である.既存の歩行者と車両の衝突回避のための従来手法の多くが,車両前方の歩行者を認識するものであった.しかしこれは,回避動作のための十分な時間を確保することが難しい.この対策として,歩行者の将来軌道を推定し,事前に衝突を予測する研究もおこなわれている.しかしこの手法ではふらついている人や道路わきを走る子どもなどの,多様な潜在的危険を考慮することができない.また,学習に用いられるデータの大半が正常時のものであるため,衝突などの稀な場面における予測精度が低下する可能性もある. 本研究はこれらの問題を解決するために,衝突の危険がある歩行者を異常として検知するアプローチをとる.このようにすることで,多様な潜在的危険をひとまとめにして扱うことが可能である.また,学習時には正常な歩行者,つまり衝突の危険がない歩行者のデータのみを用いるので,衝突時のデータ数が少ないことによる問題を解決することができる.
 
谷 篤弥 M, 1回目発表 サイバーレジリエンス構成学 門林 雄基 和田 隆広 妙中 雄三
title: Examination of Challenges and Vulnerabilities in gPTP Synchronization Algorithms for In-Vehicle TSN
abstract: Time-Sensitive Networking (TSN), which provides high-precision time synchronization primarily for the automotive sector, is increasingly being adopted in in-vehicle Ethernet. TSN achieves strict time synchronization between ECUs using gPTP (generalized Precision Time Protocol) based on IEEE 802.1AS. However, gPTP assumes symmetric network delays, raising concerns about the potential for “asymmetric delay attacks” where introducing delays in specific directions could induce synchronization errors. This research experimentally determines the magnitude of synchronization errors that could occur on in-vehicle networks when the delay symmetry assumed by gPTP is disrupted.
language of the presentation: Japanese
発表題目: 車載TSNにおけるgPTP同期アルゴリズムの課題と攻撃可能性の検討
発表概要: 自動車分野を中心に、高精度な時間同期を提供する Time-Sensitive Networking(TSN)が車載 Ethernet へ導入が進んでいる。TSN では、IEEE 802.1AS に基づく gPTP(generalized Precision Time Protocol)により、ECU 間の厳密な時刻同期が実現されている。しかし、gPTP はネットワーク遅延の対称性を前提としており、特定方向に遅延を加えることで同期誤差を誘発できる「非対称遅延攻撃」の可能性が指摘されている。本研究では、まずgPTP が前提とする遅延対称性が崩れた場合に、車載ネットワーク上でどの程度の同期誤差が発生し得るかを実験的に明らかにする。
 
八杉 夏帆 M, 1回目発表 サイバネティクス・リアリティ工学 清川 清 加藤 博一 内山 英昭 Perusquia Hernandez Monica 平尾 悠太朗
title: Development and Empirical Evaluation of an AR Application to Support Geometric Understanding in Students with Dyscalculia
abstract: Students with dyscalculia often experience persistent difficulties in understanding geometric concepts, particularly in visualizing shapes and grasping spatial relationships. These challenges make it hard for them to connect abstract geometric ideas with concrete representations. The aim of this study is to develop an augmented reality (AR) application that supports geometric understanding in students with dyscalculia and to conduct a practical evaluation of its educational effectiveness. We are currently designing and prototyping the application using Unity and AR Foundation. The system will include functions that allow learners to visualize and manipulate three-dimensional geometric figures through intuitive AR interactions, such as viewpoint changes and shape transformations. In addition, we plan to incorporate support features tailored to common learning difficulties, including guided exploration, step-by-step tasks, and real-time feedback designed to promote deeper understanding of geometric properties.For the empirical evaluation, we plan to collaborate with a partner middle school and conduct a study with students who exhibit dyscalculia tendencies. The evaluation will employ a pre- and post-test design to measure changes in spatial reasoning skills and comprehension of fundamental geometric concepts. Furthermore, usability impressions and motivational effects will be assessed through questionnaires and interviews.Through this research, we aim to clarify the extent to which AR-based learning support can contribute to improving geometric understanding in students with dyscalculia. The findings are expected to provide insights for the design of inclusive educational tools and demonstrate the potential of AR technology as an effective medium for supporting learners with mathematical learning difficulties.
language of the presentation: Japanese
発表題目: ディスカリキュリア生徒の図形理解を支援するARアプリケーション開発と実践評価
発表概要: ディスカリキュリア(算数障害)をもつ生徒は、図形の特徴の把握や空間関係の理解に困難を抱えやすく、抽象的な図形概念を習得しにくいという課題が指摘されている。本研究では、これらの学習困難に対処するため、ディスカリキュリア傾向のある生徒の図形理解を支援する拡張現実(AR) アプリケーションを開発し、その教育的有効性を実践的に検証することを目的とする。現在、Unity と AR Foundation を用いたアプリケーションの設計とプロトタイプ開発を進める段階で、三次元図形の視覚化、視点変更、形状操作など、直感的なインタラクションを可能にする機能を搭載する予定である。さらに、図形の特徴理解を促すため、ガイド付き操作や段階的課題、リアルタイムのフィードバック機能など、学習困難の特性に配慮した支援機能も組み込む計画である。本研究の評価実験は、協力を得られる中学校と連携し、ディスカリキュリア傾向を有する生徒を対象に実施する予定である。事前・事後テストにより空間認知能力および図形概念の理解度の変化を測定し、加えてアプリの操作性や学習意欲に関するアンケート・インタビューを通して主観的評価を収集する計画である。本研究により、ARを活用した学習支援がディスカリキュリア生徒の図形理解にどの程度寄与し得るかを明らかにし、数学学習に困難を抱える学習者への新たな支援手法の確立を目指す。また、インクルーシブ教育の観点から、教育現場に導入可能なICT教材の設計指針についても知見を提供することを期待している。
 
SUN RONGJUN M, 1回目発表 サイバネティクス・リアリティ工学 清川 清 Sakriani Sakti 内山 英昭 Perusquia Hernandez Monica 平尾 悠太朗
title: High-Precision Facial Segmentation and Part Generation for Anime Characters
abstract: With the growth of virtual character production, the need for fine-grained facial parts in anime characters continues to increase. However, general segmentation models designed for real faces struggle with simplified contours and diverse styles in anime images, leading to low accuracy in key regions. Semantic segmentation also cannot restore occluded areas, making it unsuitable for creating complete parts required by Live2D.This study aims to develop a high-precision facial segmentation method for anime characters and explore automatic part-generation techniques to produce complete components for practical animation workflows.
language of the presentation: Japanese
発表題目: アニメキャラクターの顔における高精度セグメンテーションとパーツ生成
発表概要: バーチャルキャラクター制作の拡大により、アニメキャラクターの細かな顔パーツの需要が高まっている。しかし、実写向けの汎用モデルはアニメ特有の簡略化された輪郭や多様な作風に対応できず、重要領域の精度が不十分である。また、セマンティックセグメンテーションでは隠れた部分を補完できず、Live2D 用の完全なパーツ生成が困難となる。本研究では、アニメキャラクターの顔に特化した高精度セグメンテーション手法と、自動パーツ生成の可能性を探り、実制作で利用できる完全な顔パーツの生成を目指す。
 
中川 大地 M, 1回目発表 サイバネティクス・リアリティ工学 清川 清 荒牧 英治 内山 英昭 Perusquia Hernandez Monica 平尾 悠太朗
title: Trait-Aware Trust Calibration from Facial Expressions and Physiological Signals
abstract: Research on estimating human trust in virtual agents and robots from biosignals such as heart rate, electrodermal activity, and EEG has reported promising performance. In contrast, camera-based facial features alone have often yielded unstable or low accuracies, partly due to noisy image-based features and large individual differences in expressivity. This study aims to improve trust estimation from facial information by (1) integrating camera-based facial features with facial EMG and auxiliary physiological signals such as heart rate and electrodermal activity, and (2) introducing a calibration method that leverages individual traits related to trust. We plan an experiment in which participants interact with a virtual agent in a decision-making task while we record facial videos, EMG, heart rate, and electrodermal activity, and collect subjective trust ratings and trait questionnaires. Using these multimodal data, we will explore feature representations and trait-based calibration strategies that reduce between-person variability and evaluate machine learning models for trust estimation.
language of the presentation: Japanese
発表題目: 表情情報および生体信号を用いた個人特性に基づく信頼推定キャリブレーションの一検討
発表概要: 近年,人とロボット/エージェントとのインタラクションにおいて,心拍や皮膚電気活動などの生体情報から信頼度を推定する研究が行われてきた一方で,カメラで取得した表情データのみによる信頼推定は,被験者ごとの表情表出のばらつきや特徴量のノイズにより十分な精度が得られていない.本研究では,カメラから抽出した表情特徴と顔面筋電図(EMG),補助的な生体情報(心拍,EDA など)を組み合わせるとともに,信頼傾向やリスク選好などの個人特性を用いたキャリブレーション手法を導入することで,信頼推定の精度向上と個人間ばらつきの低減を目指す.具体的には,仮想エージェントとの意思決定タスク中に表情動画・EMG・心拍・EDA を計測し,主観的な信頼評定および個人特性質問紙と併せたマルチモーダルデータセットを構築し,表情特徴設計と個人特性に基づく補正戦略を検討する.
 
倉本 真菜 M, 1回目発表 ソーシャル・コンピューティング 荒牧 英治 渡辺 太郎 若宮 翔子 西山 智弘 Le Vu Trung Duong
title: Toward Rewriting Medical Research Texts for Greater Accessibility
abstract: Medical research texts are difficult for general readers to understand, necessitating conversion into plain language. This study proposes a method to automatically convert summaries of medical research findings into text comprehensible to non-specialist readers using large language models (LLMs). We constructed an evaluation rewriting dataset by generating simulated summaries from actual medical research findings and annotating them with expert input. Our proposed method utilizes a paraphrasing checklist from prior research to control LLM output. We quantitatively measure the retention of original meaning and the degree of expression change using ROUGE, BLEU, and BERTScore. Experiments confirm that the proposed method preserves the original meaning while making the text easier to understand and convey. Based on the results, we discuss the effectiveness and challenges of the proposed method for rewriting medical research summaries for non-specialist readers. Furthermore, we plan to expand and construct the dataset and conduct evaluations using crowdsourcing in the future.
language of the presentation: 日本語 (Japanese)
発表題目: つたわりやすい医学研究テキストへの書き換えをめざして
発表概要: 医学研究テキストは一般読者には理解困難であり、平易な表現への変換が求められる。本研究は、大規模言語モデルを用いて医学研究成果概要を専門外読者にも理解可能な文章へ自動変換する手法を提案する。実在の医学研究成果概要から生成した模擬的な成果概要を対象とし、専門家によるアノテーションを通じて評価用の書き換えデータセットを構築する。提案手法では、先行研究の言い換えチェックリストを活用してLLMの出力制御を行う。結果に対してROUGE、BLEU、BERTScoreで原文の意味保持度と表現の変化度を定量的に測定する。実験により、提案手法は原文の意味を保持しつつ、わかりやすく伝わりやすくなることを確認する。得られた結果に基づき、専門外の読者向けの医療研究概要の書き換えにおける提案手法の有効性と課題を検討する。さらに、データセットを拡大して構築し、それに対してクラウドソーシングを用いた評価も今後実施する予定である。
 
LIU SIYUAN M, 1回目発表 ソフトウェア設計学 飯田 元 松本 健一 柏 祐太郎 Reid Brittany
title: Evaluating Cross-Language Transfer for Refactoring Detection with Large Language Models
abstract: The ability to detect refatoring is crucial to understanding software evolution. Many studies have proposed various automated refactoring detection tools, such as RefactoringMiner and PyRef, however most are language-specific. Developing tools for new languages requires creating custom rules for each language, which is time-consuming and tedious. This paper empirically evaluates the potential of Cross-Language Transfer (CLT) Learning using Large Language Models (LLMs) as a more general and cost-effective alternative in the context of refactoring detection. Specifically, we compare CLT prompting (using examples from one language to detect refactorings in another) against In-Context Learning (ICL) prompting with native-language examples. Our results show that cross-language (Java→Python) transfer is highly effective, significantly outperforming a zero-shot setting (Avg. F1 0.564 vs. 0.475). Surprisingly, it nearly matches the performance of the native Python→Python "Gold" standard (0.570). These findings suggest that CLT is a promising direction for bypassing language-specific tool development.
language of the presentation: English
 
ハサン トウリク M, 1回目発表 ディペンダブルシステム学 井上 美智子 門林 雄基 笹田 大翔
title: Proof of existence of autonomous vehicles in snowy regions
abstract: The safe operation of autonomous driving technology requires accurate recognition of surrounding vehicles (proof of vehicle presence). Particularly in conditional autonomous driving at Level 3 and above, where the system assumes driving decisions, reliance on the driver's visual confirmation is impossible, necessitating reliable sensor-based proof of presence. Current systems' primary sensors, LiDAR and cameras, exhibit severe performance degradation during snowfall. LiDAR misidentifies snowflakes as obstacles, while cameras suffer drastically reduced detection ranges due to poor visibility and lens contamination. This significantly increases the risk of rear-end collisions and head-on collisions, particularly in snowy regions, severely compromising autonomous driving system safety. Therefore, this research proposes a novel vehicle presence verification method to complement these physical sensor limitations. By directly transmitting and sharing vehicle presence information via vehicle-to-vehicle (V2V) communication, it enables recognition unaffected by environmental conditions. However, continuous transmission of location data by vehicles poses privacy risks, such as third-party tracking and estimation of behavioral patterns. Therefore, we design a zero-knowledge proof protocol that allows vehicles to prove their legitimate presence while concealing sensitive vehicle information, such as location data.
language of the presentation: Japanese
発表題目: 降雪地域における自動運転車両の存在証明
発表概要: 自動運転技術の安全な運用には、周辺車両の正確な認識(車両の存在証明)が不可欠である。特にレベル3以上の条件付き自動運転では、システムが運転判断を担うため、ドライバーの目視確認に依存できず、センサーベースの確実な存在証明が求められる。現行システムの主要センサーであるLiDARやカメラは、降雪時に深刻な性能低下を示す。LiDARは雪片を障害物として誤検知し、カメラは視界不良やレンズへの付着により認識距離が大幅に短縮される。特に積雪地域において追突事故や出会い頭衝突のリスクを高め、自動運転システムの安全性を著しく損なう。そこで本研究は、この物理センサーの制約を補完する新たな車両存在証明手法を提案する。車車間通信(V2V)を用いて車両の存在情報を直接伝達・共有することで、環境に左右されない認識を実現する。ただし、車両が継続的に位置情報を送信する場合、第三者による追跡や行動パターンの推定といったプライバシ侵害のリスクが生じる。そこで車両が自身の正当な存在を証明しつつ、位置情報などの機密性の高い車体情報を秘匿するゼロ知識証明プロトコルを設計する。
 
藤井 羽優 M, 1回目発表 ネットワークシステム学 岡田 実 林 優一 東野 武史 Dipanita Chakraborty
title: A Study on Linearization Methods using Deep Reinforcement Learning for Optical Modulators and Nonlinear Amplifiers in A-RoF Links
abstract: In next-generation mobile communications (5G/Beyond 5G), Analog Radio-over-Fiber (A-RoF) relay links are seen as promising for eliminating coverage holes—areas where radio waves are difficult to reach—by relaying wireless signals in analog form over optical fiber. However, it is known that two components in this system exhibit nonlinear input/output characteristics: the E/O converter, which converts electrical signals to optical signals, and the power amplifier (PA), which amplifies the signal for transmission. Generally, such nonlinearities interact in a complex manner during signal processing, significantly impacting signal quality degradation. This research investigates an adaptive linearization method using deep reinforcement learning (DRL) to compensate for this complex nonlinearity.
language of the presentation: Japanese
発表題目: A-RoFリンクにおける光変調器と非線形増幅に対する深層強化学習による線形化法の検討
発表概要: 次世代移動体通信(5G/Beyond 5G)においては、電波が届きにくいエリア(カバレッジホール)を解消するため、無線信号をアナログのまま光ファイバで中継するA-RoF (Analog Radio-over-Fiber) 中継リンクの利用が有望視されている。しかし、このシステムでは、電気信号を光信号に変えるE/O変換器と、信号を増幅して送信する電力増幅器(PA)の2箇所が、その入出力特性に非線形性を持つことが知られている。一般に、このような非線形性は信号処理の過程で複合的に作用し、信号品質の劣化に大きな影響を与える。本研究では、この複合的な非線形性の補償を目的として、深層強化学習(DRL)を用いた適応的な線形化法を検討する。
 
児島 ひかる M, 1回目発表 ヒューマンAIインタラクション Sakriani Sakti 渡辺 太郎 大内 啓樹 Faisal Mehmood Bagus Tris Atmaja
title:Assessing Listener Comprehension in Monotonic Translation toward Realizing Listener-Centric English-Japanese Simultaneous Machine Translation
abstract: The monotonic translation is widely employed in English-Japanese simultaneous machine translation to alleviate the delay stemming from word order discrepancies. This translation approach involves segmenting the source speech into smaller units, or chunks, and translating them sequentially. While this strategy potentially assists listener comprehension by maintaining the information structure of the original text, it is also criticized for generating redundant translations that may actually impede understanding. However, there is a lack of research that has specifically assessed listeners' comprehension when presented with translations produced by the monotonic translation. This study attempts to assess and investigate listeners' comprehension under the monotonic translation.
language of the presentation: Japanese
発表題目:聞き手の負担を考慮した英日同時機械翻訳の実現に向けた、順送り方略における聞き手の理解度評価
発表概要: 英日同時機械翻訳において、語順の差異に起因する遅延を緩和する手法として順送り方略が広く用いられる。この訳出は発話をより短い単位であるチャンクに区切り、順次訳出していく方略である。この方略は、原文の情報構造を保持することで聞き手の理解を助ける可能性がある一方、冗長な訳文を生成し、かえって理解を妨げるとの指摘もある。しかし、順送り方略の聞き手の理解度を評価した研究は不足している。本研究では、順送り方略における聞き手の理解度を評価し考察することを試みる。
 
永岡 日向 M, 1回目発表 ヒューマンロボティクス 和田 隆広 清川 清 劉 海龍 織田 泰彰 本司 澄空
title: Relationship Between Subjective Controllability and Reflexive Eye Movements Under a Head-Fixed Gaze Condition in Ride-Type Machines
abstract: In recent years, eye movements have gained attention as an objective measure of “subjective controllability” in ride-type machines. Previous studies using a gaze target fixed in the world coordinate frame have shown that, in situations where visual input reinforces the vestibular reflex, higher controllability is associated with smaller compensation errors in eye movements relative to head motion. However, in real operation tasks, operators often fixate on objects that move together with the vehicle, such as attached tools, under which visual input suppresses the vestibular reflex. How controllability is reflected in eye movements under such suppression conditions remains unclear. This study examines a condition where the gaze target is fixed in the head coordinate frame and tests the hypothesis that higher controllability leads to smaller gaze-holding errors relative to the head-fixed target.
language of the presentation: 日本語(Japanese)
発表題目: 正面固視条件における搭乗型機械の操作性と反射眼球運動の関係
発表概要: 近年,搭乗型機械における“主観的操作性”を客観的に評価する指標として眼球運動を利用する研究が進められている。世界座標系に固定された固視点を用いた先行研究では,視覚入力が前庭反射を補強する状況で,操作性が高いほど頭部運動に対する眼球運動の補償誤差が小さくなることが示されている。しかし,実際の操縦では,搭乗者とともに動く対象を固視する場面も多く,この場合は前庭反射が視覚入力によって抑制される。この抑制状態で操作性が眼球運動に反映されるかは未解明である。本研究は,頭部座標系に固定された固視点を用い,操作性が高いほど固視点の保持誤差が小さくなるという仮説のもと検証を行う。
 
TANUSA YANISA M, 1回目発表 ユビキタスコンピューティングシステム 安本 慶一 Sakriani Sakti 諏訪 博彦 松井 智一
title: Supervised Learning with CLAP-based Features for Accurate Acoustic Activity RecognitionHuman Activity Recognition (HAR)
abstract: Human Activity Recognition (HAR) using acoustic information is attracting attention because it is less intrusive and better preserves privacy. However, developing generalized activity recognition models that perform reliably across diverse households remains challenging. In this study, we propose an acoustic-based daily living activity recognition system that lever-ages CLAP-based audio embeddings combined with a lightweight supervised learning model. We collected a new acoustic dataset comprising 23 daily in-home activities, recorded from 16 participants. We extracted acoustic features using audio embeddings from a CLAP model pretrained via text-audio contrastive learning, and trained a 1D-CNN classifier using the extracted features. We evaluated the model using four validation strategies: hold-out,stratified hold-out, leave-one-group-out (LOGO), and leave-one-participant-out (LOPO).
language of the presentation: English
 
新明 勇翔 M, 1回目発表 ユビキタスコンピューティングシステム 安本 慶一 清川 清 諏訪 博彦 佐々木 航

title: Constructive Emotion Recognition Integrating External Context and Interoception

abstract: Conventional emotion recognition research has primarily relied on external sensor data and behavioral context (e.g., physiological signals, activity logs) to estimate emotion. However, the Constructive Theory of Emotion, a recent and influential framework, posits that instances of emotion are constructed by the brain's predictions, integrating both external context and dynamic interoceptive signals from the body. Despite the theoretical importance of this integration, few existing studies have attempted to model emotion by simultaneously capturing context, subjective emotion (via ESM), and the temporal fluctuations of interoceptive metrics in a real-world setting ("in the wild"). This study aims to address this critical research gap. We plan to conduct a multi-week data collection experiment using mobile and wearable devices to gather multimodal data, including physiological signals, contextual logs, and repeated measures of interoceptive ability. Our objective is to clarify the complex relationships between these three key factors and verify whether the integration of dynamic interoceptive metrics significantly improves the accuracy of emotion estimation compared to traditional context-only models.

language of the presentation: Japanese


発表題目: 外的コンテキストと内受容感覚を統合した構成主義的感情認識

発表概要: 従来の感情推定研究は、生理指標や行動ログといった外的センサー情報 (コンテキスト) のみに依存して行われてきた. しかし, 近年の有力な感情理論である構成主義的感情理論では, 感情は脳が外的コンテキストと身体からの動的な内受容感覚を統合・予測することで構成されると定義される. この理論的な重要性にもかかわらず, 実環境において, 感情, 外的コンテキスト, および内受容感覚の変動を同時に計測し, それらを統合した感情推定モデルを構築した研究事例は存在しない. そこで, 本研究は, この未解明な研究課題に取り組む. スマートフォンとウェアラブルデバイスを用いた複数週間のデータ収集実験を計画し, 生理指標, 行動履歴に加え, 内受容感覚を計測・取得する. これらの複合的なデータ解析を通じて, 3つの要素間の複雑な関係性を明らかにし, 内受容感覚を組み込むことで, 従来のコンテキスト依存モデルに比べ感情推定の精度の向上, それら複合モデルの提案を目的とする.

 
北村 悠人 M, 1回目発表 ロボットラーニング 松原 崇充 安本 慶一 柴田 一騎 鶴峯 義久 佐々木 光
title: Development of a Learning Method for Multi-Robot Control Based on Language Instructions Capable of Understanding Human Intent
abstract: Recent advancements in Large Language Models (LLMs) have made it increasingly possible to control multi-robot systems using natural language. However, existing technologies still face challenges in interpreting the intent contained in human instructions and executing flexible control adapted to it. One reason for this is that conventional methods typically learn robot policies assuming fixed language instructions provided in advance, which often leads to a discrepancy between human intent and the actual behavior of the multi-robot system. To address this, this study aims to develop a learning method capable of determining multi-robot behaviors according to the intent within language instructions. In this report, as a preliminary study, we investigated a learning framework that adjusts behaviors based on the "intensity" of the instructions. Through simulations of a task balancing resource collection and adherence to language instructions, we confirmed that the system can modulate task performance and the instruction compliance rate according to the instruction intensity.
language of the presentation: Japanese
発表題目: 人の意図を理解可能な言語指示に基づくマルチロボット制御のための学習法の構築
発表概要: 近年,大規模言語モデルの発展に伴い,自然言語によるマルチロボットの制御が可能となりつつある.しかし,現行技術では,人間の言語指示に含まれる意図を汲み取り,それに応じた柔軟な制御を行うことは依然として困難である.この理由として,これらの手法は事前に与えられた固定の言語指示を前提としてロボットの方策を学習するため,人の意図とマルチロボットの行動が乖離しやすいことが考えられる.本研究では,言語指示に含まれる意図に応じてマルチロボットの行動を決定可能な学習法を構築することを目的とする.本報告ではその初期検討として,言語指示の「強度」に応じて行動を調整可能な学習フレームワークを検討した.資源回収と言語指示遵守を両立するタスクで、指示強度に応じてタスク性能と指示遵守率を調整可能であることをシミュレーションで確認した.
 
YU XINMENG M, 1回目発表 光メディアインタフェース(マルチモーダル環境認識) 向川 康博☆ 川西 康友 薗頭 元春 藤村 友貴 北野 和哉
title: High-Speed SLAM Using Mixture of Experts and Instance Information
abstract: In Visual SLAM, image matching is one of the most important fundamental components, and its results greatly influence the accuracy of pose estimation and map construction. However, existing matching methods struggle to achieve both high accuracy and high speed at the same time, which limits the performance of Visual SLAM. To address this problem, this study proposes dynamically switching the matching method by using a Mixture of Experts framework. Sparse matching is used in high-texture scenes, while semi-dense matching is used in low-texture scenes. This reduces the frequency of semi-dense matching and aims to improve speed while maintaining accuracy. Dense matching, which is commonly used in SLAM, provides high accuracy but is slow. Therefore, semi-dense matching is introduced for speed improvement, but it has the drawback that its accuracy decreases due to mismatches. To address this issue, I use instance segmentation to assign IDs to objects and introduce a bonus–penalty rule based on ID consistency into the matching process of semi-dense matching model. This allows model to distinguish objects that look the same but differ in ID, thereby reducing mismatching.
language of the presentation: Japanese
発表題目: 混合エキスパートとインスタンス情報選択を用いた高速な SLAM
発表概要: Visual SLAM では,画像マッチングが最も重要な基礎の一つであり,その結果は姿勢推定や地図構築の精度に大きく影響する.しかし,現在のマッチング方法は高精度と高速性を同時に満たすことが難しく,Visual SLAM の性能を制限している.この問題を解決するために,本研究では混合エキスパート(MoE)選択を用いて,状況に応じて最適なマッチング方法を切り替えることを提案する.高テクスチャ領域ではスパースマッチングを用い,低テクスチャ領域ではセミデンスマッチングを用いる.これによって,セミデンスマッチングの使用頻度を下げ,精度を保ちながら速度の向上を目指す.SLAMで一般的に用いられるデンスマッチングは高精度だが低速,今回高速化のためにセミデンスを導入するが誤マッチで精度が下がる難点がある.この困難に対処するため,インスタンスセグメンテーションを用いて物体に ID を付与し,セミデンスマッチングモデルのマッチング過程にIDの一貫性に基づくボーナスとペナルティのルールを加える.これによって,外観が同じでもIDの異なる物体を モデルが区別できるようにし,誤マッチの発生を抑える.
 
北川 敦大 M, 1回目発表 光メディアインタフェース 向川 康博 池田 和司 藤村 友貴 北野 和哉
title: Anime Inbetweening Support via Character 3D Model Generation from Sparse-view Images
abstract: The creation of 3D character models requires complex manual labor and expert technical skills. Automating this process is crucial for enhancing content creation workflows across various industries, including animation, games, and films. The animation industry, in particular, depends on conventionally labor-intensive methods, leading to issues such as severe workloads for animators. To address this challenge in animation production support, the methods were recently proposed, which automate the inbetweening process by estimating 3D depth information between frames. However, these methods have the problem that the geometric representation of the character's occluded areas is unstable. In this research, we aim to generate a 3D character model by 3D reconstruction from sparse-view images in order to use it as a guide to enhance inbetweening support for scenes including anime characters. In the future, we will build a 3D reconstruction pipeline to generate high-quality multi-view images of a character and robustly integrate them to support anime production.
language of the presentation: Japanese
発表題目: 少数視点画像を用いたキャラクター3Dモデル生成によるアニメ中割支援
発表概要: 人物3Dモデルを作成するには多くの煩雑な手作業と熟練した技術が要求されるため、それらを自動生成することはアニメ、ゲーム、映画といったコンテンツ制作のワークフロー効率化に役立つ。特に、アニメ産業においては従来から労働集約的な制作方法が採られており、アニメーターの労働環境などの問題を引き起こしている。この課題に対処するためのアニメ制作支援に関する研究で、フレームの3D深度情報を推定することにより中割という制作工程を自動化する手法が近年提案されている。しかし、これらの手法はキャラクターの遮蔽部分における幾何学的表現が不安定であるという課題を抱える。 本研究では、アニメのキャラクターを含むシーンを対象とし3D情報を用いた中割支援を強化するガイドとして活用するために、少数視点のキャラクター画像を用いた3D再構成により人物3Dモデルを生成することを目的とする。今後は、キャラクター画像の高品質な多視点画像を生成し、これらをロバストに統合するアニメ制作支援のための3D再構成パイプラインを構築する。
 
吉岡 重治 M, 1回目発表 大規模システム管理 笠原 正治 安本 慶一 原 崇徳
title: A Study on Rapid and Safe Evacuation Route Selection under Localized Downpours
abstract: In recent years, localized downpours, often in the form of linear rainbands, have become increasingly frequent in Japan. Against this backdrop, research on forecasting such downpours has been actively conducted. However, evacuation planning under localized downpours has not been sufficiently explored, particularly in terms of ensuring speed and safety during evacuation. To address this issue, this research aims to find rapid and safe evacuation routes during localized downpours. In this presentation, we introduce datasets related to road information, including those concerning landslides and flooding, to support the pathfinding process. In future work, we plan to propose a pathfinding method that enables rapid and safe evacuation leveraging these road datasets, and evaluate its effectiveness through simulations.
language of the presentation: Japanese
発表題目: 短時間の集中豪雨下における避難経路の探索に関する一検討
発表概要: 近年, 日本では線状降水帯などを原因とする短時間の集中豪雨が増加傾向にある. 一方で現在は線状降水帯による集中豪雨の発生予測についての研究も進んでいる.この研究では,そうした社会的背景を踏まえ,周囲の道路情報や土砂災害・浸水害の予測をもとにした集中豪雨時におけるより安全かつ早く移動できる避難経路を高速で発見できる手法の確立を目指す.また,得られた避難経路を評価するためのシミュレータを開発し,検証を行う.
 
新村 奨 M, 1回目発表 情報セキュリティ工学 林 優一 岡田 実 井上 美智子 藤本 大介
title: Study on Improving the Sensitivity of Hardware Trojan Detection Using PCB Radiated Emissions
abstract: Security threats involving malicious circuits, known as hardware Trojans (HTs), have been reported on printed circuit boards (PCBs) in information devices. Since an HT can be inserted at almost any location on a PCB, test methods that can evaluate the entire board are required. One approach is to detect HTs by observing changes in the spectrum of electromagnetic (EM) radiation emitted by the PCB. In this method, an excitation signal is applied to the board so that the resulting EM waves propagate across the entire PCB, and the EM spectrum is measured at multiple observation points to determine whether an HT is present. However, because PCB structures and wiring layouts differ from place to place, the frequency components that effectively couple to each observation point also vary. Consequently, if an HT is inserted at a location where EM waves do not propagate well, the EM change caused by the HT becomes small, and the detection sensitivity deteriorates. In this study, we improve the overall detection sensitivity across the PCB by optimizing the measurement frequencies and excitation conditions to enhance EM radiation.
language of the presentation: Japanese
 
門内 太一 M, 1回目発表 情報セキュリティ工学 林 優一 岡田 実 向川 康博 藤本 大介
title: Study on Skew Correction Algorithms for Automating Electromagnetic Information Leakage Attacks
abstract: Electromagnetic information leakage attacks, which capture unintentionally emitted electromagnetic waves from display devices and reconstruct the screen information. These attacks are a serious threat because they are difficult to detect and leave no traces. If the attack process is automated, even attackers without specialized knowledge or skills can carry out such attacks. This will make the threat even greater. In many cases, frame averaging of the received signals is applied to achieve high-quality image reconstruction. However, skew, arising from estimation errors in the pixel frequency during signal acquisition, causes pixel misalignment during frame averaging. As a result, the reconstructed screen images become difficult to interpret. This study clarifies the mechanisms underlying pixel frequency estimation errors and proposes an automatic skew correction algorithm.
language of the presentation: Japanese
 
小田川 晴奎 M, 1回目発表 情報基盤システム学 藤川 和利 安本 慶一 新井 イスマイル
title: Identifying DoH Traffic in Real Networks and Detecting Malicious DoH Traffic
abstract: In recent years, a technology called DNS over HTTPS (DoH), which encrypts DNS communications using HTTPS, has been gaining widespread adoption. This technology encrypts DNS communications using HTTPS, protecting them from being viewed or altered by third parties. However, from a network operations perspective, it becomes indistinguishable from other HTTPS traffic, making it difficult to detect malicious DoH traffic or even extract DoH traffic in the first place. While research exists to address these challenges, much of it assumes operation only in experimental environments, with few studies designed for deployment in actual networks. This research aims to identify malicious DoH traffic with deployment in real networks in mind. By modifying the statistical features used in machine learning to network-independent features and shortening the feature extraction timing, we aim to develop a system capable of detecting DoH traffic in real time.
language of the presentation: Japanese
発表題目: 実ネットワークにおけるDoH通信の識別と悪意あるDoH通信の検出
発表概要: 近年,DNS over HTTPS (DoH)と呼ばれるDNS通信をHTTPSを用いて暗号化する技術が普及しつつある. この技術によって,DNS通信をHTTPSを用いて暗号化し,第三者からの閲覧や改変から通信を保護することができる.一方で,ネットワーク運用の視点からは,他のHTTPS通信と区別できないため,悪意のあるDoH通信を検出することや,そもそもDoH通信を抽出することが困難になる.こうした課題を解決するために既に研究が行われているが,実験環境のみで動作することを想定した研究が多く,実際のネットワークに適用することを想定した研究は少ない. 本研究では,実際のネットワークに適用することを想定した,悪意のあるDoH通信の識別を目標とする.機械学習に用いる統計的特徴量をネットワーク環境に依存しない特徴量に変更し,特徴量抽出のタイミングを短く変更することによって,リアルタイムにDoH通信を検出できるシステムを目指す.
 
上中 風花 M, 1回目発表 数理情報学 池田 和司 作村 諭一 久保 孝富 日永田 智絵 LI YUZHE
title: PCA as an Auxiliary Variable for CEBRA
abstract: CEBRA is an extension of nonlinear independent component analysis (nonlinear ICA) designed to identify latent structures using auxiliary variables. However, there are limitations in selecting appropriate auxiliary variables. To address this issue, we propose using principal component analysis (PCA) of the observations as an auxiliary variable for CEBRA. The results demonstrated that the PCA-based auxiliary variable achieved performance comparable to that obtained by leveraging partial ground-truth information as an auxiliary variable. Nevertheless, there are notable limitations to using PCA as an auxiliary variable. For example, the nonlinear mapping from the latent space to the observation space cannot be adequately captured by linear PCA, which makes this approach insufficient for representing the geometry of the true latent structure or for modeling inverse transformations. As future work, we plan to extend this approach by introducing kernel PCA as an auxiliary variable to better capture complex latent structures.
language of the presentation: Japanese
発表題目: CEBRA における補助変数としての PCA の応用
発表概要: CEBRA は、補助変数を用いて潜在構造を特定することを目的とした、非線形独立成分分析(nonlinear ICA)の拡張手法である。 しかし、補助変数の選択には制約があり、適切なものは限られている。 この問題に対処するため、本研究では観測データに対する主成分分析(PCA)を、CEBRA の補助変数として応用することを提案する。 実験の結果、PCA に基づく補助変数は、補助変数として真の潜在変数の一部情報を利用した場合と同程度の性能を示した。 一方で、PCA を補助変数として用いることには限界もある。 たとえば、潜在空間から観測空間への非線形写像を線形 PCA では十分に捉えることができず、 真の潜在構造の幾何的特性を表現したり、逆変換を適切にモデル化したりするには不十分な可能性がある。 今後は、真の潜在構造をより的確に捉えるために、補助変数としてカーネル PCA(kernel PCA)を導入することで、この手法の拡張を検討している。
 
小倉 和己 M, 1回目発表 生体画像知能 大竹 義人 金谷 重彦 Soufi Mazen Gu Yi
title:Preliminary Study on Quantitative Analysis of Pharyngeal Contraction via Swallowing 4D CT
abstract:Dysphagia is a significant issue that impacts the quality of life. Pharyngeal contraction refers to the coordinated contraction of the meso-hypopharyngeal region during swallowing. In cases of dysphagia, this series of contractions may not be properly coordinated, leading to difficulty in smooth bolus passage to the esophagus. Quantitative, region-specific evaluation of pharyngeal contraction can facilitate the selection of appropriate treatments for dysphagia. In this study, we propose a method that can visualize pharyngeal contraction and bolus passage as a heatmap from 4DCT with automatic segmentation of air area and bolus in the meso-hypopharyngeal region and analysis of the area profile. Time on the horizontal axis, position in the meso-hypopharyngeal region on the vertical axis, and the cross-sectional area of the segmented area (air area or bolus) for each slice was used as the heat map value. Our results show that the deep learning model can segment air area and bolus with some accuracy in 5-fold cross-validation (leave-one-out patients). The heatmaps of air area and bolus with automatic segmentation can accurately reproduce the ground truth heatmaps. Furthermore, distinct features of healthy individuals in which the meso-hypopharyngeal region completely contracts once and smooth bolus passage while swallowing are shown in the heatmap of air area and bolus, highlighting the method's potential for clinical application to quantitatively evaluate differences in pharyngeal contraction between healthy individuals and patients with dysphagia, as well as to assess the state of pharyngeal contraction specific to different underlying conditions causing dysphagia.
language of the presentation:Japanese
発表題目: 嚥下4DCTを用いた咽頭収縮定量解析の初期的検討
発表概要: 嚥下障害は生活の質に影響を及ぼす重要な問題である。咽頭収縮とは嚥下時に中咽頭・下咽頭領域が協調的に収縮する現象を指す。嚥下障害が存在する場合、この一連の収縮運動が適切に協調しないことがあり、これにより食塊が食道へ円滑に通過できなくなる。咽頭収縮と食塊の通過を定量評価することは、嚥下障害に対する適切な治療法の選択に有用である。本研究では4DCT画像から中咽頭・下咽頭領域の空気領域と食塊を自動セグメンテーションし面積プロファイルを解析することで、咽頭収縮と食塊通過をヒートマップとして可視化する手法を提案する。横軸に時間、縦軸に中咽頭・下咽頭領域内の位置を設定し、各スライスにおけるセグメンテーション領域(空気領域または食塊)の断面積をヒートマップの値として用いた。実験結果から、深層学習モデルは5分割交差検証において、空気領域と食塊をある程度の精度でセグメンテーション可能であることが示された。自動セグメンテーションによる空気領域と食物塊のヒートマップは、正解ヒートマップを正確に再現できることが明らかとなった。さらに、健康な被験者において中咽頭・下咽頭領域が一度完全に収縮し嚥下時に食塊が円滑に通過するという特徴的なパターンが空気領域と食物塊のヒートマップ上に示されており本手法が健常者と嚥下障害患者における咽頭収縮の差異を定量的に評価し、嚥下障害を引き起こす疾患ごとの咽頭収縮状態を評価する臨床応用の可能性を示唆している。
 
久下 凌生 M, 1回目発表 脳・行動モデリング 田中 沙織 池田 和司 CAI LIN 荻島 大凱
title: Considering Correlation between In-game Behavior and Depressive Symptoms
abstract: Mental illnesses have been increasing in modern society. According to the WHO, an estimated 4% of the world’s population suffers from depression, and only one in three of them receives treatment. In Japan, the number of workers’ compensation claims related to mental illness has been increasing.To address this growing issue, game-based approaches have recently gained attention. However, previous studies suffer from several limitations, such as insufficient data, unclear characteristics about participants, and unexamined contributing factors. In this study, we aim to address these issues and reduce the limitations of questionnaire-based assessments by examining the feasibility of constructing an accurate predictive model of depressive symptoms using game-play data.
language of the presentation: Japanese
発表題目: ゲーム内行動と抑うつ症状との関連検討
発表概要: 現代社会において、精神疾患は拡大の一途を辿っている。WHOによると、中でもうつ病は世界人口の4%が罹患しており、さらにその中で治療を受ける人は3人に1人である。日本でも精神疾患による労災請求件数は増加傾向にある。広がる精神疾患に対し、現在ゲームベースアプローチが隆盛している。しかし先行研究にはデータ数不足や不明瞭な被験者の区分けといった問題や、未検討の要素が存在する。本研究はこれらの解消と、質問紙の問題点の削減を目的に、ゲームプレイからの正確な抑うつ予測モデルの構築について検証するものである。