| 山田 黎也 | M, 1回目発表 | インタラクティブメディア設計学 | 加藤 博一 | 和田 隆広 | 澤邊 太志 | Isidro Butaslac | |
|
title: A Survey of Visible Watermarking Techniques for 3D Models: Current Trends and Emerging Challenges
abstract: As the online distribution of 3D models continues to expand, the risks of unauthorized use and unpermitted modification have become increasingly significant. Visible watermarking has therefore gained importance as a practical means of protecting 3D assets. Traditional invisible watermarking methods often rely on dedicated extractors and provide limited deterrence, prompting renewed interest in approaches that embed visually recognizable marks directly into 3D geometry. Recent techniques include converting textual shapes into 3D forms and embedding them via Boolean operations, as well as optimization-based methods that automatically determine watermark placement and orientation based on surface curvature, achieving both geometric consistency and visual clarity.In the image domain, studies have shown that certain defensive mechanisms can cause watermark removal attempts to either severely degrade the image or leave the watermark partially intact. These approaches provide an active form of robustness against removal networks. Such concepts suggest new possibilities in the 3D context, where watermark behavior could be designed not only for embedding quality and automated placement but also for inducing geometric degradation or structural change when removal is attempted.Building on these developments, this work reviews existing visible watermarking techniques and defensive ideas, and examines how they may inform the future design of watermarking strategies tailored to the structural characteristics of 3D models. language of the presentation: Japanese 発表題目: 3Dモデルにおける視認可能な透かし技術の動向と課題の整理 発表概要: 3Dモデルのオンライン流通が拡大する中、不正利用や無断改変のリスクが増大し、視認可能な透かしによる保護の重要性が高まっている。従来の不可視方式は抽出器依存や抑止力の弱さが課題であり、形状そのものへ直接刻み込む visible watermarking が注目されている。近年は、文字形状を3D化してBoolean処理で埋め込む方式や、モデル曲率に基づき最適な位置・姿勢を自動的に探索する方式など、幾何学的整合性と視認性を両立させる技術が進展している。また、透かしの除去を試みるとモデルの品質が劣化したり、逆に透かしが残り続けたりする“防御的メカニズム”の概念も提案されており、ロバスト性を能動的に高める方向性が議論されている。これらの動向を踏まえると、3Dモデルにおける透かし技術は、埋め込み品質・自動配置・形状保持・攻撃耐性を総合的に扱う段階へ移行しつつある。本研究では、こうした既存枠組みを参照しながら、3Dモデル特有の構造変化や除去行為への反応を考慮した透かしの在り方を検討する。 | |||||||
| 吉尾 陸汰 | M, 1回目発表 | インタラクティブメディア設計学 | 加藤 博一 | 清川 清 | 澤邊 太志 | Isidro Butaslac | |
|
title: Building a Reliable and Interactive AR Task Support System Using RAG
abstract: Conventional AR task support systems rely on pre-defined static content, making it difficult to dynamically adapt to the user's proficiency level or unexpected difficulties. Recently, automatic procedure generation methods utilizing Large Language Models (LLMs) have been proposed. However, these methods are problematic due to the low reliability of information resulting from their dependence on general knowledge, as well as their limitation to providing one-way instructions. This study proposes an AR task support system that integrates Retrieval-Augmented Generation (RAG), using official product manuals as knowledge sources, with a conversational interface. This approach aims to achieve both "reliability" by extracting accurate procedural information from manuals and "interactive flexibility" by understanding user queries and error contexts through dialogue to generate appropriate visual guidance in real-time. language of the presentation: Japanese 発表題目: RAGを用いた高信頼かつ対話的なAR作業支援システムの構築 発表概要: 従来のARタスク支援システムは、提示情報が事前に定義された静的なコンテンツに依存しており、作業者の熟練度や突発的な躓きに対して動的に適応できないという課題がある。近年、大規模言語モデル(LLM)を活用した手順の自動生成手法が提案されているが、学習データに含まれる一般知識に依存するため情報の信頼性が低く、かつ一方的な指示提示に留まる点が問題視されている。本研究では、製品の公式マニュアル等を知識源とする検索拡張生成(RAG)と、作業者との対話インタフェースを統合したARタスク支援システムを提案する。本手法は、マニュアルに基づく正確な手順情報の抽出による「信頼性の確保」と、作業者の疑問やエラー状況を対話を通じて理解し、適切な視覚情報をリアルタイムに生成する「対話的な柔軟性」の両立を目的とする。 | |||||||
| 堤 悠太 | M, 1回目発表 | コンピューティング・アーキテクチャ | 中島 康彦 | 林 優一 | 張 任遠 | KAN Yirong | PHAM HOAI LUAN |
|
title: *** Implementation CNN on FPGA for ECG signal processing ***
abstract: *** This study implements a 1D-CNN–based abnormality detection algorithm for ECG signals on an FPGA and evaluates its performance in comparison with CPU and GPU platforms. Since the classification accuracy has already reached a sufficiently high level, the primary focus of further optimization shifts toward reducing power consumption and improving area efficiency. For portable and edge-oriented applications, low-power operation and high integration density are essential requirements, and in wearable use cases, minimizing power and device size becomes particularly critical. Looking ahead, the goal is to integrate the proposed architecture into wearable medical devices such as band-type systems, while pursuing additional reductions in power consumption and hardware resource requirements. *** language of the presentation: *** English *** 発表題目: *** ECG信号処理向けのCNNのFPGAへの実装 *** 発表概要: *** 本研究では、ECG(心電図)信号を対象とした1D-CNNによる異常検出アルゴリズムをFPGA上へ実装し、CPUおよびGPUとの比較評価を行う。分類制度はすでに十分に高い水準に到達しているため、今後の最適化の主眼は消費電力と面積効率となる。携帯型・エッジデバイスへの応用に向けて、低消費電力化と高集積化は不可欠な要件であり、特にウェアラブル用途では省電力と小型が焦点となる。将来的には、バンド型などの装着型医療デバイスへの統合を目指し、さらなる省電力化・小型化に取り組む。 *** | |||||||
| 向井 良輔 | M, 1回目発表 | サイバーレジリエンス構成学(コミュニケーション学) | 門林 雄基☆ | 岩田 具治 | 安本 慶一 | 妙中 雄三 | Le Vu Trung Duong |
|
title: Examination of Defense Methods Against Model Inversion Attacks
abstract: Model Inversion Attacks (MIAs) are attacks that aim to reconstruct the training data used to learn a machine learning model by exploiting its parameters, outputs, or other features. While various defense methods have been proposed to counter this attack technique, a trade-off between classification accuracy and attack robustness remains a significant issue. Therefore, this research investigates which model features are vulnerable to MIAs and aims to propose a defense method that is robust against attacks while maintaining classification accuracy based on these features. language of the presentation: Japanese 発表題目: Model Inversion Attacksに対する防御手法の検討 発表概要: Model Inversion Attacks(MIAs)は、機械学習モデルのパラメータや出力を利用して、モデルの学習に用いられた訓練データを再構成することを目的とした攻撃手法である。現在この攻撃手法に対抗するため様々な防御手法が提案されているが、分類精度と攻撃頑健性のトレードオフが発生することが課題となっている。そのため本研究では、モデルのいかなる特徴がMIAsに対し脆弱なのかを調査し、その特徴をもとに攻撃に対してロバストでありながら分類精度を損なわない防御手法の提案を目指す。 | |||||||
| 喜多 岳人 | M, 1回目発表 | サイバネティクス・リアリティ工学 | 清川 清 | 向川 康博 | 内山 英昭 | Perusquia Hernandez Monica | 平尾 悠太朗 |
|
title: Training-free FSCIL with Text-Aligned Point Cloud Embeddings and Analytic Feature Separation
abstract: While the use of point-cloud data is expanding in applications such as autonomous driving, digital twins, and XR, large-scale collection and annotation remain labor-intensive, and novel object classes continuously appear in real-world environments. This necessitates efficient class-incremental learning methods that do not require heavy retraining. We propose a training-efficient framework that reuses a frozen, contrastively pre-trained point-cloud backbone (Uni3D) and trains a lightweight alignment MLP on base classes to map point features into a text-aligned embedding space. Classification is performed via nearest-prototype matching; novel classes are accommodated by simply appending prototypes. Moreover, we apply analytic feature separation to reduce correlations among prototypes, aiming to sharpen decision boundaries and mitigate interference with existing knowledge. The proposed method will be evaluated under a staged class-incremental protocol using accuracy and forgetting rates as performance metrics. language of the presentation: Japanese 発表題目: テキスト整合済み点群埋め込みと解析的特徴分離による学習不要FSCIL 発表概要: 自動運転やデジタルツイン,XR 分野で点群データの利用が拡大している一方で,点群の大規模収集・アノテーションは労働集約的で困難であり,現実世界では新規クラスが継続的に出現するため,再学習を要さない効率的なクラス追加手法が求められる.本研究では,対照学習で事前学習された点群バックボーン(Uni3D)を凍結して再利用し,ベースクラスで小規模なアラインメント MLP を学習して点群特徴をテキスト整合済み特徴空間へ写像する,学習負荷を抑えたパイプラインを提案する.分類は近傍プロトタイプ方式を採用し,ノベルクラス追加時はプロトタイプを追加するのみで対応する.さらに,全プロトタイプ間の相関を低減する解析的特徴分離により,分類境界の明確化と既存知識の干渉低減を図る.提案手法は段階的クラス追加プロトコルに基づき,精度と忘却量で評価する予定である. | |||||||
| 上甲 陽菜 | M, 1回目発表 | ソーシャル・コンピューティング | 荒牧 英治 | 清川 清 | 若宮 翔子 | 久田 祥平 | |
|
title: Simulating Information Directionality Through Persona Assignment in Large Language Models
abstract: In today’s digital society, the widespread availability of information on the internet enables massive and diverse communication. However, even when information is targeted toward a specific demographic group, it may not be received as intended if the audience does not perceive themselves as belonging to that target group. This study focuses on directionality, defined as a recipient’s recognition that information is intended for them, and simulates this phenomenon by assigning personas to large language models (LLMs). Specifically, we present information to multiple personas generated from an open-source dataset constructed based on Japanese demographic and geographic distributions, and evaluate whether each persona perceives the information as directed toward themselves. The information used in this study includes not only highly public matters such as vaccination campaigns during the COVID-19 pandemic and disaster alerts, but also region-specific information such as wildlife damage in rural areas and promotion of local specialties. By comparing simulation outcomes from persona-driven LLMs with real-world survey statistics, we aim to clarify the validity and limitations of using persona-assigned LLMs as a method for social simulation. language of the presentation: Japanese 発表題目: 大規模言語モデルへのペルソナ付与による情報の指向性のシミュレーション 発表概要: インターネットの普及により膨大な情報が発信される現代では、特定の属性を対象として発信した情報であっても、受け手が自身をその属性に該当すると認識しない場合、情報が受け取られない場合がある。本研究では、発信された情報を自分に向けられた情報であると受信者が認識する「指向性(directionality)」に焦点を当て、大規模言語モデルへのペルソナ付与により、情報の指向性のシミュレーションを行う。具体的には、日本の人口統計や地理的分布に基づいて生成されたオープンソースのペルソナデータセットを用いて生成した複数のペルソナに対し、情報を提示し、自分に向けられた情報と認識するか否かを出力させる。発信する情報は、パンデミック禍のワクチン接種や自然災害の発生情報などの公共性の高い情報に加え、地方での害獣出現や特産品の消費など地域ごとの特性が表現される情報を取り扱う。ペルソナを用いたシミュレーション結果と実世界の統計調査などの差を比較・分析し、LLMへのペルソナ付与による社会実験の妥当性や限界を明らかにすることを目指す。 | |||||||
| 星川 広龍 | M, 1回目発表 | ソフトウェア工学 | 松本 健一 | 飯田 元 | 嶋利 一真 | Fan Youmei | |
|
title: Analysis of Changes in Pull Request Characteristics of Newcomers Before and After ChatGPT
abstract: The onboarding and retention of newcomers are essential for the sustainable evolution of Open Source Software (OSS) projects. A newcomer's first Pull Request (PR) serves as a critical turning point that influences their motivation for long-term contribution to the project. Since the release of ChatGPT in November 2022, the rapid proliferation of AI-assisted development tools has significantly transformed software development practices. With capabilities to assist in code generation and description drafting, these tools potentially influence the PR creation process and the quality of contributions by newcomers. However, changes in the characteristics of PRs and success factors for newcomers in the AI era remain unclear. In this study, we analyze PR data from popular OSS projects on GitHub. By comparing periods before and after the release of ChatGPT, we clarify changes in characteristics such as the merge rate and code size of newcomers' PRs, and explore effective contribution strategies for newcomers in the age of widespread AI adoption. language of the presentation: Japanese 発表題目: ChatGPT登場前後における新規貢献者のプルリクエスト特徴変化の分析 発表概要: オープンソースソフトウェア(OSS)プロジェクトの持続的発展には新規貢献者の参入と定着が不可欠である。新規貢献者の初回プルリクエスト(PR)は、プロジェクトへの長期的な貢献意欲を左右する重要な転換点となる。2022年11月のChatGPT公開以降、AI支援開発ツールの急速な普及により、ソフトウェア開発実践が大きく変化している。これらのツール はコード生成や説明文作成を支援する能力を持ち、新規貢献者のPR作成プロセスや貢献の質に影響を与えている可能性がある。しかし、AI時代における新規貢献者のPR特徴や成功要因の変化については、明らかにはなっていない。本研究では、GitHub上の人気OSSプロジェクトにおけるPRデータを分析し、ChatGPT公開前後の期間比較を通じて、新規貢献者のPRマージ率、コード規模等の特徴変化を明らかにし、AI普及期における新規貢献者の効果的な貢献戦略を探求する。 | |||||||
| 佐伯 晃央 | M, 1回目発表 | ソフトウェア設計学 | 飯田 元 | 松本 健一 | 柏 祐太郎 | Reid Brittany | |
|
title: Information Retrieval based Fault localization with LLM
abstract: In recent years, large-scale and multi-component software systems are increasingly composed of multiple subsystems, where the component exhibiting bug symptoms often differs from the component containing the root cause, making it more difficult to identify the root cause from bug reports. Conventional approaches rely on superficial information in bug reports, such as file names, and their accuracy deteriorates particularly in complex systems like multi-component systems. This research proposes a novel approach that combines Large Language Models (LLMs) with dynamic analysis techniques. Specifically, we extract behavioral patterns of software, such as execution traces obtained from unit test execution, through dynamic analysis and provide them as rich contextual information to LLMs. This enables LLMs to deeply understand software behavior and mimic the tacit knowledge that developers acquire through experience. Since dynamic analysis information crosses subsystem boundaries, it becomes possible to accurately identify the essential root cause from ambiguous bug reports, even in complex systems. language of the presentation: Japanese 発表題目: 大規模言語モデルを用いた情報検索ベース欠陥位置推定手法の提案 発表概要: 近年、大規模かつマルチコンポーネントなソフトウェアでは、複数サブシステムから構成され、バグの症状が現れるコンポーネントと根本原因となるコンポーネントが異なる場合が増加しており、不具合報告から原因箇所を特定することが一層困難になっている。従来手法は不具合報告書のファイル名等の表層的情報に依存しており、特にマルチコンポーネントシステムのような複雑なシステムでは精度が下がってしまう。本研究は、大規模言語モデル(LLM)と動的解析技術を組み合わせた新しいアプローチを提案する。具体的には、単体テストの実行から得られるソフトウェアの実行トレースなどの振る舞いを動的解析で抽出し、これをLLMへの豊富なコンテキスト情報として提供する。これにより、LLMはソフトウェアの動作を深く理解し、開発者が経験を通じて獲得する暗黙知を模倣できる。動的解析情報はサブシステムの境界を越えるため、複雑なシステムにおいても、曖昧な不具合報告から本質的な原因箇所を高精度に特定可能となる。 | |||||||
| 三室 慶人 | M, 1回目発表 | ディペンダブルシステム学 | 井上 美智子 | 笠原 正治 | 笹田 大翔 | ||
|
title: Speedup of Random Walks Using Probabilistic Data Structures in Distributed Systems
abstract: It is well known that random walks are widely used in distributed systems for applications such as token management, load balancing, and resource discovery. Key performance metrics for random walks include hitting time, defined as the number of steps required to visit a specific node for the first time, and meeting time, defined as the number of steps required for two agents to meet. Reducing these metrics directly facilitates rapid information exchange and consensus building, thereby contributing to the overall performance improvement of the system. However, simple random walks suffer from memorylessness, which often leads to redundant movements in local areas, causing delays in these performance metrics. This study investigates an efficient exploration method by equipping agents with memory and managing their movement history using probabilistic data structures. It clarifies the effective data structures and agent algorithms for shortening each performance metric relative to the given memory size. language of the presentation: Japanese 発表題目: 分散システムにおける確率的データ構造を用いたランダムウォークの高速化 発表概要: 分散システムにおいてトークン管理や負荷分散、リソース検索などにランダムウォークが利用されていることが知られている。 このランダムウォークの性能の指標として、システム内の特定の計算機に初めて訪れるまでの移動回数である到達時間や、2エージェントが出会うまでの移動回数である邂逅時間などが存在する。 これらの性能指標の短縮は迅速な情報交換や合意形成に直結するため、システム全体の性能向上に寄与する。 しかし、通常のランダムウォークでは無記憶性により局所的な移動を繰り返す冗長な移動が発生しやすく、各性能指標を遅らせてしまう。 本研究では、ランダムウォークを行うエージェントにメモリを与え、移動履歴を確率的データ構造を用いて管理することで効率的な探索を行う手法について検討する。 与えるメモリサイズに対して、各性能指標を短縮するための効果的なデータ構造とエージェントのアルゴリズムを明らかにする。 | |||||||
| 真壁 萌花 | M, 1回目発表 | ネットワークシステム学 | 岡田 実 | 林 優一 | 東野 武史 | Dipanita Chakraborty | |
|
title: Intermodulation distortion reduction method for bias drift-affected
Mach-Zehnder modulators during simultaneous three-band modulation
abstract: A-RoF (Analog Radio on Fiber) is a technology that transmits high-frequency radio signals in their original form over optical fiber. Due to its signal processing intensiveness, radio wave format independence, and wideband transmission capabilities, it is expected to be a fronthaul infrastructure sharing technology for 4G, 5G, and future 6G mobile services. However, intermodulation distortion (IMD) occurs due to the nonlinearity of the optical modulator used for electrical-to-optical conversion, and is a major cause of inter-service interference. Previous studies have shown that interference can be suppressed by selectively applying predistortion to some bands during three-band simultaneous modulation. However, the impact of DC bias drift in the optical modulator has not been fully investigated. In this study, we target Mach-Zehnder modulators (MZMs) with bias drift and propose a method to reduce intermodulation distortion by using predistortion processing including bias estimation. language of the presentation: Japanese 発表題目: バイアスドリフトが生じたマッハツェンダー変調器における3バンド同時変調時の相互変調歪低減手法 発表概要:A-RoF(アナログ光ファイバ無線)は,高周波無線信号をそのままの形式で光ファイバへ伝送する技術であり,信号処理の集約性,電波方式への非依存性,および広帯域伝送が可能であることから,4G・5G・将来の6Gモバイルサービスにおけるフロントホールのインフラシェアリング技術として期待されている。一方で,電気‐光変換に用いられる光変調器の非線形性に起因して相互変調歪(IMD)が発生し,サービス間干渉の主要因となる。これまでの研究では,3バンド同時変調時に一部帯域へ選択的に予歪を付与することで干渉を抑圧できることを示したが,光変調器に直流バイアスドリフトが生じた場合の影響は十分に検討されていなかった。本研究では,バイアスドリフトが生じたマッハツェンダー変調器(MZM)を対象とし,バイアス推定を含む予歪処理によって相互変調歪の低減を図る手法を提案する。 | |||||||
| 白井 透 | M, 1回目発表 | ヒューマンAIインタラクション | Sakriani Sakti | 渡辺 太郎 | 大内 啓樹 | Faisal Mehmood | Bagus Tris Atmaja |
|
title: How Do Japanese-Based Speech Models Hear English? — An Analysis of Phoneme Perception —
abstract: This study investigates how a self-supervised speech model trained on Japanese audio perceives English speech. Previous research has compared the phoneme discrimination performance of models pre-trained on English and French, but the analysis has been limited to averaged measures over phoneme pairs, without detailed examination of individual phonemes or specific phoneme pairs. In this study, we evaluate the ability of speech models pre-trained on Japanese and English to discriminate English phonemes using the ABX test on the ZeroSpeech dataset. We also examine how the models’ performance corresponds to phoneme pairs that Japanese learners are known to struggle with, in order to assess how closely the phoneme perception of SSL models resembles that of human listeners. language of the presentation: Japanese 発表題目: 日本語音声基盤モデルは英語をどう聞くか? — 音韻知覚の分析 — 発表概要: 本研究では, 日本語音声で学習された自己教師あり音声モデルが英語音声をどのように知覚するのかを分析する. 先行研究では, 英語およびフランス語で事前学習されたモデルの音素識別性能が比較されているが, 分析は音素ペアを平均化した指標にとどまり, 個々の音素や特定の音素ペアごとの詳細な分析は行われていない. 本研究は, ZeroSpeechデータセットを用いたABXテストにより, 日本語および英語で事前学習された音声モデルの英語音素の識別性能を評価する. また, 日本語話者が音素認識において困難を示すとされる音素ペアとの対応を調べることで, SSLモデルの音素知覚がどの程度人間に近いかを検証する. | |||||||
| 中川 岬 | M, 1回目発表 | ヒューマンロボティクス | 和田 隆広 | 松原 崇充 | 劉 海龍 | 織田 泰彰 | 本司 澄空 |
|
title: A Probabilistic Control Framework for Tendon-Driven Robots Considering System Uncertainty
abstract: Tendon-driven robots, actuated by tendons (wires), are lightweight and highly compliant. However, variations in tendon routing and tension cause fluctuations in friction torque, resulting in inconsistent joint output even under the same command. This study focuses on such uncertainty in friction torque and aims to experimentally clarify its characteristics. A series of motion experiments was conducted on a 1-DOF tendon-driven link to identify both static friction torque and dynamic friction torque. The results revealed noticeable variability and angle-dependence in both types of friction torque, quantitatively demonstrating the inherent uncertainty of tendon-driven mechanisms. Based on these findings, the obtained friction parameter distributions will be organized into a probabilistic model, with the goal of developing robust control methods that explicitly consider the uncertainty present in tendon-driven systems. language of the presentation: Japanese 発表題目: 腱駆動型ロボットにおける不確実性を考慮した確率的制御手法の提案 発表概要: 腱で駆動するロボットは、軽量で柔軟性に優れる一方、腱の経路や張力の変化により関節トルクがばらつきやすく、同じ指令でも出力が不安定になる課題がある。本研究では、こうした摩擦トルクの不確実性に注目し、その特性を実験的に明らかにすることを目的とした。 1自由度の腱駆動リンクに対して動作実験を行い、静止摩擦トルクおよび動摩擦トルクを同定した。その結果、両者ともにトルクのばらつきや関節角度への依存性が確認され、腱駆動特有の不確実性が定量的に示された。今後は、得られた摩擦パラメータの分布を確率モデルとして整理し、不確実性を考慮したロバストな制御手法への応用を目指す。 | |||||||
| 髙木 皐成 | M, 1回目発表 | ユビキタスコンピューティングシステム | 安本 慶一 | Sakriani Sakti | 諏訪 博彦 | 佐々木 航 | |
|
Development of a Self-Regulation Support System Using Contextual Mirroring
This study develops a contextual mirroring system that provides non-directive, real-time feedback based on physiological and behavioral data from smartphones and smartwatches. Instead of giving instructions, the system quietly reflects the user’s current state to support intrinsic self-regulation. A two-week crossover experiment compares a control condition (no feedback) with a contextual-mirroring condition (objective cues every 10 minutes). The goal is to evaluate whether this approach improves awareness and stress self-regulation. Japanese 文脈ミラーリングによる自己調整支援システムの開発 本研究は、スマホ・スマートウォッチのデータを使い、指示を与えずに“今の状態をそっと映す” 文脈ミラーリングを開発するものです。コントロール(表示なし)と文脈ミラーリング(10分ごとの客観的通知)の 2週間クロスオーバー実験で効果を検証します。ユーザの内発的な気づきとストレス自己調整の向上を狙いとします。 | |||||||
| 前川 達平 | M, 1回目発表 | ロボットラーニング | 松原 崇充 | 和田 隆広 | 柴田 一騎 | 鶴峯 義久 | 佐々木 光 |
|
title: Multi-agent Imitation Learning Framework with Dynamic Role Switching
abstract: In recent years, the demand for multi-agent systems in which multiple robots collaboratively transport objects has been steadily increasing. This study aims to automate such systems through multi-agent imitation learning, enabling robots to acquire roles and policies directly from human demonstration data without requiring trial-and-error learning. Although most existing research assumes that each agent maintains a fixed role, real-world cooperative transport tasks often require agents to adaptively switch roles in response to changing situations. To address this issue, we propose a method that learns a unified policy capable of dynamically switching among all roles by capturing the coordination patterns observed in human demonstrations. language of the presentation: Japanese | |||||||
| 木下 真翔 | M, 1回目発表 | 光メディアインタフェース | 向川 康博 | 安本 慶一 | 藤村 友貴 | 北野 和哉 | |
|
title: Latency-Compensated Human Pose Estimation via Multi-Future Prediction and Optimal Candidate Selection Using Event-Camera Optical Flow
abstract: Existing human pose estimation methods require time to perform inference on input images, resulting in a delay in the estimated pose relative to the actual human motion. One approach to mitigate this issue is to predict future poses while taking the processing delay into account. While multimodal models that generate multiple plausible future poses have become the mainstream approach, real-time applications require a mechanism for instantly selecting the most plausible future pose among them. In this study, we investigate a method for selecting the optimal candidate from multiple predictions by evaluating the consistency between each predicted future pose and the direction of motion derived from the optical flow obtained from an event camera, which captures movement with high temporal resolution. This aims to achieve a form of human pose estimation that effectively compensates for inference latency. language of the presentation: Japanese 発表題目: 未来姿勢の複数予測とイベントカメラOptical Flowによる最適選択を用いた遅延補償型人物姿勢推定 発表概要: 既存の人物姿勢推定では、画像に対して推論処理を行うために時間が必要となり、その分だけ推定結果が実際の動きより遅れてしまうという課題がある。 この課題を解消する手段の一つとして、遅延を加味した未来の姿勢を予測するアプローチが考えられる。未来姿勢予測手法は、複数の可能性を提示するマルチモーダルモデルが主流になっているが、リアルタイム応用ではその中から「正しい未来姿勢」を即座に選択する仕組みが必要である。 そこで本研究では、高時間分解能で動きを捉えられるイベントカメラから得られるOptical Flowに基づき、各未来姿勢の「動きの方向性」との整合性を評価することで、複数予測の中から最適候補を選択する手法を検討する。 これにより、推論遅延を実質的に補償する人物姿勢推定を目指す。 | |||||||
| QIAN HANG | M, 1回目発表 | 大規模システム管理 | 笠原 正治 | 藤川 和利 | 原 崇徳 | ||
|
title: Local LLM black-box denial-of-service attack mitigation with kernel context
abstract: Large Language Models (LLMs) are increasingly vulnerable to Denial-of-Service (DoS) attacks aimed at exhausting computational resources and disrupting inference pipelines. Recent studies have explored LLM-DoS attack vectors under black-box settings, demonstrating how adversaries can significantly amplify latency and resource consumption even without model internal access. In this work, we propose a novel mitigation framework that leverages kernel-level context observability and monitoring to defend against such attacks in local inference environments. By tracing system-call patterns, memory usage, and GPU scheduling anomalies via eBPF, our method identifies abnormal resource usage patterns indicative of DoS attacks ahead of service degradation. This research demonstrates the viability of blending system-level monitoring and inference-level defence to strengthen local LLM deployments. For future work, we will integrate this kernel-context data with a lightweight anomaly detection engine to trigger pre-emptive throttling or isolation of suspect inference requests. language of the presentation: *** English *** | |||||||
| 萩原 祥都 | M, 1回目発表 | 情報セキュリティ工学 | 林 優一 | 岡田 実 | 井上 美智子 | 藤本 大介 | |
|
title: Study on a Detection Method Using Electromagnetic Radiation for Hardware Trojans Independent of Implementation Technique
abstract: Hardware Trojans (HTs) are known as a threat that can cause information leakage or function modification by inserting functionalities into a circuit to the designer's intent. In particular, HTs implemented on a printed circuit board (PCB) external to the IC chip are pointed out as being low-cost and easy to insert. Since these types of HTs are typically configured to be small-scale to avoid affecting the normal operation of the device, the resulting changes in the electrical and physical characteristics are small. Such small changes are also reflected in the electromagnetic (EM) radiation spectrum, leading to research on non-contact, non-destructive detection methods using electromagnetic analysis. Spectral changes due to the presence or absence of HT have also been confirmed. However, conventional electromagnetic methods for capturing these minute changes have limitations in their application to real-world environments where the insertion location and type are unknown. This is because they have position dependency, requiring measurement in the proximity of the HT, based on the premise that the HT's insertion location is known and the type of HT is also known. This research investigates an electromagnetic method capable of detection even when the insertion location and type of the HT are unknown. language of the presentation: Japanese | |||||||
| 邪答院 優斗 | M, 1回目発表 | 情報基盤システム学 | 藤川 和利 | 門林 雄基 | 林 優一 | 新井 イスマイル | |
|
title: Verification of Optimistic DAD Implementations
abstract: When an IPv6 address is assigned to an interface, Duplicate Address Detection (DAD) must be performed to check for address conflicts. A node executing DAD cannot use the target IPv6 address during this process, resulting in a delay before actual communication can commence. This delay poses a challenge in certain network environments, particularly mobile environments where frequent reconnections occur. Optimistic DAD can mitigate this issue by allowing the node to use the target IPv6 address even while DAD is running, thus eliminating the need to wait for the completion of the DAD delay period before initiating communication. This study aims to clarify the implementation and support status of Optimistic DAD across various operating systems (OSs). Based on the Optimistic DAD specification, we established criteria for determining support and observed the behavior of DAD-related communications on several OSs. Our results reveal that OSs commonly intended for mobile use sometimes include Optimistic DAD support, whereas OSs frequently deployed for server purposes often lack Optimistic DAD support. language of the presentation: Japanese 発表題目: 既存Optimistic DAD 実装における検証 発表概要: IPv6 アドレスをインタフェースに割り当てる際,Duplicate Address Detection(DAD)により重複アドレス検出を行う必要がある.DAD を実行中のノードは,DAD のターゲットとなるIPv6 アドレスを使用できず,実際に通信を開始するまでの遅延時間がある.これは,モバイル環境で再接続が多発する場合など,一部のネットワークで課題となる可能性がある.Optimistic DAD を用いると,DAD を実行中もターゲットのIPv6 アドレスを使用できるため,実際に通信を開始するまでの遅延時間を待つ必要がなく,この課題を軽減できる.本研究は,各種OS におけるOptimistic DAD の実装・サポート状況を明らかにすることを目的としている.Optimistic DAD の仕様から,サポート有無の判断基準を設け,各種OS におけるDAD に関する通信の挙動を観測した.結果として,モバイル環境での使用が想定されるOS においてはOptimistic DAD サポートがあることがある一方,サーバ用途などが多いOS においては,Optimistic DAD サポートがないことがわかった. | |||||||
| 植村 奏 | M, 1回目発表 | 数理情報学 | 池田 和司 | 清川 清 | 久保 孝富 | 日永田 智絵 | LI YUZHE |
|
title: A Study on Emotion Concept Formation Models Based on Physiological Responses to Auditory Stimuli abstract: Our emotional experiences in everyday life are strongly influenced by auditory stimuli such as speech, environmental sounds, and music. Research focusing on audition has a long history, and many studies have pointed to its strong association with emotion. However, there are still few computational studies that explicitly model the formation process of emotion concepts by integratively handling physiological signals and linguistic responses to auditory stimuli, and by framing emotion concepts as emerging from the reconfiguration of interoceptive and exteroceptive sensory inputs adapted to each individual’s environment. Against this background, the aim of this study is to construct a computational model of emotion concept formation that centers on physiological signals such as heart rate variability (RRI) and electrodermal activity (EDA) measured during auditory stimulation. To this end, we use a multimodal dataset collected in an auditory stimulation experiment, consisting of physiological signals (RRI and EDA) from 36 participants, impression words describing the auditory stimuli, and self-report emotion ratings based on the Self Assessment Manikin (SAM). Physiological signals, acoustic information of the auditory stimuli, and linguistic information are first pre-trained using a Vector Quantized Variational Autoencoder (VQ-VAE) and represented as Bag-of-Words (BoW) features. As the modeling framework, we adopt Multimodal Latent Dirichlet Allocation (MLDA), an extension of Latent Dirichlet Allocation (LDA), and its hierarchical extension, multilayer Multimodal LDA (mMLDA). We first build unimodal models and a conventional MLDA model based only on the BoW features of physiological signals, and then train an mMLDA model that additionally incorporates the auditory modality (acoustic features of the stimuli) and the linguistic modality (textual responses). For evaluation, we examine whether the categories of interoceptive states learned by each model resemble humans’ subjective emotion reports. Specifically, we quantify the correspondence between the latent categories in the interoceptive modality and the emotion categories defined from participants’ SAM ratings using the Rand index. language of the presentation:Japanese 発表題目: 聴覚刺激時の生理信号を用いた感情概念形成モデルの検討 発表概要: 私たちの日常生活の感情体験は,音声や環境音,音楽といった聴覚刺激によって大きく左右される。聴覚に注目した感情研究は古くから行われており,感情との関わりが強いことが指摘されてきた。一方で,聴覚刺激に対する生理信号・言語応答を統合的に扱い,個々人の環境に応じた内受容感覚と外受容感覚といった感覚入力の再配置によって形成される感情概念の形成過程を明示的にモデル化した計算論的研究はまだ多くない。 本研究では,こうした背景を踏まえ,聴覚刺激時の心拍変動(RRI)と皮膚電気活動(EDA)といった生理信号を中心に,感情概念形成の計算モデルを構築することを目的とする この目的のために,聴覚刺激実験で取得した36名分の生理信号(RRI・EDA),聴覚刺激に対する印象語,および自己評価式の感情評定データ(Self Assessment Manikin; SAM)からなる多モダリティデータセットを用いる。生理信号、聴覚刺激の音響情報、言語情報はVQ-VAE(Vector Quantized Variational AutoEncoder)によって事前学習を行い、BoW(Bag of Words)特徴量として表現する。モデルには,LDA(Latent Dirichlet Allocation)の拡張系であるMultimodal LDA(MLDA)および多層マルチモーダルLDA(mMLDA)を用いる。まず生理信号のBoW特徴量に基づく単独モデルおよび従来のMLDAを構築し,続いて聴覚モダリティとして聴覚刺激の音響情報と言語モダリティとして言語情報を加えたmMLDAの学習を行う。評価では,各モデルが学習した内受容感覚のカテゴリが人の主観的な感情報告に類似しているかについて検証を行う。具体的にはモデルが獲得した内受容モダリティにおける潜在カテゴリと被験者のSAM評定に基づき定義した感情カテゴリとの対応をランド指数により定量化を行う。 | |||||||
| 鈴木 涼太 | M, 1回目発表 | 生体画像知能 | 大竹 義人 | 向川 康博 | Soufi Mazen | Gu Yi | |
|
title: Prediction of lower-limb bone positions from 3D body surface scan data
abstract: Understanding the internal structure of the human body typically requires medical imaging techniques such as CT or MRI. However, these modalities are expensive and impose significant practical constraints. If the positions of internal bones could be estimated directly from easily obtainable 3D body surface scans, it would have substantial benefits across medical, sports, and apparel applications. This study aims to develop a method for estimating the positions of lower-limb bones from 3D body surface scan data by leveraging statistical shape models constructed from CT datasets. language of the presentation: 日本語 発表題目: 3次元体表面スキャンデータからの下肢骨格の位置推定 発表概要: 身体の内部構造を把握するためには,一般にCTやMRIなどの画像撮影が必要である.しかし,これらの撮影は高コストであり,設備や時間的制約も大きい.そのため,誰もが容易に取得できる体表面スキャンデータから,内部骨格の位置や姿勢を推定することができれば,医療・スポーツ・アパレルなどの多くの分野で利便性が高まると期待される.本研究では,CTによって得られた統計形状モデルを活用し,3次元体表面スキャンデータから下肢骨格を推定する手法の開発を目指す. | |||||||
| 久野 日嵩 | M, 1回目発表 | 脳・行動モデリング | 田中 沙織 | 池田 和司 | CAI LIN | 荻島 大凱 | |
|
title: The Effect of Task Difficulty on Stress and Learning Performance During Gameplay
abstract: Difficulty in video games is an important factor that affects player performance and subjective experience,and an appropriate level of challenge is expected to promote learning and skill acquisition. Previous studies have proposed the “85% Rule,” which suggests that learning efficiency is highest when the success rate is around 85%. However, it remains unclear how this rule works in actual gameplay, where players make decisions continuously. Moreover, most existing studies have focused on performance differences across difficulty settings, and only a few have examined how the psychological and physiological responses that occur during play influence learning. This study investigates how adjusting game difficulty affects players’ learning efficiency and psychological states. language of the presentation:Japanese 発表題目: ゲームプレイにおける課題難易度がストレスおよび学習パフォーマンスに与える影響 発表概要: ビデオゲームにおける難易度は、プレイヤーのパフォーマンスや主観体験に大きく影響する要因であり、最適な難易度が学習やスキル獲得を促進することが期待されている。先行研究により、成功率が約85%のときに学習効率が最大化されるという「85%ルール」 が提案された。しかしゲームプレイという連続的な意思決定課題においてこの理論がどのように機能するのか十分に検証されていない。また、既存研究の多くは難易度設定の違いによるパフォーマンスへの影響を主な対象としており、その際に生じる心理的・生理的な反応が学習にどのように影響するのかを扱った研究は限られている。本研究では、難易度調整によりゲームプレイ時のプレイヤーの学習効率および心理状態にどのような影響を与えるかを検証する。 | |||||||
| 鼎 凌太朗 | M, 1回目発表 | 自然言語処理学 | 渡辺 太郎 | Sakriani Sakti | 上垣外 英剛 | 坂井 優介 | |
|
title: Answer Verification Incorporating Reasoning Based on Pairwise Self-Evaluation for Meme Images
abstract: This research explores a framework to improve the quality and safety of model-generated explanations for inference on the task of harmfulness detection in memes. We conduct a comparative analysis between two models: a QA-only model designed for multi-task reasoning including classification, target group identification, evidence extraction, and explanation generation from image-text pairs; and a model trained through a pairwise self-evaluation paradigm. Utilizing LLaVA-1.6 as an automated judge, we evaluate the models based on factual consistency and safety. Our experiments on the development set reveal that the pairwise self-evaluation approach demonstrates a superior tendency in maintaining the consistency of cited evidence and the textual fidelity of explanations. Conversely, the QA-only model shows competitive performance in terms of standalone classification accuracy. language of the presentation: Japanese | |||||||
| 帖佐 宗浩 | M, 1回目発表 | 自然言語処理学 | 渡辺 太郎 | 荒牧 英治 | 上垣外 英剛 | 坂井 優介 | |
|
title:Early Word Segmentation in Neural Language Model
abstract: Human infants, in the early stages of language acquisition, are known to recognize and use expressions such as ``I-wanna-do-it'' not by identifying boundaries between elements such as ``I'', ``wanna'', ``do'', and ``it'', but rather as a single meaningful ``chunk'' (holophrase). On the other hand, in a series of recent studies comparing Neural Language Models (NLMs) with human language acquisition, learning has primarily been conducted on the basis of a pre-specified vocabulary; however, in such settings where the vocabulary is given, there are limitations in approaching more fundamental questions of language acquisition, such as how word boundaries are recognized. Therefore, the present study examines what kinds of ``chunks'' are recognized in the initial stages of NLM learning. Using an English corpus of child-directed speech, we constructed a character-level NLM without assuming any pre-specified vocabulary, and, under the assumption that local increases in the model’s branching entropy correspond to segmentation, we observed the process of word segmentation in the NLM. As a result of the experiments, it was found that, at least under the conditions of the present study, holophrases, which are recognized and used by human infants, were scarcely recognized as single ``chunks'' in the initial stages of NLM learning. language of the presentation:Japanese 発表題目:ニューラル言語モデルの学習初期における単語の分節化 発表概要: 人間の乳幼児はその言語獲得の初期段階において,``I-wanna-do-it''といった表現に対して``I'',``wanna'',``do'',``it''のような要素ごとの区切りを見出すことなく,全体としてひとつの意味を持つ「かたまり」 (ホロフレーズ) として認識・使用することが知られている. 他方で,近年のニューラル言語モデル (NLM) と人間の言語獲得を対比する一連の研究では,主として事前に設定された語彙を所与とした学習が行われてきている, しかし,語彙を与えた状態では,語の区切りをどのように認識していくかという言語獲得のより基盤的な問いに迫るには限界がある. そこで本研究では,NLMの学習初期においてどのような「かたまり」が認識されているかを検証する. 子どもに向けた発話を収集した英語コーパスを用いて,事前の語彙を仮定しない文字レベルNLMを構築し,モデルの分岐エントロピーの局所的な増加部分を分節とみなすという仮定のもとに,NLMにおける単語の分節化の過程を観察した. 実験の結果,少なくとも本研究の設定のもとでは,人間の乳幼児が認識・使用するようなホロフレーズは,NLMの学習初期においてひとつの「かたまり」として認識される傾向はほとんど認められなかった. | |||||||
| 関家 陽祐 | M, 1回目発表 | 計算システムズ生物学 | 金谷 重彦 | 松本 健一 | MD.Altaf-Ul-Amin | ||
|
title: A Comprehensive Benchmark of Major Pathology Foundation Models Using Publicly Available Datasets: Systematic Evaluation of Cancer Classification Performance and Generalization Ability
abstract: This study aims to establish a benchmark for comprehensively comparing the cancer classification performance and generalization ability of major pathology foundation models (CHIEF, UNI, GigaPath, BEPH, Virchow, and PathOrchestra) using only publicly available datasets. Utilizing publicly available datasets covering multiple cancer types, we will evaluate classification accuracy using AUC and F1-score, assess generalization performance via ΔAUC, and visualize feature embeddings to examine, from multiple perspectives, whether the models correctly capture important patterns in pathology images. By establishing a highly reproducible evaluation protocol, this study will promote standardization in the field of pathology AI and contribute to the creation of criteria that allow the increasing number of models to be objectively evaluated and selected in clinical practice. language of the presentation: Japanese 発表題目: 公開病理画像データを用いた主要病理基盤モデルの包括的ベンチマーク:がん分類性能と汎化能力の体系的評価 発表概要: 本研究は、主要病理基盤モデル(CHIEF、UNI、GigaPath、BEPH、Virchow、PathOrchestra)のがん分類性能と汎化能力を、公開データのみを用いて包括的に比較するベンチマークを構築することを目的とする。複数のがん種を含む公開データセットを用いて、AUCやF1-scoreによる分類精度の評価、ΔAUCによる汎化性能の評価、さらに埋め込み表現の可視化を行い、モデルが病理画像の重要なパターンを正しく捉えているかを多角的に検証する。再現性の高い評価プロトコルを確立することで、病理AI分野の標準化を促進するとともに、増えつつあるモデルを臨床現場で客観的に評価・選択できる基準作りに貢献する。 | |||||||
| 山本 駿祐 | M, 1回目発表 | 計算システムズ生物学 | 金谷 重彦 | 松本 健一 | MD.Altaf-Ul-Amin | ||
|
title: Integrated Analysis of Dietary Patterns and Clinical Laboratory Biomarkers Based on NHANES
abstract: In modern nutritional epidemiology, research has shifted from focusing on individual nutrients to examining overall dietary patterns. However, most studies have targeted disease outcomes, and comprehensive analyses linking dietary patterns with routine clinical laboratory biomarkers remain limited. In particular, it is still unclear how differences in daily eating habits correspond to fundamental metabolic indicators such as liver function, glucose metabolism, and inflammation. Therefore, this study uses large-scale NHANES data to extract major dietary patterns through principal component analysis (PCA) and evaluates their multivariate associations with clinical laboratory biomarkers. Furthermore, by integrating dietary patterns and biomarker profiles through clustering, the study aims to identify characteristic diet–metabolism types. This approach will provide a comprehensive view of the relationships between habitual diet and metabolic markers, ultimately contributing to the development of clinically applicable indicators for metabolic health. language of the presentation: Japanese 発表題目: NHANESに基づく食事パターンと臨床検査バイオマーカーの統合解析 発表概要: 現代の栄養疫学では、個別の栄養素ではなく食事全体のまとまりを捉える食事パターン研究が重視されている。しかし、その多くは疾患リスクを対象としており、日常診療で測定される臨床検査バイオマーカーとの体系的な関連解析は十分に行われていない。特に、肝機能、糖代謝、炎症といった基本的検査値が、実際にどのような食習慣の違いと対応しているのかについては未解明の点が多い。そこで本研究は、NHANESの大規模データを用い、PCA により主要な食事パターンを抽出し、臨床検査バイオマーカーとの多変量的な関連を評価する。さらに、これらを統合してクラスタリングを行うことで、特徴的な食事・代謝タイプを抽出することを目的とする。このアプローチにより、食習慣と代謝指標の結びつきを包括的に示し、臨床的に応用可能な新しい健康指標の構築を目指す。 | |||||||