コロキアムB発表

日時: 12月20日 (金) 3限目(13:30-15:00)


会場: L1

司会: 松井智一
衣川 昌孝 M, 1回目発表 光メディアインタフェース 向川 康博 松原 崇充 舩冨 卓哉 藤村 友貴 北野 和哉
title: *** Modal decomposition of flow fields by geometric transformation fields ***
abstract: *** Turbulence refers to the irregular flow field observed in river flows, jet engine exhaust, etc., and its analysis is extremely important in engineering applications such as aircraft control. Currently, many methods have been proposed to efficiently analyse the flow field by decomposing it into a small number of modes, but the number of modes cannot be sufficiently reduced for turbulent flows with high Reynolds numbers. The aim of this study is to develop a mathematical analysis method that enables the decomposition of turbulence into a small number of modes that are intuitively easy to understand, in order to elucidate turbulent flow phenomena. Existing methods use vector fields that can only represent fluid motion in the translational direction. We introduce a 'geometric transformation field' that can represent translation, rotation and scaling and has high descriptive power, and investigate decomposition and synthesis with fewer modes than conventional methods. The conventional mode decomposition method (POD) is formulated as a mode decomposition form based on the geometric transformation field. Numerical simulations are used to decompose and synthesise the flow field, and the effectiveness of the method is verified. ***
language of the presentation: *** Japanese ***
発表題目: *** 幾何変換場による流れ場のモード分解 ***
発表概要: *** 乱流とは,川の流れ,ジェットエンジンの排気などで観測される不規則な流れ場のことを指し,その解析は航空機の制御など工学的応用において極めて重要である.現在,流れ場を少数のモードに分解し,効率的に解析する手法が多く提案されているが,高レイノルズ数の乱流では十分にモード数を低減できないという課題がある.そこで本研究では乱流現象の解明に向け,少数かつ直感的に理解しやすいモードへの分解を可能にする数理的解析手法の開発を目的とする.既存手法では流体運動の表現として,並進方向のみしか表現できないベクトル場を用いていた.我々は並進,回転,スケーリングを表現でき,記述力の高い「幾何変換場」を導入することで,従来手法よりも少ないモードで分解・合成することを検討する.従来のモード分解手法(POD)を幾何変換場に基づくモード分解形式として定式化した.数値シミュレーションを用いて流れ場の分解・合成を実施し,その有効性を検証した. ***
 
小橋口 純 M, 1回目発表 光メディアインタフェース 向川 康博 松原 崇充 舩冨 卓哉 藤村 友貴 北野 和哉
title: Depth from Focus by Test-time Optimization of Single-image Depth Estimation Network
abstract: Depth estimation is a technique that takes an image as input and estimates the distance from the camera to objects, with applications in autonomous driving, AR/VR, and robotic vision. Depth from Focus (DFF), one of such techniques, estimates depth by utilizing changes in camera focus. However, it faces issues such as limited training data and low accuracy. To address these issues, this study aims to improve DFF accuracy by leveraging single-image depth estimation networks trained on large datasets. We propose an approach that uses DFF outputs to optimize the single-image depth estimation network for each scene at test time. The proposed method was evaluated on synthetic and real-image datasets and compared with an existing DFF method.
language of the presentation: Japanese
発表題目:単眼深度推定ネットワークのテスト時最適化によるDepth from Focus
発表概要:深度推定は、画像を入力しカメラから物体までの距離を推定する技術であり、自動運転、AR/VR、ロボットビジョンなどに応用されている。カメラのフォーカスの変化を利用するDepth from Focus(DFF)はその一手法であるが、学習データが少なく精度が低いという課題がある。この課題を解決するために、大規模なデータセットで学習された単眼深度推定ネットワークを活用し、DFFの精度を向上させることを目指す。本研究では、DFFの出力を利用し、テスト時に単眼深度推定ネットワークをシーンごとに最適化するアプローチを提案する。合成画像・実画像のデータセットで評価を行い、DFFの既存手法と提案手法を比較した。
 
柳 龍哉 M, 1回目発表 光メディアインタフェース 向川 康博 清川 清 舩冨 卓哉 藤村 友貴 北野 和哉
title: Continuous Function Representation of Advection in Numerical Weather Models Using Neural Networks
abstract: In recent years, artificial manipulation of weather has been considered as a means to mitigate damage from heavy rainfall, highlighting the need for visualization of physical phenomena to enhance understanding of intervention effects. However, the physical quantities handled by numerical weather models involve massive amounts of data, making visualization processes challenging. To address this, this study focuses on advection, which plays a crucial role in precipitation, and proposes a continuous function representation of advection using neural networks for data compression purposes. To efficiently represent complex advection fields, we are exploring the use of neural fields for geometric transformations capable of expressing both rotational and translational components.
language of the presentation: Japanese
発表題目: 数値気象モデルにおける移流のニューラルネットワークを用いた連続関数表現
発表概要: 近年、豪雨被害の抑制を目的とした気象への人為的操作が検討されており,介入効果の理解を促進するための物理現象の可視化が望まれている。数値気象モデルで扱われる物理量はデータ量が膨大であり、可視化処理が容易ではない。そこで本研究では、降雨に重要な役割を果たす大気の移流に着目し、そのデータ圧縮を目的として、ニューラルネットワークによる移流の連続関数表現を提案する。複雑な移流場の効率的な表現として、回転および並進成分を表現可能な幾何変換のニューラル場の利用を検討している。
 
古賀 荘翠 M, 1回目発表 光メディアインタフェース 向川 康博 安本 慶一 舩冨 卓哉 藤村 友貴 北野 和哉
title: Anime In-betweening Based on illustration shape and texture decomposition
Abstract: Frame interpolation, or inbetweening, in anime production remains largely dependent on manual work, making its automation a pressing and socially relevant challenge. Achieving accurate interpolation is particularly challenging in scenes with fast-moving characters or intricate shapes, as existing methods often fall short in effectively handling occlusions and nonlinear motions. To address these limitations, this study introduces a novel approach that separates the processing of shape and texture, enabling independent interpolation for each. This method shows promise for delivering high-quality results, even in dynamic scenes. Preliminary evaluations of the prototype have demonstrated the potential of this approach, though there is still significant room for improvement in interpolation accuracy. Future work will focus on refining the algorithm and optimizing parameters to achieve more precise frame interpolation.
language of the presentation: Japanese
発表題目: イラストの形状とテクスチャ分解に基づくアニメフレームの中割り
発表概要: アニメ制作におけるフレーム補間(inbetweening)は、依然として多くが手作業に頼っており、その自動化は社会的需要が高い課題である。特に、動きの激しいキャラクターや複雑な形状を含むシーンでは、精度の高いフレーム補間が難しく、既存手法ではオクルージョンや非線形的な動きへの対応が不十分で、適切な補間が困難な状況にある。 本研究では、この問題を解決するために、形状とテクスチャを分離し、それぞれを個別に補間する新たなアプローチを提案する。これにより、動的なシーンにおいても高品質な結果が期待できる。プロトタイプによる検証では、本手法の有効性が一定程度示されたが、補間精度向上にはなお改善の余地が残されている。今後は、さらなるアルゴリズムの洗練やパラメータ調整を通じて、より高精度なフレーム補間を実現していくことを目指す。
 
玉木 太耀 M, 1回目発表 光メディアインタフェース 向川 康博☆ 川西 康友 薗頭 元春 舩冨 卓哉 藤村 友貴 北野 和哉
title: Human Pose Estimation Using Ultra-Low Resolution Far-Infrared Images
abstract: In recent years, the aging of society has brought attention to privacy-conscious 24-hour monitoring systems for elderly people who live alone. In this study, we propose a method to estimate not only a person's posture but also his/her body orientation using ultra-low-resolution far-infrared images of 32x32 pixels, which can be captured even in darkness, while taking privacy into consideration.
language of the presentation: Japanese
発表題目:超低解像度遠赤外線画像を用いた人物姿勢推定
発表概要: 近年,高齢化社会の進展により,独居高齢者向けのプライバシに配慮した24時間見守りシステムが注目されている.そこで,本研究ではプライバシに配慮しつつ,さらに暗闇でも撮影可能な32x32画素の超低解像度遠赤外線画像を用いて,人物の姿勢だけでなく,身体の向きを推定する手法の提案を目指す.
 
藤枝 直輝 M, 1回目発表 光メディアインタフェース 向川 康博 林 優一 舩冨 卓哉 藤村 友貴 北野 和哉
title: Verification of Robustness in Laser Speckle Authentication Focusing on Object Displacement
abstract: When a laser beam is directed at an object, speckles are produced due to the fine irregularities on the object's surface. Even mass-produced items that appear identical exhibit different speckle patterns because their surface irregularities are unique. This characteristic makes laser speckle promising for product traceability applications on factory lines. However, a challenge arises because the speckle pattern can change significantly due to slight displacements of the object.This research aims to achieve high-precision authentication that is robust against object displacement. Previous research has improved authentication accuracy by increasing the number of images taken, which adds complexity and effort during capture. To address this, the research seeks to suppress changes in speckle patterns caused by displacement by optimizing the optical system, enabling one-shot authentication. Preliminary experiments were conducted by introducing a lens, and changes in the speckle patterns due to displacement were examined.
language of the presentation: Japanese
発表題目: 物体の位置ずれに着目したレーザスペックル認証におけるロバスト性の検証
発表概要: レーザー光をある物体に当てると物体表面の細かい凹凸によってスペックルが生じる。同じ見た目の量産品でも表面の細かい凹凸が異なるため、スペックルパターンは異なる。そのため、工場ライン等における製品のトレーサビリティへの応用が期待できる。一方で、物体の位置ずれによって大きくパターンが変化してしまうという課題がある。本研究では、物体の位置ずれに対して高精度な認証を実現することを目指す。先行研究では、撮影回数を増やすことで物体の認証精度を向上させており、撮影時の手間がかかる。そこで、光学系を工夫することでスペックルパターンの位置ずれによる変化を抑え、ワンショットでの認証を目指す。レンズを挿入した予備実験を行い、位置ずれに対するスペックルの変化を検証した。
 

会場: L2

司会: 坂井 優介
糸井 暉起 M, 1回目発表 生体医用画像 佐藤 嘉伸 金谷 重彦 大竹 義人 Soufi Mazen
title: Deep Learning-based Survival Prediction of Heart Disease Patients using Pathological Images
abstrac:Predicting patient survival from pathological images holds potential for optimizing treatment strategies and improving clinical outcomes. This study focuses on developing an AI model to predict the survival of heart disease patient using pathological images. By identifying patients at high risk through image analysis, the proposed approach facilitates targeted, intensive treatments for those who need it most. In this study, we validate conventional deep learning models, such as Resnet, and recent foundation models, such as CHIEF, a pre-trained deep learning model optimized for cancer cell prognosis and classification tasks using pathological images. In this research, we fine-tuned the CHEIF model to adapt it to heart disease images, a domain for which no prior studies have been reported. For validation, a database including images of 231 patients from Nara Medical University was used, with the task of predicting >90 days survival. Current progress in database preparation and pilot experiments will be reported.
language of the presentation: Japanese
 
上井 渚月 M, 1回目発表 生体医用画像 佐藤 嘉伸 金谷 重彦 大竹 義人 Soufi Mazen
title: Analysis of cortical and trabecular bone density of the proximal femur by gender and age using a large CT database
abstract: Measurement of cortical and trabecular bone density of the proximal femur is important for assessing fracture risk and monitoring treatment efficacy. The pQCT method (quantitative CT measurement for peripheral bones) is a bone densitometry method that can separate trabecular bone from cortical bone, but its use of a small CT device limits the measurement area to a limited area such as the radius. In addition, past studies have shown that there are differences in cortical bone width and cortical bone porosity depending on age and gender, but most of them are based on CT imaging such as HR-pQCT (high-resolution quantitative CT for peripheral bones) using biopsies of fracture patients or bone specimens taken from femurs of cadavers. No study has been conducted to separate cortical and trabecular bone from CT images of the lower limb without physically extracting only the femur. In addition, there have been no studies of more than 100 cases. In this study, we made the cortical and trabecular bone labels by measuring the cortical bone width of the proximal femur in a CT database of 1109 cases, and analyzed the results by gender and age.
language of the presentation: Japanese
 
亀田 惟仁 M, 1回目発表 生体医用画像 佐藤 嘉伸 池田 和司 大竹 義人 Soufi Mazen
title: Proposal of automated osteonecrosis classification methods in MR images based on three types of clinical systems
abstract: The automatic classification of osteonecrosis of the femoral head (ONFH) types is crucial for diagnostic support, reducing reliance on physician diagnostic experience, and even for predicting the prognosis of collapse. Although some studies have attempted to implement automatic classification systems for ONFH types, none have reported implementations that include multiple classification methods and their comparative validation. In this study, we used MRI images of the femur from 63 patients with ONFH to develop an automatic segmentation model for the pelvis, femur, and necrotic regions, and implemented a system that performs three types of classification (Japanese Investigation Committee (JIC), Steinberg, and Association Research Circulation Osseous (ARCO) classifications) based on the segmentation results. Here, we report the outcomes of this implementation.
language of the presentation: Japanese
 
神鳥 有沙 M, 1回目発表 生体医用画像 佐藤 嘉伸 松原 崇充 大竹 義人 Soufi Mazen
title: Proposal of a Motion Evaluation Model Utilizing Individualized Musculoskeletal Analysis in Basic Classical Ballet Movements
abstract: Classical ballet is an art form that demands both high physical ability and artistic expression. However, it places significant strain on the body, making injuries a common issue for dancers. Many ballet dancers experience musculoskeletal disorders, which can disrupt their careers, hinder daily life, and impact their work performance. Preventing injuries is therefore a critical concern. The primary cause of injuries is often attributed to overwork resulting from improper techniques. Currently, correction of such techniques relies heavily on ballet instructors, whose evaluations are typically limited to visual information.Previous studies have explored the use of machine learning for evaluating dance performance, but their evaluation criteria are largely based on subjective assessments by experts and do not sufficiently focus on the internal physical burdens. Furthermore, while motion analysis simulations have been applied in classical ballet research, most rely on standardized musculoskeletal models using linear approximations, which fail to fully account for individual skeletal characteristics.In this study, we propose a motion evaluation model that leverages motion analysis simulations based on individualized musculoskeletal models. By integrating these simulations with machine learning, the proposed model aims to provide objective and personalized evaluations that consider movement efficiency and injury risk.
language of the presentation: Japanese
 
辻 響貴 M, 1回目発表 生体医用画像 佐藤 嘉伸 加藤 博一 大竹 義人 Soufi Mazen
title: Estimating the Bone Mineral Density from a Plain X-ray Image around Lumbar Spine
abstract:Dual-energy X-ray absorptiometry (DXA) and quantitative computed tomography (QCT), which are the gold standards in the diagnosis of diseases caused by reduced bone density such as osteoporosis, have limited routine applications due to cost and high radiation exposure. Therefore, the use of simple X-ray images for bone mineral density estimation, which are less expensive and less exposed to radiation, is a promising alternative for the early detection of osteoporosis. In previous studies, an approach based on a hostile generative network has been proposed for estimating bone mineral density(BMD) from simple X-ray images, and by using Digitally Reconstructed Radiographs(DRR) images generated from a trained generator, it is possible to estimate BMD without complex preprocessing and large datasets. The use of DRR images generated from trained generators enables bone density estimation without complex preprocessing and large data sets. Based on this study, we attempted to estimate the bone mineral density of the lumbar spine in 238 actual cases and report the results.
language of the presentation: Japanese
発表題目: 腰椎単純X線画像からの骨密度推定
発表概要: 骨粗鬆症のような骨密度の低下に起因する疾患の診断において,ゴールドスタンダードである二重エネル ギーX線吸収測定法 (DXA) や定量的コンピュータ断層法 (QCT) は,コストの問題や放射線被曝量の大きさから日常 的な適用は限られている.よって,撮影コスト,被曝量の小さい単純X線画像を骨密度推定に用いることができれば, 骨粗鬆症の早期発見のための有望な代替手段となる.これまでの研究で,単純X線画像から骨密度を推定するため の,敵対的生成ネットワークを用いた手法が提案されており,訓練後の生成器から生成される Digitally Reconstructed Radiographs(DRR) 画像を用いることで,複雑な前処理や大規模なデータセットを必要としない骨密度推定を可能にし ている.我々はこの研究を基に,実際の 238 症例において,腰椎の骨密度推定を試みたのでその結果を報告する.
 

会場: L3

司会: Fasial Mehmood
森本 湧基 M, 2回目発表 自然言語処理学 渡辺 太郎 荒牧 英治 上垣外 英剛 大内 啓樹
title: Control of Text2Table with Keywords
abstract: In traditional information extraction tasks, it is necessary to predefine a schema, but this schema is often implicitly indicated in the text. In the text2table task, which generates tables from text, it is possible to use schemas implicitly indicated in the text as table headers and generate the corresponding content as table cells. This allows for more flexible information extraction. However, issues such as duplicated expressions and unintended content being output remain problematic. In this study, we create a dataset with added keywords and verify whether the content of tables generated can be controlled using these keywords.
language of the presentation: Japanese
発表題目: キーワードによるtext2tableの制御
発表概要: 従来の情報抽出タスクでは事前にスキーマを設定する必要があるが,このスキーマは文中で暗黙的に示されていることが多い.テキストから表を生成するtext2tableタスクでは文中で暗黙的に示されるスキーマを表のヘッダーとして,スキーマに対応する内容を表のセルとして生成することができるため,より柔軟な情報抽出が可能である.その一方で重複した表現や意図しない内容が出力されることが問題である. 本研究ではキーワードを追加したデータセットを作成し,キーワードによって生成される表の内容を制御できるかを検証する.
 
橋本 清斗 M, 1回目発表 ソーシャル・コンピューティング 荒牧 英治 渡辺 太郎 若宮 翔子 Peng Shaowen
title: Automating Qualitative Analysis: Uncovering Latent Topics from Patient Free-Text Descriptions
abstract: The qualitative research method of tagging and classifying opinions obtained from free-response surveys according to their content relies heavily on significant manual effort. Given the high performance of rapidly advancing large language models (LLMs) in tasks such as similarity judgment and summarization, their potential for automating qualitative research was examined. In this study, we proposed a stepwise aggregation method inspired by the grounded theory approach traditionally used for manual tagging and classification. This method iteratively integrates tags based on their similarities. Even when using a relatively small-scale local LLM to ensure data privacy, the method demonstrated a certain degree of agreement with manually aggregated results, using them as a reference metric.
language of the presentation: Japanese
発表題目: 質的分析の自動化:患者自由記述テキストからの潜在的トピックの発見
発表概要:自由記述アンケートで得られる意見を,その内容ごとにタグ付け分類する質的研究の手法は多大な人手コストに依存する.近年急速に発展しているLLMは類似文判定や要約の性能も高いことから,質的研究の自動化に活用できる可能性を検証した.本研究では人手でのタグ付け分類の手法であるグラウンデッド・セオリーを参考とし,タグ間の類似性による統合などを複数回行う段階的な集約法を提案した.個人情報保護のため比較的小規模のローカルLLMを用いた場合でも,人手による集約結果を一指標として一定の一致度を示した.
 
峯 悠大 M, 1回目発表 ソーシャル・コンピューティング 荒牧 英治 渡辺 太郎 若宮 翔子 Peng Shaowen 大竹 義人
title: Classification of Imaging Purpose in CT Radiology Reports
abstract: CT radiology reports are text data that describe abnormal findings and lesions detected by physicians from medical images. In statistical analysis of CT data, the patient's disease background is important information. However, in large-scale radiology reports, detailed information other than age and sex was often unknown. The purpose of this study is to identify the purpose of imaging from CT radiology reports and extract patient-specific disease backgrounds. We propose a classification method for CT radiology reports using Large Language Models (LLMs), and furthermore, we conducted pre-training of the DeBERTa-large model using 2.5 million finding descriptions and evaluated the accuracy of classification tasks at each step of pre-training.
language of the presentation: Japanese
発表題目: CT読影レポートの撮影目的分類
発表概要: CT読影レポートは医師が画像から検出した異常所見や病変を記述したテキストデータである。CTデータの統計的な解析においては、患者の疾患背景が重要な情報となるが、大規模な放射線読影レポートにおいては年齢・性別以外の詳細な情報が不明であった。本研究の目的はCT読影レポートから撮影目的を特定し、患者固有の疾患背景を抽出することである。大規模言語モデル(LLM)を用いたCT読影レポートの分類手法を提案し、さらに250万件の所見文を用いてDeBERTa-largeモデルの事前学習を実施し、事前学習の各ステップにおける分類タスクの精度評価を行った。
 
清水 美緒奈 M, 1回目発表 ソーシャル・コンピューティング 荒牧 英治 清川 清 若宮 翔子 Peng Shaowen
title: Generating questions to resolve geographic ambiguity in location expressions
abstract: Estimating the latitude and longitude of a linguistic expression (place expression) that refers to a specific location in the real world, such as the name of a place or facility, is called geolocation. In geolocation, there may be multiple candidate locations for a single place expression, and it may be difficult to identify the location. Previous studies have proposed methods for disambiguating location expressions by employing contextual information, but this remains a challenge in situations where contextual information is lacking. In this study, we focus on such a situation where contextual information is lacking and attempt to generate the content of the question with the aim of locating ambiguous location expressions through question responses to the user.
language of the presentation: Japanese
発表題目: 場所表現の地理曖昧性を解消するための質問内容生成
発表概要: 地名や施設名など、実世界の特定の場所を指す言語表現(場所表現)の経緯度を推定することをジオコーディングと呼ぶ。ジオコーディングでは、一つの場所表現に対して複数の候補地が存在することがあり、位置を特定することが困難な場合がある。従来の研究では、文脈情報を用いることで場所表現の曖昧性を解消する手法が提案されているが、文脈情報が不足している状況では依然として課題が残る。本研究では、このような文脈情報が不足する状況に着目し、ユーザへの質問応答を通じて曖昧な場所表現の位置を特定することを目指して、その質問内容の生成を試みる。
 
祖父江 智子 M, 1回目発表 ソーシャル・コンピューティング 荒牧 英治 清川 清 若宮 翔子 Peng Shaowen
title: Relationship between SNS Use and Well-being
abstract: Today, many people use social networking services (SNS), and their influence is increasing day by day. However, opinions are divided as to whether SNS have an impact on users' sense of well-being. The purpose of this study is to clarify to what extent the types of SNSs and their usage affect users' feelings. Specifically, using the experience sampling method, we conducted a questionnaire on emotions after using SNS through crowdsourcing to 300 people over a two-week period. Based on the data obtained, I will analyze what types of SNSs and their usage influence the change in emotions.
language of the presentation: Japanese
発表題目: SNS利用と幸福感の関係
発表概要: 現代社会では多くの人がSNSを利用しており,その影響力は日々増している.しかし,SNSがユーザーの幸福感に与える影響の有無については,意見が分かれている.本研究は,SNSの種類やその利用方法がユーザーの感情にどの程度影響を及ぼすのかを明らかにすることを目的としている.具体的には,経験サンプリング法を用いて,2週間にわたり,クラウドソーシングを通したSNS利用後の感情に関するアンケートを300人に対して実施する.得られたデータをもとに,どのようなSNSやその利用方法が感情の変化に影響を与えているかを分析する.