医用画像読影教育システムのための深層学習による眼球運動の分類手法

神川 怜史(1811073)


医学の高度な専門化と進歩に伴い、医用画像読影は経験の浅い医療従事候補者にとって限られた訓練期間内で学ぶことは容易ではない。本研究では、経験の浅い医療従事候補者を効率よく熟練者に近づかせることを目標とする。効率的なスキルの習得において、読影中の学習者に自身の読影行動をフィードバックできる教育システムの開発に向けて、本研究では読影スキルを解明するための手法を提案する。読影行動を解明するため、教師なしクラスタリングであるk-means法とCNN(Convolutional Neural Network)を用いる3つのモデルを用いてFixationとSaccadeといった眼球運動の分類手法を提案した。

まず2つの視線軌跡のオープンデータを用い、最も優れている提案手法を基礎実験をすることで明らかにした。結果として、深層畳み込みニューラルネットワーク(DeepCNN)モデルが優れていた。このモデルは、従来の視線の研究で評価の高いgazeNetよりも良い結果を出した。

DCNNモデルを採用し、サンプリング周波数120HzのTobii Pro X3‐120で収集したデータを用いて応用実験を行なった。データは臨床経験のある放射線技師2人と放射線技師養成校の学生2人が参加し、30枚のX線画像を読影した。DCNNモデルが眼球運動の予測した結果は、30枚の全体画像を対象とするFixation時間では、経験者と学生で有意差があり先行研究と同様の結果が得られた。本研究では、提案する識別器の精度を測ることを目的とし、提案した中で高精度を出したDCNNモデルが採用された。

今後は、医用画像を読影する際の眼球運動識別アプリケーションを作成し、教育現場で効果があるかを検証する必要がある。