Variational AutoEncoderを用いた教師なし学習による肺レントゲン画像の潜在空間モデルの構築

安形 俊輝


今日,医師不足の問題を背景に,CTやMRIから得られる画像から深層学習によって診断を自動的に行う研究が盛んに行われている.深層学習モデルは,入力データを表現するのに最適化された特徴量を学習できることが特徴である.これは,深層学習における中間層における表現は,入力データを適切な低次元変数として表すことができることを意味している.ただし,先行研究においては,予めラベルデータが準備されたデータセットに対する教師あり学習での識別が主流であり,画像の細部まで確認が必要な診断には多大なコストが発生していた.そこで,本研究では,Variational AutoEncoder (VAE)を用いた教師なし学習によって特徴量を抽出するモデルを構築した.さらに,この特徴量をPCAによって解析し,分布の平均から差異を表す指標を算出し,医学的な所見との対応関係をフィッシャーの正確確率検定によって確認した.その結果,7つの指標のうち3つの指標において統計的に有意な対応関係が確認できた.