変異アミノ酸・構造・進化情報を用いた病気関連nsSNPの予測

吉井 悠喜


一塩基多型(SNP)は、個人の疾患の罹り易さを示す重要な指標になると考えられている。特に、アミノ酸置換を引き起こす非同義置換SNP(nsSNP)は、ヒトの遺伝性疾患に関する既知の遺伝的変異のほぼ半分を占めるとされ、注目されている。疾患に結びつく病気関連nsSNPの同定を促進するには、優先的に病気関連nsSNPのみを選 択する必要がある。そこで、さまざまな特徴量を用いた病気関連nsSNPの予測の研究が行われてきた。本研究では、予測精度をさらに向上させるための新たな手法を探求することを目的とし、位置特異的なアミノ酸出現頻度などの先行研究で利用された特徴量のほかに新たな特徴量として天然アミノ酸スコアとポケット度を加えて予 測をまず行った。結果、先行研究で最も有効とされたSIFTスコアと同様の位置特異的なアミノ酸の出現頻度(PROFILE_SCORE)が最も優れていた。しかし、線形判別分析を用いた2個の特徴量の全ての組み合わせによる予測では、PROFILE_SCOREに変異アミノ酸スコア(MUTATION)か溶媒露出度(ACCESSIBILITY)を組み合わせると、PR OFILE_SCORE単体の予測精度を改善することができた。また、データセットを酵素と非酵素に分けて組み合わせを行って予測すると、酵素ではPROFILE_SCOREとACCESSIBILITY、ACCESSIBILITYとMUTATIONの組み合わせ、非酵素ではPROFILE_SCOREとMUTATIONの組み合わせが最適であることが分かった。よって、nsSNPが生じた蛋白質が酵 素であるか非酵素であるかを事前に調べ、それに応じて予測に最適な特徴量の組み合わせを選択することで、予測精度を向上できることが分かった。