Protein Function Prediction based on k-core of Interaction Networks

鎌倉 徳彦 (0851154)


本研究では、タンパク質間相互作用(PPI)ネットワークに基づいたタンパク質の新規機能推定法を提案した。タンパク質の機能推定法は、特定の機能をもつタンパク質同士が高密度な結合関係を有するグループを形成する場合、そこに帰属している未知タンパク質の機能を、帰属しているグループの機能とする手法である。機能推定の際、特定の機能を持つサブネットワークのk-coreを指標とした。k-coreとは、それぞれの点が少なくともk個の他の点と隣接するような最大サブグラフのことである。本研究では、サブネットワーク作成の際、機能既知のタンパク質と機能未知とのタンパク質の相互作用情報だけでなく、機能未知のタンパク質間の相互作用情報も利用した。今回使用したPPIデータの生物種は、シロイヌナズナ(学名:Arabidopsis thaliana)である。このデータセットは、機能既知のタンパク質1,013個と機能未知のタンパク質289個からなる計1,302個のタンパク質と、3,118個の相互作用データで構成される。この解析により、機能未知タンパク質のうち88個のタンパク質に対し、9種類の機能 ( cell cycle and DNA processing, cellular communication/signal transduction mechanism, energy, metabolism, protein fate (folding, modification, destination), transcription ) を推定した。特に、protein fate (folding, modification, destination)と予測されたタンパク質のほとんどがF-box タンパク質ドメインを有していた。また予測の信頼性は、使用したPPIデータに対して3以上のk-coreに関し統計学的に有意な予測であるという結果を得た。今回提案した手法は、他の種のPPIデータにも適用することが可能であり、汎用性は高い機能予測法である。