蛋白質リン酸化部位予測のための 局所配列とドメイン構造の特徴解析

石橋正守


内容梗概

リン酸化は生体内で起こる翻訳後修飾の中で最も多く行われる重要な反応であ る。リン酸化を引き起こす蛋白質はプロテイン・キナーゼと呼ばれ、それぞれの キナーゼに特異的なリン酸化が複雑なシグナル伝達ネットワークの基盤になって いる。近年、質量分析技術による大規模なリン酸部位の計測が行われる様になっ たが、依然そのデータ量は不足しており、情報学的な手法でアミノ酸配列だけか ら、特定のキナーゼによるリン酸化部位を予測する手法が多く提案されている。 その多くはリン酸化されるアミノ酸の前後数アミノ酸を入力とした学習機械を用 いた手法であるが、その予測精度は十分ではない。そこで本研究では、より精度 の高いリン酸化部位予測法を開発するための調査として、以下の二つの解析を 行った。(1)データベース中のリン酸化部位の局所配列を各キナーゼのタイプご とに調べ、そのパターンがどれだけお互いに類似しているかの調査を行った。こ の解析により、Tyr型キナーゼはSer/Thr型キナーゼに比べて局所配列の規則性が 低いこと、特にSer/Thr型キナーゼのリン酸化部位のパターンは、キナーゼ本体 の触媒ドメインの進化的類縁関係と明らかな相関があることがわかった。このこ とは、進化的に類縁なキナーゼ、例えばCDK2とMAPK1 のリン酸化部位を識別する ことが困難であることを示唆する。(2)局所配列以外の特徴量として、ドメイン 構造に注目し、リン酸化される部位とリン酸化されない部位のドメインに差があ るかどうかの調査を行った。この結果、不定形構造領域を含む非ドメイン領域が 有意にリン酸化を受けやすいこと、キナーゼ触媒ドメイン自身がリン酸化を受け やすいことなどがわかった。これらの知見は、より精度の高いリン酸化部位予測 器を設計する際に有用な指針を与えると考えられる。