2次構造予測等を利用したタンパク質間の弱いアミノ酸配列相同性を検出する手法の開発

植原 克典 (0251137)


 2つのタンパク質を比較すると、立体構造(フォールド)は似ているにも関わらず、アミノ酸の 一致度は低い場合が多く存在する。これらのタンパク質ペアは遠縁のホモログと呼ばれ、弱い進化 的類縁関係を有する。

 我々は遠縁のホモログをアミノ酸配列から認識するための手法を開発するこ とを目的とし、配列相同性検索に2次構造予測及びsolvent accessibility(溶媒露出度)の予測を組み合 わせたシンプルで新しい手法を提案する。

 この手法は、まず、標準的な配列相同性検索プログラムを 通常通り実行し、検索する配列(クエリ)とその配列と類似性が認められる配列(テンプレート)との配 列類似性スコア(E-value)を得る。続いて、配列相同性検索プログラムによってアラインメントさ れたクエリとテンプレートのアミノ酸配列両方の2次構造予測及び溶媒露出度予測をし、両者の予 測構造の類似性を構造一致度の統計的有意性(Zscore)を用いて評価する。比較したタンパク質ペアが 遠縁のホモログであるか否かの最終決定は、配列相同性検索プログラムの配列類似性(E-value)と予 測構造の類似性を考慮して行なう。本研究手法のホモログ認識性能を評価するために、我々はホモログか ホモログでないか既に分類されているSCOPデータベース(立体構造分類データベース)の代表タンパク 質セットを用いた。

 その結果、配列相同性検索プログラムのE-valueに2次構造予測及び溶媒露出度予測 を組み合わせることで、標準的な配列相同性検索プログラムであるBLAST/PSI-BLASTのホモログ認識性能 の改善に至ることがわかった。