我々は遠縁のホモログをアミノ酸配列から認識するための手法を開発するこ とを目的とし、配列相同性検索に2次構造予測及びsolvent accessibility(溶媒露出度)の予測を組み合 わせたシンプルで新しい手法を提案する。
この手法は、まず、標準的な配列相同性検索プログラムを 通常通り実行し、検索する配列(クエリ)とその配列と類似性が認められる配列(テンプレート)との配 列類似性スコア(E-value)を得る。続いて、配列相同性検索プログラムによってアラインメントさ れたクエリとテンプレートのアミノ酸配列両方の2次構造予測及び溶媒露出度予測をし、両者の予 測構造の類似性を構造一致度の統計的有意性(Zscore)を用いて評価する。比較したタンパク質ペアが 遠縁のホモログであるか否かの最終決定は、配列相同性検索プログラムの配列類似性(E-value)と予 測構造の類似性を考慮して行なう。本研究手法のホモログ認識性能を評価するために、我々はホモログか ホモログでないか既に分類されているSCOPデータベース(立体構造分類データベース)の代表タンパク 質セットを用いた。
その結果、配列相同性検索プログラムのE-valueに2次構造予測及び溶媒露出度予測 を組み合わせることで、標準的な配列相同性検索プログラムであるBLAST/PSI-BLASTのホモログ認識性能 の改善に至ることがわかった。