奈良先端科学技術大学院大学 情報科学研究科 情報生命科学専攻 蛋白質機能予測学講座 講義関連

平成21年度「ゲノムリテラシー講座」

配列相同性検索 演習


  1. 配列相同性検索実習

    1. ヒトの蛋白質に相同なマウス、酵母、大腸菌の蛋白質の調査

      ヒトの4つの蛋白質のアミノ酸配列のうち、マウス、酵母、大腸菌にその相同蛋白質 (ホモログ)があるかどうか調べ、もしホモログが存在すれば、その配列名、E-value、Identitiesを記入せよ。ホモログが存在しなければ、ホモログ名に「なし」と書け。アミノ酸配列のデータベースはUniprot/Swissprotを用いること。E-valueのしきい値は0.001とする。

      クエリとなるヒトのアミノ酸配列データは、相同性解析用配列データ から入手せよ。

      用いる四つのヒト蛋白質は以下である。
      TPIS_HUMAN Triosephosphate isomerase トリオース燐酸異性化酵素 糖代謝に関係する酵素
      UBIQ_HUMAN Ubiquitin ユビキチン 蛋白質分解に関係
      MYG_HUMAN Myoglobin ミオグロビン 筋肉中の酸素の運搬
      DPOLA_HUMAN DNA polymerase alpha catalytic subunit DNAポリメラーゼ αサブユニット DNAの合成

      BLASTによる配列相同性検索は以下の公共のWEBサーバのどれかを利用する。

      これらのサーバごとに使用法は少しずつ異なるが、基本的な部分は同様である。以下のことに 気をつけること。

      1. アミノ酸配列とアミノ酸配列の比較を行うので、"blastp"あるいは"protein blast"を 選ぶ

      2. 検索対象データベースとして、"UniProt/Swiss-Prot" あるいは "swissprot"を選ぶ
      3. ヒットする配列の数が多くなると、途中でリストがとぎれてしまうことがある。これを防ぐために、出力する配列・アライメントの最大値を1000に設定すること。
        プログラムの選択 データベースの選択 出力配列本数の設定
        DDBJ blastp Uniprot/Swiss-prot [検索結果一覧の表示数],[アラインメント表示数]の両方を1000に設定
        NCBI protein blast Swissprot protein sequences(swissprot) [Algorithm parameteres]をクリックし、[Max target sequences]を1000に設定
        genome net BLASTP Swiss-Prot Output optionsの [Set the maximum number of database sequences to be reported]と [Set the maximum number of alignments to be displayed]の両方を1000に設定

    2. インフルエンザウィルスの種類の調査

      2009年6月に福岡の新型インフルエンザ患者から採取されたアミノ酸配列 HA_fukuoka.seq(ヘマグルチニン) と、 NA_fukuoka.seq(ノイラミニダーゼ) を同様にUniprot/Swissprotに対して、相同性検索を行い、もっともよく似ていた相同配列の名前、E-value、Identities、生物種名を書け。

    参考資料

    1. UniProt/SwissProtの代表的生物種の5文字表記
    2. UniProt/SwissProtの全生物種の5文字表記
    3. Unix環境におけるBLAST演習の手順
    4. NCBIの新型インフルエンザの配列データをまとめたページ
  2. ファミリー同定(Pfam)と膜貫通ヘリックス予測(SOSUI)演習

    機能のよく同定されていないタンパク質配列データ があったとする。 こ れらのタンパク質のうち、

    1. 既知ファミリのドメインに相当する領域がないかどうか

    2. 膜貫通ヘリックスに相当する領域がないかどうか

    を調べ、回答用紙にその領域を記載せよ。また、これらのタンパク質の中で、 膜タンパク質、他のタンパク質をリン酸化するタンパク質、DNAと結合するタンパク質、に相当するものはどれか答えよ。リン酸化とDNA結合については、ヒットした ファミリーの説明(アノテーション)をチェックする必要がある。