奈良先端科学技術大学院大学 情報科学研究科 情報生命科学専攻 蛋白質機能予測学講座

平成20年度 近畿大学・農学部・生命情報学実習

5/20(火) 配列相同性検索と分子系統樹

担当:川端 猛

  1. 配列相同性検索実習

    由来のわからない生物から未知のタンパク質の配列が決まったとする。これらのタンパク質の 機能と生物の種類を推定するためにUniProt/SwissProtに対してBLASTによる配列相同性検索を 実行せよ。

    演習用配列データは、演習用配列データ から入手せよ。

    BLASTによる配列相同性検索は以下の公共のWEBサーバのどれかを利用する。

    これらのサーバごとに使用法は少しずつ異なるが、基本的な部分は同様である。以下のことに 気をつけること。

    1. アミノ酸配列とアミノ酸配列の比較を行うので、"blastp"あるいは"protein blast"を 選ぶ

    2. 検索対象データベースとして、"UniProt/Swiss-Prot" あるいは "swissprot"を選ぶ
      プログラムの選択 データベースの選択
      DDBJ protein blast Uniprot/Swiss-prot
      NCBI blastp swissprot
      genome net BLASTP Swiss-Prot

    3. 相同性の判定基準はE-valueが0.001以下とする

    参考資料

    1. UniProt/SwissProtの代表的生物種の5文字表記
    2. UniProt/SwissProtの全生物種の5文字表記


  2. マルチプルアライメントと分子系統樹実習

    1. 準備

      まず、以下の三つのプログラムをダウンロードし、デスクトップにコピーする

    2. マルチプルアライメントから機能部位を推定する

      コメのプラストシアニン(PLAS_ORYSI) の相同配列のマルチプルアライメントを作成し、そこから、機能部位を推定せよ。
      まず、相同な配列群のファイルPLAS_ORYSI_homo.seqを、 デスクトップか適当なフォルダにダウンロードする。そして、clustalxを用いて、マルチプルアライメントを 実行する。

      1. clustalxのアイコンをクリックして起動する
      2. [File]メニューから[Load Sequence]を選び、配列のファイル(PLAS_ORYSI_homo.seq)を読み込む
      3. [Alignment]メニューから[Do Complete Alignment]を選び、マルチプルアライメントを実行する

      結果を検討することで、保存サイトをマークし、金属結合サイトを推定せよ。

    3. 分子系統樹から生物種の系統関係を推定する
      本演習ではミトコンドリアのCytochrome bのアミノ酸配列の分子系統樹を描くことにより、生物種の 系統関係を推定する。 まず、以下の三つのファイルをダウンロードする。
      • 魚類の配列+外群としてハエ(DROME)の配列:cyb_fish.seq

      • 哺乳類の配列+外群としてニワトリ(CHICK)の配列:cyb_mammal.seq

      • 脊椎動物の配列+外群としてハエ(DROME)の配列:cyb_verte.seq

      あとは、それぞれの配列について以下の手順で、系統樹を作成してください。

      1. clustalxのアイコンをクリックして起動する
      2. [File]メニューから[Load Sequence]を選び、配列のファイル(たとえばcyb_fish.seq)を読み込む
      3. [Alignment]メニューから[Do Complete Alignment]を選び、マルチプルアライメントを実行する
      4. [Tree]メニューから[Draw N-J Tree]あるいは[Bootstrap N-J Tree]を選び、系統樹を作成する
      5. njplotのアイコンをクリックして起動する
      6. [File]メニューから[Open]を選び、ClustalXで出力された系統樹のファイル(*.phか*.phb)を 読み込む
      7. [New Outgroup]ボタンを押し、適当な外群を選択する

      詳細な手順については マルチプルアライメントと分子系統樹基礎 を参考にすること。

      また、生物種の5文字の表記については、UniProt/SwissProtの代表的生物種の5文字表記を参考にすること。



補足のデータ・プログラム
  1. 真核生物の配列(酵母を外群とする):cyb_eukary.seq
  2. マルチプルアライメントのプログラム:ClustalX ver 2.0.7(Windows版)
  3. 無根系統樹の描画プログラム:unrooted(Windows版)