奈良先端科学技術大学院大学 情報科学研究科 情報生命科学専攻 蛋白質機能予測学講座 講義関連

平成22年度 近畿大学・農学部・応用生命化学科・生命情報学実習

4/20(火) 配列データベースと配列相同性検索

担当:川端 猛

  1. 配列データベース実習

    1. Mycoplasma genitaliumの全ゲノムデータにアクセスし、回答用紙の質問に答えよ。なお、以下のWEBページの使用法を参考にせよ。

    2. Homo sapiensの三つの遺伝子HBA1(ヘモグロビン アルファ鎖),TPI1(トリオースリン酸異性化酵素),ATP5A1(F1 ATP合成酵素 アルファサブユニット) をコードしている染色体のDNA配列にアクセスし、回答用紙の質問に答えよ。なお、以下のWEBページの使用法を参考にせよ。

  2. 配列相同性検索実習

    1. ヒトの蛋白質に相同なマウス、酵母、大腸菌の蛋白質の調査

      ヒトの4つの蛋白質のアミノ酸配列のうち、マウス、酵母、大腸菌にその相同蛋白質 (ホモログ)があるかどうか調べ、もしホモログが存在すれば、その配列名、E-value、Identitiesを記入せよ。ホモログが存在しなければ、ホモログ名に「なし」と書け。アミノ酸配列のデータベースはUniprot/Swissprotを用いること。E-valueのしきい値は0.001とする。

      クエリとなるヒトのアミノ酸配列データは、相同性解析用配列データ から入手せよ。

      用いる四つのヒト蛋白質は以下である。
      TPIS_HUMAN Triosephosphate isomerase トリオース燐酸異性化酵素 糖代謝に関係する酵素
      UBIQ_HUMAN Ubiquitin ユビキチン 蛋白質分解に関係
      MYG_HUMAN Myoglobin ミオグロビン 筋肉中の酸素の運搬
      DPOLA_HUMAN DNA polymerase alpha catalytic subunit DNAポリメラーゼ αサブユニット DNAの合成

      BLASTによる配列相同性検索は以下の公共のWEBサーバのどれかを利用する。

      これらのサーバごとに使用法は少しずつ異なるが、基本的な部分は同様である。以下のことに 気をつけること。

      1. アミノ酸配列とアミノ酸配列の比較を行うので、"blastp"あるいは"protein blast"を 選ぶ

      2. 検索対象データベースとして、"UniProt/Swiss-Prot" あるいは "swissprot"を選ぶ
      3. ヒットする配列の数が多くなると、途中でリストがとぎれてしまうことがある。これを防ぐために、出力する配列・アライメントの最大値を1000に設定すること。
        プログラムの選択 データベースの選択 出力配列本数の設定
        DDBJ blastp Uniprot/Swiss-prot [検索結果一覧の表示数],[アラインメント表示数]の両方を1000に設定
        NCBI protein blast Swissprot protein sequences(swissprot) [Algorithm parameteres]をクリックし、[Max target sequences]を1000に設定
        genome net BLASTP Swiss-Prot Output optionsの [Set the maximum number of database sequences to be reported]と [Set the maximum number of alignments to be displayed]の両方を1000に設定

      参考資料

      1. UniProt/SwissProtの代表的生物種の5文字表記
      2. UniProt/SwissProtの全生物種の5文字表記