多重出力 HMM による遺伝子領域予測法における cDNA 情報の統合

熊谷 俊高 (0051033)


近年配列決定技術が急速に進歩したことにより,ゲノムの 配列決定の速度が加速している.それにともない, 大量の DNA 配列がデータベースに蓄積されつつある.

しかし現状では,得られた大量の DNA 配列に含まれる遺伝子領域の 決定をはじめとする生物情報学的な解析の速度は極めて不十分 である.

そこで,生化学的実験を用いずに DNA 配列情報だけから 意味のある情報を計算機を用いて取り出す手法の開発が必要となっている.

発表者は 2001 年より開始した「コウジカビゲノム解析プロジェクト」 にて遺伝子領域予測システム GeneDecoder を用いて コウジカビ (aspergillus oryzae) のドラフト DNA 配列 からの遺伝子領域予測を行った.

その作業の際の問題意識から,cDNA 配列によるスプライス部位の 情報を用いながら GeneDecoder で遺伝子領域予測を実行する 方法を提案し,実装した.

また,実装したシステムの評価を行うために aspergillus oryzae の遺伝子を含むテスト用 DNA 配列を作成した.

今回の発表では,遺伝子領域予測問題について述べた後, GeneDecoder のシステム概要を紹介し,提案した cDNA 配列の情報 を統合する手法を述べる.

次に評価用のテスト配列セットについて説明した後, 提案手法によって予測精度がどのように向上したか報告する.