転写制御ネットワーク推定のためのマイクロアレイデータクラスタリング 手法の提案

西田孝三 (0651087)


様々な実験条件から成るD N Aマイクロアレイ発現情報は、転写制御機構推定の可能性を秘めている。少数の実験条件からなる小規模の発現解析においては標準的な解析方法が有効であるが、多数の実験条件からなる発現情報を基に転写制御機構を解析する場合には、より巧みなアプローチが必要となる。そのため、私はグラフ理論と統計を用いた転写制御ネットワーク推定手法を開発した。提案する手法は大別し以下の2 段階により構成される。( 1 ) マイクロアレイにスポットした遺伝子と実験的に転写因子をコードすることが推定可能な遺伝子の発現プロファイルの相関行列を算出し、閾値により2 値化することで遺伝子と転写因子の関係を表す2 部グラフを作成する。( 2 ) グラフ理論に基づいた双方向クラスタリングアルゴリズムを用いて前述の2 部グラフから部分的な制御ネットワークを抽出する。我々は提案手法を、4 0 0 4 の遺伝子、1 7 6 の実験条件から成る枯草菌の遺伝子発現情報に適用し、3 7 5 3 の遺伝子、2 5 1 の転写因子からなる2 部グラフを作成後、8 1の正制御、2 6の負制御ネットワークを抽出した。各々のネットワークは1 つもしくは2 つの転写因子とこれに属する遺伝子群から成り、多くの場合類似した遺伝子機能に属していた。このことから提案手法に基づいた機能分類から未知の転写因子がどのように働くかを予測することの可能性を示した。