多重検定を利用した遺伝子発現量データ解析に関する研究

野村 啓仁 (0651156)


DNAマイクロアレイで得られるような遺伝子発現量の網羅的データの解析におい て、 観測条件の差異に関連して異なる発現量を示す(differentially expressed;DE)遺伝子を検出するのは重要かつ基本的な課題である。

一般的に統計的仮説検定での検出精度は統計量の選択に大きく依存するが、特にある条 件についての仮説検定を一つの遺伝子ずつ、全ての遺伝子について行う多重検定の状況では通常の仮説検定では起こり得ない問題への対処が必要となる。

近年、Storeyら(2007)によるoptimal discovery procedure(ODP)やPlonerら(2006)に よるfdr2dなど、多重検定において有効であるような新たな統計量が考案されて いる。ODPは多重検定における最強力な統計量であることが数学的に証明されているが、 実際の問題に適用する際に多くの仮定を必要とするために理論的に可能な性能に 達しない そのため本論文では、ODP推定量が実際に理論値に近い力を発揮できるようなODP 推定手法を開発した。本手法をクラス間で発現量の異なる(DE)遺伝子を検出す る問題に応用し、 従来手法よりも高い検出力を得ることができた。また、遺伝子、シグナル伝達のネットワークの解析のために、振る舞いの近い遺伝子に回帰検定をfdr2dを利用した統計量を用いたところ、高い精度で動向の近しい遺伝子を検出することができた。