誤差を考慮した時系列マイクロアレイデータの時間軸補正方法の提案

采女 寛行 (0451130)


 本発表では時系列マイクロアレイデータの誤差を相殺し、そのデータに Dynamic Time Warping法を適用して時間軸を正規化する手法を提案する。

 DNAマイクロアレイは遺伝子発現を網羅的に解析するための手法として 近年注目を集めているが、この技術は未だに発展途上であり、マイクロ アレイを用いた実験から得られるデータには多くの誤差が存在している。その ため、時系列データのようなマイクロアレイを複数協調的に利用する 実験に関しては十分に議論されていない。議論は少ないながらも過去の研究で二種類の 時系列データを比較するために時間軸を補正する手法としてDynamic Time Warping法を利用した手法が提案された。DTW法は音声認識の分野で発展した技術であり、 その分野では大変良く機能している。しかし、音声認識の分野で得られるデータは 雑音の少ないところで録音したりより良いデバイスを用いて録音するなどのように データの測定条件を変更することができるためマイクロアレイのデータと比較すると非常に ノイズや誤差の少ないデータを用いることができる。それゆえに、DTWの技術をそのままマイクロアレイ に導入してもその実験誤差のために生物学的に有意義な実験結果を得ることが今まで困難であった。 そこで、マイクロアレイデータの誤差に対処し、DTWアルゴリズムを用いることで 二種類の時系列マイクロアレイデータの時間軸の正規化を試みた。

 時間軸の正規化を行うことで得られる利点は今まで比較が困難であったデータとの比較が できることである。今までの発生、分化、増殖などの研究では時間軸を基準としてデータを 比較するか類似のパターンを人為的に見つけ比較する方法しか取られていなかったが 時間軸を基準にして比較する方法は温度やpH、栄養条件などの培養条件が異なると 発生、分化、増殖の速度が変化するため正しく比較できているとは限らない。また、 類似のパターンを人為的に見つける方法は豊富な経験を持つ人がデータを見なければ 分からない場合が多い。そのことに加え、現在のマイクロアレイ技術は発展途上であり、 そのデータに多くの誤差を含んでいる。本提案手法を用いれば遺伝子発現量を基準として誤差を 考慮にいれて自動的に時間軸を正規化することができるため、上述の理由により今まで比較の難しかった データを簡単に比較することが可能となる。

 まず初めに比較ゲノム学講座より入手した実験データを利用し実験条件が 同じ場合での提案手法の有効性を検証する。次に、オクラホマ大学の公開データベースから 取得した時系列マイクロアレイデータを用い実験条件の異なるデータでの提案手法の有効性 を示す。最後に実験条件の異なるデータの比較例をいくつか示し、実験結果から考察を 行う。