Escherichia coliのFur結合領域におけるコンセンサス配列探索

小川 祐樹 (0851144)


コンセンサス配列とは、ある特定の機能を持つ遺伝子領域中に高頻度に見られる塩基配列パターンのことである。コンセンサス配列を特定することにより、遺伝子上に存在する別の未知コンセンサス配列の予測、さらにはその遺伝子の機能予測を可能にすると期待されている。しかし、コンセンサス配列にはゆらぎが大きく、その法則性も曖昧である。コンセンサス配列を探索する手段は様々な統計学的指標を用いて考案されているが、正確に予測できるものはまだ確立されていない。 コンセンサス配列を持つものの一つとして、真正細菌の FUR-box が知られている。 真正細菌にとって、鉄は生存に必要不可欠な要素のひとつである。細菌生体内の鉄の恒常性は siderophore と呼ばれる三価鉄輸送キレートによって保たれている。Fur (Fe uptake regulator)はsiderophore コード領域上流の DNA 領域と結合することで、siderophore の転写を厳密に制御している。この Fur が結合する DNA 領域を FUR-box と呼ぶ。 本研究では、実際の実験データを用いた新たなアプローチでコンセンサス配列を探索する新規アルゴリズムを構築した。このアルゴリズムを使用するデータモデルとして、真正細菌 Escherichia coli の W3110 株とO157 Sakai 株のデータを用いた。本研究の手順として、まず Escherichia coli W3110 株と O157 Sakai 株において Fur をプローブタンパクとした ChIP-on-chip データを用い、Fur 結合領域を選出した。さらに、ChIP-on-chip のシグナル値、塩基配列の出現頻度による p値、そして重み行列を考慮した新規探索アルゴリズムを作成し、コンセンサス配列を推定した。そしてEM アルゴリズムを用いた既存配列探索モデルである MEME と比較評価することで、その有用性を検証した。その結果、現段階での精度はMEMEに劣るものの、今後の改善次第ではさらに良いアルゴリズムになることが分かった。