ペア確率多重文脈自由文法に基づくRNA比較2次構造予測

田中 翔 (0751073)


ncRNA(non-coding RNA)は,その高次構造と機能に深い関係があると考えられており,中でもRNAの折りたたみ構造を表す2次構造の予測法が注目されている. 2次構造予測に対する有力なアプローチとして,形式文法,特に文脈自由文法(CFG)の構文解析アルゴリズムを用いた手法が種々提案されているが,CFGは重要な折りたたみ構造の1つであるシュードノットを表現できない.そこで,CFGより表現能力の高い形式文法(MCFG,TAG等)を使った予測法が提案されている.また,汎用性と精度の向上を目指し,複数の1次構造同士をお互いに比較しながら2次構造を予測する比較解析を用いた手法もいくつか提案されている.本論文では,ペア確率多重文脈自由文法(Pair-SMCFG)という文法を新たに定義し,これを使ったRNAの2次構造予測法を提案する.Pair-SMCFGは,MCFGを2本のRNAに対する比較解析ができるように拡張したものである.長さ70程度のRNA配列に対して2次構造予測を行ったところ, RNAの特定のファミリーに対する文法のチューニングを全く行わないという条件下で,1本のRNAのみを入力とする場合,再現率,適合率共に1%以下であったのに対し,提案手法では適合率63.2%,再現率62.0%という結果を得た.