天然化合物を使用した創薬では、母核構造を基にしてデータベースから構造検索を行い、検索で得られた化合物をもつ生物種を特定し、臨床実験に入るという手順で行われている。しかし、現行のデータベースシステムは化合物と生物種の関係が収録されていないため、構造検索した後に文献を調べる必要がある。比較ゲノム学講座ではこの点に着目し数年前から「生物種-代謝物データベース(KNApSAcK)」の構築を行っている。KNApSAcKは多くの二次代謝物に関するデータを含む特色のあるデータベースであるが、構造検索機能が備わっていないことから、機能拡張が望まれている。
過去に使用されてきた薬効成分がいずれも二次代謝産物であることからも、その代謝経路は重要なのだがほとんど解明されていない。そこで構造情報に基づいてKNApSAcKのデータを階層分類することにより生合成経路と代謝産物の対応付けを行う研究が行われている。この研究では、まず母核構造で大きく分類し、その後各化合物の持っている側鎖の情報に基づいて細かく分類を行っているのだが、現在のところ、これらの作業はすべて手作業で行われている。
本研究では、創薬や二次代謝経路の解明に貢献することを目的とし、KNApSAcKのデータに対応した構造検索機能を開発し、さらに検索で得られた各化合物がどのような側鎖を持っているかを自動的に判別するシステムを開発した。