ゲノム科学において生物種の多様性を体系的に理解することはビックデータバイオロジーにおいて最も重要なテーマである。地球上で生物が生合成する代謝物の種類は約106万種と推定されている。これらの二次代謝物(天然物)は、生物の生存戦略、例えば、紫外線対策、忌避物質などの生物間の相互作用などに用いられている。本研究では、代謝物の3次元構造と生物活性間の関係を解析するため、4つのステップからなるネットワークに基づいた手法を開発した。構造類似度に基づいて代謝物のネットワークを構築する(Step 1)。構造グループに代謝物を分類する(Step 2)。構造グループと生物活性間に統計的に有意な関係を評価する(Step 3)。統計的に有意な関係のある構造グループと生物活性に基づいて構築したデータ行列を2次元クラスタリングする(Step 4)。KNApSAcK Metabolite Activity DBで報告されている2072種の二次代謝物と140種の生物活性からなるデータセットを本手法に適用すると、統計的に有意な983種の構造グループ-生物活性ペアが得られた。代謝物の3次元化学構造と生物活性間の関係を体系的に解析した。これらのデータの解釈から、特定の生物活性は代謝物の分類により説明できると結論付けられる。。