大腸菌はヒトの腸内に常在する細菌種の1つであり、モデル生物として古くから積極的に研究されてきている。また、EHECやEPEC、UPECなどの病原性を示す株も存在することから、他の細菌種と比べて研究が進んでいるものの、健常な個人の腸内に常在する大腸菌に関する知見は限定されている。そこで我々は、腸内に常在する大腸菌の多様性に関する新規知見を得るために、健常な13人から得られたメタゲノムデータとすでにゲノム全配列が公開されている大腸菌株を比較することで、腸内に常在する大腸菌と既知の大腸菌株それぞれの特徴を抽出することを試みた。
メタゲノムデータは大量の塩基配列データから構成されているため、解析結果から効率良く新規知見を見出すためには結果の可視化が必須となる。そこで我々は、塩基配列の相同性に基づきメタゲノムデータを既知の大腸菌ゲノムにマッピングした結果を可視化するソフトウェアを作成した。開発したソフトウェアを利用し、大腸菌ゲノムにおいて多様性を示す領域を検出するとともに、それらの領域に含まれる遺伝子を検出した。