真正細菌を対象としたSNPとINDEL同時検出ツールの開発

芦田 和重 (1151005)


DNAの塩基配列中の変異が原因とされるガンなどの疾病について, 変異箇所を特定することで診断や治療が行える可能性が期待されている. 解析対象の塩基配列中のどの位置にどのような変異が発生しているかを特定する技術は変異コールと呼ばれており, ゲノム解析の中心となる技術の一つである.

正確な変異箇所の特定のため高精度の変異コールが必要とされているが, 現在の変異コールは精度が低く,アライメントの手法次第ではINDELが検出できない場合や, INDEL検出の精度を上げることによりSNP検出の精度が下がるなどの問題がある. そのため,解析の手法を変えた複数回の解析が推奨されており, 解析に必要な時間やコストが増大する原因となっている. この問題を解決するため,より精度の高い変異コールツールを開発する必要がある.

本研究では,真正細菌の塩基配列中からSNPとINDELを高精度に同時検出できる変異コールの実現を目的とし, 既存のツールによる変異コールの問題点の指摘と,独自のアルゴリズムによる変異コールツールの作成を行った. また,複数の真正細菌を対象とし,作成したツールの精度検証を行った. その結果, SNP検出の精度を下げないINDEL検出の実現と, 既存のツールによる変異コールでは検出できなかったINDELの検出に成功した.

Identifying the mutation in the base sequence of DNA is expected to establish diagnoses and medical treatments for the disease that is caused by the mutation. The technology of specifying mutation is called "mutation calling", and is one of the most important technologies in genomics.

Although the highly precise mutation calling is needed for pinpointing mutation, the present mutation calling process has low accuracy and there are some problems. In a certain alignment algorithm, INDEL is undetectable; and the precision of SNP calling falls by raising accuracy of INDEL calling. Therefore, two or more analyses with different tools are recommended, but it causes increasing time and cost. To solve these problems, it is necessary to develop a mutation calling tool with higher-precision.

The purpose of this research is to build the mutation calling tool which can detect SNP and INDEL simultaneously with high precision. We investigated some problems of the mutation calling by the known procedure and created a new tool with original algorithm. Moreover, accuracy verification of our tool was performed by analysing two eubacteria. As a result, it enabled the INDEL calling which does not lower the accuracy of SNP calling, and identifying of INDEL which was not detectable in the mutation call by the known procedure.