基於基因組測序數據鑑定單鹼基變異的方法總結

單核苷酸多態性,英文single nucleotide polymorphism,縮寫爲SNP,讀音爲Snip。SNP主要是指在基因組水平上引發的單個鹼基的變異,其在羣體中的發生頻率不小於1%,包括單鹼基的轉換、顛換以及單鹼基的插入和缺失等。算法


多態性示意圖(圖片來源:genome news network)
 

突變(mutation)和多態性(polymorphism)的主要區別在於微信

1)突變在羣體中的發生頻率小於1%,而多態性的發生頻率在大於1%;ide

2)突變一般對生生物體是有害的,而多態性一般都是無害的。工具


多態性和突變的區別(圖片來源:genome news network)

 

那麼基於基因組測序數據,包括全基因組測(WGS)、全外顯子測序(WES)或靶向測序(targeted sequencing),鑑定基因組變異的標準流程是什麼樣的呢?(更多精彩請關注微信公衆號:AIPuFuBio)性能

具體以下圖所示:orm


基因組變異鑑定標準流程(DePristo et al. Nature Genetics, 2011)

 

因此基於測序數據進行基因組變異檢測的第一步就是數據匹配,即把測序數據匹配到參考基因組上。匹配測序數據的軟件很是多,下圖列舉了一些典型的匹配軟件。具體以下所示:blog


經常使用的測序數據匹配軟件比較(Li et al. Cancer Informatics, 2015)
 

由上表可知,Bowtie(目前有Bowtie2)、BWA和SOAP(目前有SOAP2)都是整體性能很好的短序列匹配軟件。圖片

那麼基因組變異的檢測軟件哪些呢?基於測序數據的變異檢測軟件也很是多,下圖列舉了一些典型的軟件。具體以下所示:ip


經常使用的基因組變異檢測軟件(Li et al. Cancer Informatics, 2015)
 

因爲GATK擁有很是好的綜合性能,目前GATK是已成爲最流行的SNV/SNP檢測軟件。ci

 

GATK的具體算法原理可參考原文章:

McKenna et al. The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing dataGenome Research, 2010

而GATK軟件的具體使用可參考官網:

https://software.broadinstitute.org/gatk/best-practices/

 

(更多精彩,可見大型免費綜合生物信息學資源和工具平臺AIPuFu:www.aipufu.com,關注微信公衆號:AIPuFuBio)

 

但願今天的內容對你們有用,會持續更新經典內容,歡迎留言~~

相關文章
相關標籤/搜索