單核苷酸多態性,英文single nucleotide polymorphism,縮寫爲SNP,讀音爲Snip。SNP主要是指在基因組水平上引發的單個鹼基的變異,其在羣體中的發生頻率不小於1%,包括單鹼基的轉換、顛換以及單鹼基的插入和缺失等。算法
突變(mutation)和多態性(polymorphism)的主要區別在於:微信
1)突變在羣體中的發生頻率小於1%,而多態性的發生頻率在大於1%;ide
2)突變一般對生生物體是有害的,而多態性一般都是無害的。工具
那麼基於基因組測序數據,包括全基因組測(WGS)、全外顯子測序(WES)或靶向測序(targeted sequencing),鑑定基因組變異的標準流程是什麼樣的呢?(更多精彩請關注微信公衆號:AIPuFuBio)性能
具體以下圖所示:orm
因此基於測序數據進行基因組變異檢測的第一步就是數據匹配,即把測序數據匹配到參考基因組上。匹配測序數據的軟件很是多,下圖列舉了一些典型的匹配軟件。具體以下所示:blog
由上表可知,Bowtie(目前有Bowtie2)、BWA和SOAP(目前有SOAP2)都是整體性能很好的短序列匹配軟件。圖片
那麼基因組變異的檢測軟件哪些呢?基於測序數據的變異檢測軟件也很是多,下圖列舉了一些典型的軟件。具體以下所示:ip
因爲GATK擁有很是好的綜合性能,目前GATK是已成爲最流行的SNV/SNP檢測軟件。ci
GATK的具體算法原理可參考原文章:
McKenna et al. The Genome Analysis Toolkit: A MapReduce framework for analyzing next-generation DNA sequencing data, Genome Research, 2010
而GATK軟件的具體使用可參考官網:
https://software.broadinstitute.org/gatk/best-practices/
(更多精彩,可見大型免費綜合生物信息學資源和工具平臺AIPuFu:www.aipufu.com,關注微信公衆號:AIPuFuBio)
但願今天的內容對你們有用,會持續更新經典內容,歡迎留言~~