不少人問我有沒有關於全基因組關聯分析(GWAS)原理的書籍或者文章推薦。html
其實我我的以爲,作這個分析,先從跑流程開始,再去看原理。linux
爲何這麼說呢,由於對於初學者來講,跑流程就像一個大黑洞,學習原理就像一個小黑洞。git
不少人花了好幾個月的時間在看原理,一旦丟給他數據去分析,依舊一籌莫展。github
不會跑流程,心裏依舊會很恐慌。就像歷來沒有入門同樣。編程
因此,個人建議是我們先不去管原理,直接從分析入手。api
等把數據跑出來了,整個流程的技能點滿了,再去看看它的原理。antd
對於沒有編程基礎的人來講,建議先從一個在線的網站走一遍GWAS流程。jsp
這樣就能知道完成GWAS須要多少個步驟,內心大概有個底。ide
easygwas網站提供了公共數據,能夠直接開始分析GWAS。整個流程按照網站提示,很簡單。工具
因爲咱們最終仍是須要拿着本身的數據完成GWAS分析,沒必要避免的須要必定的編程基礎。
在線網站只是一個提供理解GWAS流程的網站,所以,咱們仍是須要在linux系統下拿一些數據練練手。學會最基本的命令行。
在這裏,我推薦一個提供linux下學習GWAS的教程:GWA_tutorial.
網址:https://github.com/MareesAT/GWA_tutorial/
網站分爲四個教程:1)GWAS的數據QC; 2)處理羣體分層; 3)關聯分析(GWAS); 4)多基因風險得分分析(Polygenic risk score analyses)
示例數據都有了,就等你本身上手了。
我敢保證,當你能完整的跑完這個流程的時候,你對GWAS的理解少說也有70% ,下一個在羣裏幫我解答問題的大神就是你了(申請進羣方式見公衆號菜單欄)。
有些人對R語言可能比較熟悉,這裏提供了一個用R語言分析GWAS的流程。
該流程有:GWAS的QC,PCA分析,Manhattan圖,QQ圖,候選位點的功能分析
感興趣的看這個:Genome-wide association studies in R
網址:https://www.r-bloggers.com/genome-wide-association-studies-in-r/
0 原理
1 分析流程
2 數據處理
2.1 數據質量過濾
GWAS基因芯片數據預處理:質量控制(quality control)
2.2 正負鏈翻轉(stand flip)
2.3 基因型數據填補(imputation)
soga,網頁版的基因型填充能夠這麼作(genotype imputation)
2.4 羣體分層校訂
GWAS羣體分層 (Population stratification):利用plink對基因型進行PCA
3 關聯分析
GWAS: 曼哈頓圖,QQ plot 圖,膨脹係數( manhattan、Genomic Inflation Factor)
4 meta分析
只用一行命令,就能夠學會全基因組關聯分析(GWAS)的meta分析
5 條件分析
GWAS條件分析(conditional analysis):做用,步驟,結果解讀
6 基因多效性
7 GWAS後續分析
GWAS:拒絕假陽性之case和control數量比例嚴重失衡的解決方案(SAIGE模型的應用)
利用GCTA工具計算複雜性狀/特徵(Complex Trait)的遺傳相關性(genetic correlation)
GWAS系列分析:多基因風險評分(Polygenic Risk Score)的計算
DEPICT實現基因優化、gene set富集分析、組織富集分析(tissue enrichment)
8 相關文獻閱讀
什麼!GWAS研究中case和control的比例是有講究的?
GWAS文獻解讀:The stability of educational achievement
GWAS其餘教程:
www.transplantdb.eu/sites/transplantdb.eu/files/HandsOnTutorialtoGWAS_Seren-030715.pdf
https://doc.goldenhelix.com/SVS/tutorials/snp_gwas/index.html
ccbb.jnu.ac.in/IUBDDJan2015/workshop_files/GWAS Tutorial.pdf
https://www.r-project.org/conferences/useR-2009/slides/Zhao+Tan.pdf
users.du.se/~lrn/NOVAComputerExercises/NOVA_GenABEL_tutorial.pdf
gsea4gwas-v2.psych.ac.cn/docs/tutorial.jsp
www.montefiore.ulg.ac.be/~kvansteen/GeneticEpi-UA2/Class5/Introduction to GenABEL.pdf
看看文獻,加深對GWAS的理解:
A tutorial on conducting genome‐wide association studies: Quality control and statistical analysis