一行命令學會全基因組關聯分析(GWAS)的meta分析

爲何須要作meta分析

羣體分層是GWAS研究中一個比較常見的假陽性來源.html

也就是說,若是數據存在羣體分層,卻不加以控制,那麼很容易獲得一堆假陽性位點。命令行

當羣體出現分層時,常規手段就是將分層的羣體獨立分析,最後再作meta分析。code

1.如何判斷羣體是否分層

先用plink計算PCA,具體方法詳見連接:GWAS羣體分層 (Population stratification):利用plink對基因型進行PCA

隨後畫出PC1和PC2在不一樣羣體的散點圖,觀察羣體之間是否明顯分開,若是明顯分開,說明羣體分層了,須要獨立作關聯分析,最後再作meta分析

2.如何作meta分析

這裏推薦metal軟件作meta分析,理由是簡單、易上手。htm

2.1 下載metal

進入下載連接blog

metal 提供了三個版本的,分別是Linux,macOS, Windows系統;請自行選擇。three

這裏提供Linux系統的命令:文檔

wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gzget

2.2 解壓metal

解壓用到的命令以下:io

tar -zxvf Linux-metal.tar.gz軟件

2.3 meta分析前的數據準備

假定須要進行meta分析的文檔分別爲DGI_three_regions.txtmagic_SARDINIA.tbl

DGI_three_regions.txt 的內容以下:

VCxxyj.jpg

magic_SARDINIA.tbl 的內容以下:

VCxzOs.jpg

那麼在meta分析前須要準備一個metal.txt文檔,metal.txt文檔的內容以下:

VCzpmn.jpg

解釋一下,這個txt文檔是什麼意思。

這一部分指的是MARKER對應的是DGI_three_regions.txt文檔的SNP列名;

WEIGHT對應的是DGI_three_regions.txt文檔的SNP列名;

其餘的以此類推;

第二個文件的準備方法也是同樣的。

2.4 meta分析

很簡單的一個命令行就搞定了

metal metal.txt

2.5 結果解讀

meta分析後會生成兩個文件,分別是 METAANALYSIS1.TBL 和 METAANALYSIS1.TBL.info

METAANALYSIS1.TBL 是meta分析的結果文檔;

內容以下:

VCz9wq.jpg

P-value 即爲meta後的關聯分析P值;

METAANALYSIS1.TBL.info 是meta分析的說明文檔,好比 Marker 指的是什麼。

其內容以下:

VCzFYT.jpg

相關文章
相關標籤/搜索