全基因組關聯分析除了找到顯著的關聯位點,咱們還能夠作基因優化、geneset富集分析、組織富集分析,下面具體講一講怎麼利用GWAS的summary數據作這個分析。java
summary數據就是關聯分析的結果文件python
怎麼肯定系統有沒有安裝PIP呢,輸入命令which pip
,若是沒有路徑彈出,說明沒有PIP,須要安裝windows
pip install intervaltree
python2.7
或者測試
conda install -c conda-forge intervaltree
優化
pip install pandas
unix
wget http://www.broadinstitute.org/mpg/depict/depict_download/bundles/DEPICT_v1_rel194.tar.gz
code
tar -zxvf DEPICT_v1_rel194.tar.gz
blog
cd DEPICT
ip
./src/python/depict.py ./example/ldl_teslovich_nature2010.cfg
若是這一步沒有報錯,說明環境配置沒有問題,能夠開始分析本身的數據啦
拷貝yourtrait.cfg文件
cp ldl_teslovich_nature2010.cfg yourtrait.cfg
編輯yourtrait.cfg文件
vi yourtrait.cfg
vi進去後,yourtrait.cfg文件有幾處須要修改
gwas_summary_statistics_file: /your/path/to/summary/file/yourtrait.glm.linear
label_for_output_files: yourtrait
pvalue_col_name: P
chr_col_name: Chr
pos_col_name: Pos
plink_executable: /your/path/to/plink/plink
genotype_data_plink_prefix: /your/path/to/genotype/yourtrait_genotype
修改好以上數據後,保存退出文件:wq
./src/python/depict.py yourtrait.cfg
生成的文件分別爲loci.txt,geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt,其中,geneprioritization.txt, genesetenrichment.txt , tissueenrichment.txt即爲咱們感興趣的基因優化,geneset富集分析,組織富集分析
Rscript ./DEPICT/src/python/tissue_plot.R ./DEPICT/example/ldl_teslovich_nature2010_tissueenrichment.txt ldl_teslovich