查詢、下載GWAS目錄數據的R包(gwasrapidd)

目前GWAS方向發了不少文獻,可是並無一個很完善的R包對這些文獻的數據進行彙總。html

接下來推薦的這個是最新發表的GWAS數據彙總R包​。看了一下功能齊全,可是數據不是收錄的很齊全​。
下面具體講一下。​git

在R上安裝

install.packages("remotes")github

remotes::install_github("ramiromagno/gwasrapidd")api

查詢是否有發表關於自身免疫性疾病的文章

library(gwasrapidd)測試

my_studies <- get_studies(efo_trait = 'autoimmune disease')code

查詢發表自身免疫性疾病文章的數量

n(my_studies)htm

獲取發表自身免疫性疾病的文章ID

my_studies@studies$study_idblog

查詢發表自身免疫性疾病的文章標題

my_studies@publications$title
mgHYEd.pngci

查看發表自身免疫性疾病文章在pubmed的界面信息

open_in_pubmed(my_studies@publications$pubmed_id)開發

獲取發表身高文獻的SNP關聯信息

my_associations <- get_associations(study_id = my_studies@studies$study_id)

查詢P值小於1e-6的位點

dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # Filter by p-value
tidyr::drop_na(pvalue) %>%
dplyr::pull(association_id) -> association_ids # Extract column association_id

提取顯著信號位點信息

my_associations2 <- my_associations[association_ids]

顯示顯著信號位點的個數

n(my_associations2)

顯示顯著信號位點的RS ID, risk allele, 頻率

my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')] %>%

print(n = Inf)

獲取含有rs12752552位點的文獻

s2 <- get_studies(variant_id = 'rs12752552')

測試了一下,優勢是減去了不少信息檢索的工做,缺點是這個包剛開發不久,信息還不夠齊全

更多詳細信息請看gwasrapidd

參考文獻:Magno R, Maia A T. gwasrapidd: an R package to query, download and wrangle GWAS Catalog data[J]. bioRxiv, 2019: 643940.

相關文章
相關標籤/搜索