使用GCTA的GREML評估SNP遺傳力

歡迎關注」生信修煉手冊」!web

評估SNP遺傳力有兩種方法LDSC和GREML, 本文介紹下GREML評估遺傳力的方法。在GCTA軟件中,其核心就是以下所示的線性混合模型算法

其中y表示表型,b表示固定效應協變量的係數,u表示隨機效應自變量的係數, 這裏的隨機效應指的就是全部SNP位點對錶型的效應,e表示隨機偏差。其中ue服從以下所示的正態分佈數據庫


表型方差能夠用以下公式表示瀏覽器

在GCTA中,W的計算公式以下微信

在以前的文章中,咱們介紹了GCTA對於樣本遺傳類似度的定義,公式以下網絡

能夠推導出以下關係app

定義全部SNP位點的方差以下less

則表型變異V的公式變換以下編輯器


定義SNP遺傳力的計算公式以下工具

此時只須要經過REML算法對線性混合模型的參數進行估計,而後求解上述方差,便可計算出了SNP遺傳力了。軟件實際操做的代碼以下

首先構建GRM矩陣,下游分析都是須要輸入GRM矩陣的,在實際分析中,還能夠根據遺傳類似度進行過濾,去除親緣關係較近的樣本,上述代碼爲了方便演示,沒有作過濾。

在進行REML分析時,有兩種選擇,第一種是默認用法,沒有協變量的校訂,第二種添加了協變量的校訂,注意這裏的協變量都是屬於固定效應協變量,協變量能夠是離散型,也能夠是連續型。

上述代碼中使用了兩個協變量,第一個爲covar參數指定的離散型協變量,第二個爲qcovar參數指定的連續型協變量,樣本的PCA分析的前10主成分做爲協變量,即便用羣體分層這個因素做爲協變量。

輸出結果後綴爲hsq, 內容示意以下

Variance表示方差,SE表示標準誤,其中V(G)/Vp即爲SNP遺傳力,下面幾行爲LRT檢驗,即似然比檢驗的結果,其中LRT = 2(logL - logL0), df表示自由度,Pval表示檢驗的p值,n表示樣本個數。

·end·

—若是喜歡,快分享給你的朋友們吧—



往期精彩

  GWAS meta分析



   基因型填充



  CNV分析



  TCGA



  生存分析



  腫瘤數據庫



  腫瘤免疫和新抗原



  Hi-C數據分析



  chip_seq數據分析


  motif



  chip_seq數據庫


  18年文章目錄


掃描下方二維碼,關注咱們,解鎖更多精彩內容!


生物信息入門

只差這一個

公衆號



本文分享自微信公衆號 - 生信修煉手冊(shengxinxiulian)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索