歡迎關注」生信修煉手冊」!web
評估SNP遺傳力有兩種方法LDSC和GREML, 本文介紹下GREML評估遺傳力的方法。在GCTA軟件中,其核心就是以下所示的線性混合模型算法
其中y
表示表型,b
表示固定效應協變量的係數,u
表示隨機效應自變量的係數, 這裏的隨機效應指的就是全部SNP位點對錶型的效應,e
表示隨機偏差。其中u
和e
服從以下所示的正態分佈數據庫
表型方差能夠用以下公式表示瀏覽器
在GCTA中,W
的計算公式以下微信
在以前的文章中,咱們介紹了GCTA對於樣本遺傳類似度的定義,公式以下網絡
能夠推導出以下關係app
定義全部SNP位點的方差以下less
則表型變異V的公式變換以下編輯器
定義SNP遺傳力的計算公式以下工具
此時只須要經過REML算法對線性混合模型的參數進行估計,而後求解上述方差,便可計算出了SNP遺傳力了。軟件實際操做的代碼以下
首先構建GRM矩陣,下游分析都是須要輸入GRM矩陣的,在實際分析中,還能夠根據遺傳類似度進行過濾,去除親緣關係較近的樣本,上述代碼爲了方便演示,沒有作過濾。
在進行REML分析時,有兩種選擇,第一種是默認用法,沒有協變量的校訂,第二種添加了協變量的校訂,注意這裏的協變量都是屬於固定效應協變量,協變量能夠是離散型,也能夠是連續型。
上述代碼中使用了兩個協變量,第一個爲covar
參數指定的離散型協變量,第二個爲qcovar
參數指定的連續型協變量,樣本的PCA分析的前10主成分做爲協變量,即便用羣體分層這個因素做爲協變量。
輸出結果後綴爲hsq
, 內容示意以下
Variance表示方差,SE表示標準誤,其中V(G)/Vp即爲SNP遺傳力,下面幾行爲LRT檢驗,即似然比檢驗的結果,其中LRT = 2(logL - logL0), df表示自由度,Pval表示檢驗的p值,n表示樣本個數。
·end·
—若是喜歡,快分享給你的朋友們吧—
往期精彩
3DIV:染色質空間互做數據庫
掃描下方二維碼,關注咱們,解鎖更多精彩內容!
生物信息入門
只差這一個
公衆號
本文分享自微信公衆號 - 生信修煉手冊(shengxinxiulian)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。