variant和gene expression是生物信息中兩個很是重要的核心站點(根據中心法則,還有表觀、3D genome、isoform、蛋白),這也是兩個最能被準確測量的維度,在Post-GWAS,它們兩的關係是咱們研究的重點。html
顯然variant主要分爲兩類:express
這兩大類的分析方法大相徑庭,coding主要直接影響了mRNA和蛋白;而noncoding,咱們主要認知都是在調控上。orm
先看看文獻(搜 coding variant and gene expression ):htm
The Post-GWAS Era: From Association to Functionci
Modified penetrance of coding variants by cis-regulatory variation contributes to disease riskget
The influence of genetic variation on gene expressionit
The impact of rare variation on gene expression across tissuesio
這篇能夠重點看,2014年的,才發現本身如今作的別人早就作過相似的了。function
Analysis of Stop-Gain and Frameshift Variants in Human Innate Immunity Genes form
如何給coding mutation打分,評估其對疾病以及severity的影響。
如何找到衆多基因中的core gene set?
當心假設,大膽求證。
這和經典名言剛好相反,由於我以爲這世界能夠的假設太多了,彷佛均可以,但其實大部分的都是錯誤的。
當心假設,意味着咱們只基於最可靠的事實來做出假設,基於不可靠事實的假設是無心義的,也就不存在任何求證的方法。
大膽求證,就是收集各類數據,全方位的來論證,數據會有偏,但數據不會說謊。
這些coding mutations是很是靠譜的,咱們的pre-ENCC的DEG也是比較靠譜的,咱們的大廈的根基就是這兩個站點。
有了這兩個站點,如何把它們聯繫到一塊兒呢? 這中間的可能性有無數種。
coding mutation各式各樣,在network中的地位和重要性也不同,對基因表達的影響也不同,想用單一的規則把variant和gene expression聯繫到一塊兒彷佛是不可能的。
立刻深刻探索~