RVAS(rare variant association study)知識

多基因罕見疾病常用到RVAS(rare variant association study),這裏對學習的內容做一個整理。不斷補充。

RVAS是個什麼鬼?居然將替代GWAS

摘自周在威老師的微信公衆號 基因檢測與解讀
1,GWAS方法通過基因芯片技術系統地評估常見遺傳變異(通常是SNP,在人羣中的頻率MAF大於5%)對疾病的影響,到目前爲止,已經有2000多個SNP發現與疾病相關。
2,只能解釋小部分的遺傳因素。
3,總體來說GWAS發現的這些位點對複雜疾病只有中等程度的影響,要想將這些GWAS發現轉化爲疾病功能解釋或臨牀應用還有很長的路要走,簡單來說就是這些位點與疾病只有關聯性,沒有因果關係,要想通過關聯關係推導至因果關係還很難。
4,分析低頻位點(0.5%<MAF<5%)與罕見位點(MAF<0.5%)也許能夠解釋更多的遺傳因素。
5,從進化角度來說這些罕見位點導致的遺傳病將會被篩選掉,但是最近有一些研究已經發現低頻位點與罕見位點在常見疾病發病過程中發揮重要作用。

常見疾病罕見位點關聯分析的實驗平臺有哪些?

摘自微信公衆號 基因檢測與解讀
常見疾病罕見位點關聯分析(RVAS)是指針對常見疾病如先天性心臟病、高血壓、糖尿病、腫瘤等(而非單基因遺傳病),尋找罕見的遺傳基因位點與疾病的相關性,這些罕見的基因位點一般是在基因的編碼區或啓動子區,具有一定的生物學意義,如錯義突變、無義突變、stop loss突變、插入或缺失引起的移碼突變及啓動子區調節轉錄的變異,與之相對的GWAS位點沒有以上限制,還有一個重要的區別是RVAS是基於功能單元(目前主要是基因,以後有可能是小的信號通路)分析一組位點與疾病的關聯,而GWAS是基於單個位點評估關聯性。
1,高深度WGS
30X以上
2,低深度WGS
4-6X,其中千人基因組計劃就是用低深度的WGS,缺點是很難準確地檢測每個個體的基因型,但是對於一次幾千樣本分析,這個小缺點是可以接受的,如果只是幾百個樣本不建議使用該方法。
3,WES
4,Panel
靶向測序(Panel),因爲之前通過GWAS已經發現了一些具有顯著性差異的位點,那麼在這些位點附近靶向捕獲測序進行罕見位點關聯分析不失爲一種高性價比的方法。缺點是隻能對已知的位點區域進行分析,很可能得到完全陰性的結果。
5,gene chip
雖然說目前主流的基因芯片是針對多態性SNP進行檢測,但是最近Illumina 和Affymetrix都推出了外顯子芯片,該芯片的位點設計基於12000個人的全外顯子測序(主要是歐洲人,對於亞洲不太適用),包括約25萬個非同義突變、1萬2千個剪切位點突變及7000個改變終止密碼子突變。與WES相比,基因芯片只能檢測已知的罕見突變,據估計每個人都會有100個以內的的新突變,所以基因芯片會漏掉一些突變。芯片優勢就是便宜。

正常對照可以使用千人基因組數據中亞洲人公開的全外顯子數據,您只需要測患者就可以了。

RVAS的分析流程與軟件介紹

摘自微信公衆號 基因檢測與解讀

Created with Raphaël 2.2.0 分析規劃與平臺 (需要對樣本選擇與數量、實驗平臺、測序質量、統計算法、結果優先選擇及樣本重複有詳細的考慮) 突變檢測與質量控制 (有很多指標可以評估突變的質量,包括測序深度、轉換/顛換比率、新的變異的數量、雜合/純合比例、變異的quality、比對quality、鏈偏倚(strand bias)) 生物信息學功能預測 (結果可能是有害或無害,在RVAS分析中可以整合這些信息) 實驗重複 (找到關聯的基因後,後續的實驗重複需要看關聯的顯著性,發現的基因與表型存在已知的顯著相關,可以不用重複。)

算法及軟件:
在這裏插入圖片描述