circRNA 中的ALU 重複元件

circRNA 最初研究的不多,只有很小一部分基因有檢測到circRNA, 當時都認爲是剪切錯誤造成的,對於其功能也沒人去研究;學者對人類的成纖維細胞進行轉錄組測序,構建去核糖體文庫, 同時採用了RNase酶消化線性RNA 和 不消化線性RNA的兩種文庫,同時檢測circRNA , 最終檢測到了25000 多種circRNA ,這些circRNA 來源於exon 區, 叫作 ecircRNA, 保守估計,有14%的基因都產生了circRNA. 利用一樣的方法,在小鼠睾丸組織中,鑑定到了69種和人類的circRNA 高度同源的circRNA。circRNA 的表達量,能夠被siRNA 調控,推測具備競爭性內源RNA的做用,並且經過生物信息學手段發現,這些ecircRNA 大部分都具備 ALU  重複元件,這些都代表circRNA 並非隨機的剪切錯誤產生的,而是固有的一類,種類豐富,結構穩定,序列保守的內源性RNA;工具

真核生物的total RNA 中,非編碼RNA(ncRNA) 佔據了95%的比例,儘管在ncRNA 中,rRNA 和 tRNA 佔據了絕大部分,可是其餘類型的ncRNA , 好比miRNA和 lncRNA , 其研究愈來愈多,愈來愈受到重視,科學家經過RNase R 消化線性RNA, 利用高通量測序來研究circRNA, 主要使用了mapsplice 工具。編碼

爲了研究哺乳動物細胞中的circRNA , 科學家發明了一種 CircleSeq 的文庫構建方法blog

 

 首先去除rRNA, 而後用RNAse R 消化線性RNA, 同時還設立了對照組,就是不消化線性RNA的文庫做爲對照;ci

研究發現 RNase R 處理的文庫,能夠很好的實現circRNA 富集的效果,更加有利於檢測 低風度的circRNA , 富集效果是普通文庫的10倍以上;io

Hiseq 對每一個樣本進行高通量測序,數據量爲300M,使用mapsplice 軟件比對參考基因組, 軟件

對於每一條測序的reads, mapsplice 會一次進行下列 4種比對:map

1) 徹底來自1個exon ,  這樣的reads 直接比對上參考基因組方法

2)跨越了剪切位點,叫作junction reads, 這樣的reads 在剪切位點的兩側,分別可以比對上參考基因組;im

3)反向剪切 backsplice 生成的reads, 一樣是在剪切位點兩側分別比對,可是比對的順序和線性RNA的順序正好相反;數據

4)融合轉錄本的序列,融合位點兩側的序列比對上了不一樣的染色體

參考資料:

http://rnajournal.cshlp.org/content/19/2/141.long#F6

相關文章
相關標籤/搜索