長非編碼RNA,英文名爲long noncoding RNAs,縮寫爲lncRNA,是指長度大於200 核苷酸的非編碼RNA。LncRNA因具備很是重要的調控功能,且幾乎參與到了各類生物學過程和通路,與各類疾病的發生發展緊密關聯,從而成爲過去幾年和未來的研究熱點和重點。對於人類基因組來講,產生的lncRNA數量比編碼RNA的數量要多得多,目前除了少數lncRNA的功能比較明確外,大部分lncRNA的功能都還未知。很是值得去深刻研究。數據庫
<更多精彩,可關注微信公衆號:AIPuFuBio,和大型免費綜合生物信息學資源和工具平臺AIPuFu:www.aipufu.com>微信
根據基因組上的位置關係,lncRNA主要能夠分爲如下三大類(以下圖所示):ide
一、Intronic lncRNA,內含子lncRNA:主要產生於編碼基因的內含子區域;工具
二、Intergenic lncRNA,基因間區的lncRNA,也稱做lincRNA:主要產生於兩個編碼基因的中間區域;ui
三、Antisense lncRNA,反義lncRNA:主要產生於編碼基因的反義鏈;編碼
具體以下圖所示:blog
固然lncRNA根據產生的基因組位置還可進一步細分爲下面的類型:ip
目前已知的lncRNA功能衆多,主要能夠分爲如下幾類(以下圖所示):資源
一、轉錄干擾;get
二、誘導染色質重構和核小體修飾;
三、調控可變剪接模式;
四、產生內源siRNAs;
五、調控蛋白質的活性;
六、結構或組織功能;
七、改變蛋白質的定位;
八、小RNA的前體等。
具體以下圖所示:
至今爲止,已經發現了不少與發育或疾病特別是癌症發生發展緊密相關的lncRNA。下表給出了一些具體示例:
此外,不少研究還發現lncRNA在各種組織中的表達比編碼RNA(mRNA)更具備組織特異性,說明lncRNA與組織的功能特異性密切相關,具體以下圖所示:
那麼具體如何來鑑定和判斷一條RNA是否爲lncRNA呢?
目前,鑑定lncRNA的方法主要能夠分爲如下兩大類:
一、基於RNA-seq測序數據的自動註釋策略;
又可細分爲兩種方法:
i)Genome-guided的方法;
主要是先把RNA-seq數據匹配到參考基因組上,而後進行組裝獲得轉錄本序列(如Cufflinks、Stringtie等軟件),接着再用相應的軟件(如CPAT,CPC等)判斷轉錄本的編碼性與否。主要適用於有參考基因組的物種。
ii) De novo assembly的方法;
先經過從頭組裝/拼接的方法得到轉錄本的序列(如Trinity軟件),而後再用相應的軟件判(如CPAT,CPC等)斷轉錄本的編碼性與否。主要適用於無參考基因組的物種。
二、人工註釋;
人工註釋涉及到利用各類類型的數據來綜合註釋鑑定lncRNA,包括用EST、cDNA等數據來肯定轉錄本的主要結構,並用RNA-seq數據來判斷內含子區域,而後用CAGE tags來肯定轉錄本的5'端,Poly (A)測序來定位轉錄本的3'端。最後再用一些列的數據和方法來肯定RNA的編碼性,如序列進化特徵判斷的PhyloCSF方法、蛋白質譜數據、Ribosome Profiling等。
具體以下圖所示:
如今已經有多個不一樣數據註釋了衆多的lncRNA,但不一樣數據庫註釋的lncRNA完整性和覆蓋度不大同樣,具體以下表所示:
<更多精彩,可關注微信公衆號:AIPuFuBio,和大型免費綜合生物信息學資源和工具平臺AIPuFu:www.aipufu.com>
參考文獻:
一、Rinn et al. Genome Regulation by Long Noncoding RNAs, Annu Rev Biochem, 2013
二、Wilusz et al. Long noncoding RNAs: functional surprises from the RNA world,Genes & Development, 2009
三、Ransohoff et al. The functions and unique features of long intergenic non-coding RNA,NATURE REVIEWS | MOLECULAR CELL BIOLOGY, 2018
四、Uszczynska-Ratajczak et al. Towards a complete map of the human long non-coding RNA transcriptome, Nature Review Genetics, 2018