計算基因組學工具解析腫瘤與免疫細胞的互做--轉載

Hackl, H., Charoentong, P., Finotello, F., & Trajanoski, Z. (2016). Computational genomics tools for dissecting tumour-immune cell interactions. Nature Reviews Genetics, 17(8), 441.

 

摘要:算法

癌症免疫療法方面的突破和高通量技術成本的下降,引起了使用基因組工具對腫瘤免疫細胞相互做用的深刻研究。 數據的豐富性和複雜性帶來了至關大的挑戰,須要計算工具來處理、分析和實現可視化。 近年來,研究人員已經開發各類用於挖掘腫瘤免疫和基因組數據的工具並提供新穎的機制解讀。本文咱們將綜述用於癌症免疫研究的各種計算基因組學工具,並提供有關要求和功能的信息。數據庫

關鍵詞:網絡

正文:工具

癌症免疫療法基於誘導或加強對癌症的免疫應答的藥劑。 目前,除了靶向癌細胞的單克隆抗體外,單一療法還基於三種策略:使用檢查點阻斷劑,接種新抗原和過繼性T細胞轉移。 另外,免疫單一療法的組合以及免疫療法和靶向療法的組合也正在研究中。雲計算

癌症免疫療法有可能適應腫瘤的變化,由於免疫系統能促進特定的T細胞的產生,識別腫瘤表面發生改變的抗原從而殺死腫瘤細胞。然而,腫瘤細胞能夠經過上調免疫細胞表面的免疫檢查點分子,如細胞毒性T淋巴細胞相關蛋白4(CTLA4)或程序性細胞死亡分子1(PD1)來逃避免疫系統的檢測。最近,已經引入了幾種阻斷免疫檢查點並由此加強抗腫瘤T細胞應答的抗體,並顯示出顯著的臨牀效果。接受CTLA4靶向抗體治療的黑色素瘤患者,3年後存活曲線達到平臺期,代表這種方法持久的益處甚至治癒潛力。此外,PD1靶向抗體的功效不只在黑色素瘤中顯示,並且在九種不一樣的腫瘤類型中也顯示出來,如非小細胞肺癌,肝癌,腎癌和淋巴癌7。咱們目前正在目擊檢查點阻滯劑的快速發展,從150多項臨牀試驗中能夠看出,它們被用在單一療法或聯合治療中7。然而,只有一小部分患者對檢查點阻滯劑的單一療法有反應,所以肯定精確的做用模式和預測標誌物是須要深刻研究的主題。spa

繼第一批癌症免疫療法 - 即單克隆抗體的使用,以及檢查點阻斷劑免疫療法的開發,和其餘免疫治療策略,包括治療性疫苗工程化T細胞,使得腫瘤 - 免疫細胞相互做用成爲焦點。解析這些複雜的相互做用,有望鑑定預測性生物標誌物,發展新葯或新的治療手段,而且促進機制研究。然而,因爲這兩種多細胞生態系統的演變和異質性,使得腫瘤-免疫細胞相互做用的研究具備至關大的挑戰:癌症的發展,能夠看做是一種進化過程;免疫系統,包含許多先天和適應性免疫細胞亞羣,其中一些表現出表型可塑性並具備記憶。NGS技術和其餘中高通量技術正在產生大量數據,須要信息系統來處理和分析數據,提取信息以開發機制理論並支持臨牀決策。所以,癌症免疫基因組學也能夠被視爲信息科學,並將爲新型免疫治療策略的開發和成功應用鋪平道路。設計

在本綜述中,咱們首先簡要介紹腫瘤-免疫細胞的相互做用,而後討論用於挖掘癌症基因組數據和提取免疫參數的計算基因組學工具。 咱們專一於對NGS數據的更高級別分析,包括腫瘤浸潤淋巴細胞(TILs)的定量,腫瘤抗原的鑑定和T細胞受體(TCRs)的分析,並提供有關需求和功能的信息以幫助選擇工具和分析管道的組裝。 雖然這裏的重點是癌症免疫學,但所討論的計算方法也爲研究其餘疾病提供了手段,如自身免疫,炎症,感染或移植物抗宿主疾病。orm

 
腫瘤免疫治療和精準腫瘤學

腫瘤-免疫細胞互做排序

癌症免疫循環包括幾個連續步驟:癌細胞產生的新抗原在癌細胞死亡後釋放並被樹突細胞捕獲。 接下來,樹突細胞將主要組織相容性複合物(MHC)分子上捕獲的抗原呈遞給T細胞,致使針對癌症特異性抗原的效應T細胞應答的引起和活化。 在趨化因子梯度的指導下,活化的T細胞進入並滲入腫瘤部位。 T細胞經過T細胞受體(TCR)和新抗原-MHC複合物之間的相互做用特異性識別並結合癌細胞並殺死癌細胞(細胞溶解活性)。 各類分子和基因組學工具可用於評估這些癌症免疫細胞相互做用的每一個階段及其刺激或抑制因子。資源

 

 
腫瘤免疫週期和免疫背景

組學數據分析概述

NGS技術在基因組,轉錄組或表觀基因組分析中的應用是腫瘤免疫基因組學數據的主要來源。此外,最近在圖像技術和相關軟件工具以及細胞表型分析技術方面取得了進展,能夠生成與基因組類型相輔相成的數據類型。對於腫瘤免疫基因組學中大多數問題,能夠應用與癌症基因組學中相同的NGS技術,它們包括全外顯子組測序(WES),全基因組測序(WGS),RNA-seq,用於DNA甲基化分析的亞硫酸氫鹽測序和單細胞測序。 然而,對於特定應用,例如TCR測序,須要仔細考慮讀取長度,測序數據(WES,WGS或RNA-seq)的深度和類型。

在癌症免疫學的背景下對組學數據的分析能夠被視爲兩步程序(圖2)。在對原始數據進行預處理以後,第一步是組學數據分析,主要關注腫瘤自己。該步驟包括用於鑑定SNP,小的插入和缺失,拷貝數變異(CNV),結構變異,基因融合以及變體註釋的工具。基因組分析組中的另外一組工具用於分析使用RNA-seq評估的基因的表達,從WES和/或SNP陣列數據估計腫瘤異質性或分析DNA甲基化模式。第二類分析使用免疫基因工具,更關注腫瘤-免疫細胞相互做用。做爲輸入數據,它們使用基因組分析和/或原始測序數據的輸出。這些免疫基因組學分析的結果提供了有關腫瘤微環境的兩個關鍵特徵的信息:浸潤的免疫細胞的組成和功能定向以及腫瘤抗原的來源和數量。

 
用於基因組學和免疫基因組學分析的計算工具

使用基因組數據肯定腫瘤浸潤的細胞組成

因爲不一樣類型的TIL對腫瘤進展有不一樣的影響,肯定腫瘤中免疫浸潤的細胞組成不只提供了預後信息,並且還能夠促進標誌物預測和新治療策略的發展。成像和細胞表型技術被普遍使用,能夠提供有關免疫結構的部分信息,但細胞表型分析技術的固有侷限性阻礙了大量TIL亞羣的特徵化。所以,研究人員開發了計算基因組工具以提供TIL的全面圖像。應用於此目的的計算基因組學工具能夠分組爲基因集富集分析(GSEA)和去卷積方法(圖3a)。值得注意的是,GSEA和反捲積方法都依賴於個體細胞羣的表達譜矩陣。用這些方法重建的TIL亞羣包括在表達譜的參考矩陣中定義的免疫亞羣。

富集方法依賴於基因集分析技術,基於樣本之間的比較或單樣本方法。 GSEA評估排序基因列表,用於統計富集參與某種途徑和細胞過程的基因。在比較方法中,基於兩種生物狀態之間的差別表達對基因進行排序。或者,可使用單樣本GSEA(ssGSEA)富集評分,表示特定基因組中的哪些基因在單個樣品中上調或下調了。 GSEA可用於解釋從微陣列或RNA-seq得到的基因表達數據。

GSEA的優點在於它可使用現有工具輕鬆應用,與傳統的基因表達分析相比,沒有額外的樣本量要求。GSEA的必要要求是與特定免疫亞羣相關的基因標記的組裝(圖3b)。在一項開創性研究中,從免疫和非免疫細胞的全血微陣列表達數據中定義了一組免疫特徵基因34。最近,來自人免疫學項目的免疫學特徵的基因集合(ImmuneSigDB)35被收錄到分子特徵數據庫(MSigDB)36中。經過分析389項關於小鼠和人體免疫系統中細胞狀態和擾動的已發表研究,產生了約5,000個註釋良好的基因的補充35。

解卷積方法使用表達特徵矩陣歷來自細胞混合物的表達數據推斷特定細胞比例(圖3c)。基於該算法,開發了一種使用二次規劃進行異質組織去卷積的R包.37。這個名爲DeconRNASeq的軟件包能夠處理RNA-seq數據,但它僅在少數細胞類型的混合物上獲得驗證。已經開發了幾種其餘方法,其使用各類技術來解決病態反問題(表1)。最近,一種用於從大塊腫瘤的微陣列數據推斷白細胞亞型的計算方法(稱爲CIBERSORT)被引入38。 CIBERSORT使用22個白細胞亞羣的信號表達矩陣並實現線性支持向量迴歸38。儘管計算方法有各類成功的應用,但仍有幾個問題須要改進30。首先,須要具備基因表達譜的參考矩陣,所述基因表達譜來自血液樣品或優選來自使用RNA-seq的腫瘤樣品的分選的免疫細胞亞羣。其次,因爲解卷積對噪聲敏感,所以必須開發和實現魯棒算法。第三,須要使用獨立方法驗證方法,例如熒光激活細胞分選(FACS)或免疫組織化學。

與基於基因表達譜的去卷積方法同樣,細胞譜系特異性DNA甲基化模式可用於檢測和量化白細胞亞羣39。爲此目的,使用微陣列平臺(即,Illumina Infinium 27k和450k DNA甲基化陣列),使用來自少數甲基化CpG基因座的信息到全基因組基因座開發了許多方法和工具39-41。將這種方法應用於亞硫酸氫鹽測序技術的數據很是簡單。從表觀基因組關聯研究中能夠明顯看出,表觀基因組在不一樣細胞類型中的變異很大42。

 
 

 

 
 

腫瘤抗原的鑑定

T細胞可以識別與腫瘤細胞的MHC分子結合的腫瘤特異性抗原而排斥腫瘤。具備高腫瘤特異性的抗原 - 即由腫瘤細胞展現而不是由正常細胞展現 - 具備引起腫瘤特異性免疫應答的潛力,從而將不良反作用的風險降至最低,所以對於諸如工程化T細胞和治療性疫苗的癌症免疫療法具備重要意義。

三類抗原具備高腫瘤特異性:首先是病毒抗原,其源自在病毒感染的腫瘤細胞中表達的病毒基因;第二種是癌症種系抗原(CGAs),是一般僅由滋養細胞和種系細胞表達但在腫瘤細胞中具備異常表達的蛋白質;第三種是新抗原,它們是由體細胞突變基因的表達產生的肽鏈。自從發現第一個CGA,黑色素瘤抗原1(MAGE1;也稱爲MAGEA1)被鑑定以來,已經在幾種腫瘤類型中鑑定到表達的大量癌症種系基因。迄今爲止,Cancer-Testis數據庫包含了有關CGA,和其在腫瘤和正常組織中的表達以及誘導的免疫應答的信息。利用可用的CGA列表,可直接在腫瘤和正常樣品的RNA-seq數據中提取它們的表達水平。

新抗原可被認爲具備嚴格的腫瘤特異性,由於它們源於惡性細胞中的突變基因的表達,但不存在於正常基因組中。爲了引起免疫應答,必須將突變的蛋白質蛋白水解加工成短肽,而後與MHC分子結合,以呈遞給T細胞(圖4)。當從匹配的腫瘤和正常樣品中得到NGS數據時,能夠經過整合三個計算任務來計算新抗原(圖4):從匹配的腫瘤-正常樣品中鑑定突變蛋白,而後進行HLA分型和而後預測新抗原-MHC的結合親和力。

 

 
腫瘤新抗原的鑑定

組裝分析管道

在組裝癌症免疫基因組學的計算流程時,必須特別注意評估數據是否容許提取無偏見和有意義的信息。例如,閱讀長度和覆蓋深度對來自測序數據的免疫庫和HLA等位基因的分析具備強烈影響。此外,還必須考慮用於生成數據的測序平臺,以肯定所選工具是否可以區分平臺特異性測序錯誤與真實變體。另外一個須要考慮的問題是批次效應,它是由不一樣實驗條件引發的變異的技術來源。 可使用降維工具(例如主成分分析)識別這些假象,並隨後使用替代變量分析進行校訂。

直到最近,才報道了整合多個分析步驟的新抗原預測的計算解決方案(表1)。除NetTepi90外,目前還有其餘解決方案,例如:NetCTLpan110,這是一種用於預測蛋白質分裂,TAP轉運和pMHC結合的泛特異性方法; EpiToolkit111,是一個基於Web的平臺,用於靈活整合預先選擇的計算模塊,用於表位預測和優先級排序; FRED 2(REF.112),它是HLA分型,表位預測和選擇的網絡資源,也容許定製管道的原型設計;和pVAC-Seq113,它是一種新的抗原鑑定管道,能夠考慮突變覆蓋率,變異等位基因頻率和突變基因的表達。隨着雲計算解決方案可用性的增長,咱們預計在不久的未來,將開發利用這種計算基礎設施的癌症免疫基因組學分析管道。

 

 
腫瘤免疫的計算工具
 
做者:酷睿_1991 連接:https://www.jianshu.com/p/04428f4f0c30 來源:簡書 簡書著做權歸做者全部,任何形式的轉載都請聯繫做者得到受權並註明出處。
相關文章
相關標籤/搜索