關於數據挖掘發表文章,咱們知道不少人是看不上、瞧不起、嗤之以鼻的。大抵是由於這些人平時只發 CNS 主刊,因此才認爲經過數據挖掘這種用「別人的數據」或者叫「幹實驗」來發文章是「「垃圾」,沒有什麼價值。數據庫
真的是這樣嗎?今天咱們要介紹的就是一篇作數據挖掘的 Cancer Cell 雜誌的文章(IF: 27.4),你們來看看文章怎麼樣。express
A Comprehensive Pan-Cancer Molecular Study of Gynecologic and Breast Cancers. Cancer Cell. 2018 Apr 1. pii: S1535-6108(18)30119-3.dom
1ui
文章數據挖掘的狀況3d
腫瘤類型:婦科腫瘤和乳腺癌;blog
數據來源:主要是 TCGA 數據庫,1,087 例 BRCA(invasive breast carcinoma,乳腺癌), 308 例 CESC (cervical squamous cell carcinoma and endocervical adenocarcinoma, 宮頸癌 ), 579 例 OV(high-grade serous ovarian cystadenocarcinoma,卵巢癌),548 例 UCEC(uterine corpus endometrial carcinoma,子宮內膜子宮內膜癌)和 57 例 UCS(uterine carcinosarcoma ,子宮癌肉瘤),共 2,579 例,統稱爲 「Pan-Gyn」 泛婦科腫瘤。ip
數據類型:臨牀信息(clinical),拷貝數變異(somaticci
copy-number alterations SCNAs), 突變(mutations),DNA甲基化(DNA methylation),mRNA,miRNA,lncRNA和蛋白的表達(expression of mRNA, microRNA, long non-coding RNA, and proteins)。get
2it
文章的研究工做
1. 找到了分子特徵(molecular features),用以區分 「Pan-Gyn」 與 TCGA 中其它腫瘤;
23 個基因在 Pan-Gyn 和 Non-Gyn 中的突變和擴增頻率
2. 鑑定到高白細胞浸潤(high leukocyte infiltration)這一免疫應答的腫瘤亞型;
3. 創建了基因和 lncRNA 的相互做用 network(interaction network );
4. 創建了決策樹(Decision tree),將臨牀相關預後的腫瘤亞型進行再分組;
因爲內容比較多,這篇文章咱們就簡單介紹到這裏。
3
趨勢文章
細心的同窗會發現 Pubmed 的趨勢文章(Trending Articles),最近有不少從各個角度分析 TCGA 數據的高分文章。
好比 4 月 5 日 Cell 主刊的六連發:
1. 分析泛腫瘤中加強子(Enhancer)表達:
A Pan-Cancer Analysis of Enhancer Expression in Nearly 9000 Patient Samples.Cell. 2018 Apr 5;173(2):386-399.e12.
2. 分析腫瘤驅動(Driver )基因和突變:
Comprehensive Characterization of Cancer Driver Genes and Mutations.Cell.2018 Apr 5;173(2):371-385.e18.
3. 分析腫瘤信號通路:
Oncogenic Signaling Pathways in The Cancer Genome Atlas.Cell. 2018 Apr 5;173(2):321-337.e10.
4. 分析患者生存預後結果的
An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics.Cell. 2018 Apr 5;173(2):400-416.e11.
5. 分析腫瘤發病生殖系變異(Pathogenic Germline Variants):
Pathogenic Germline Variants in 10,389 Adult Cancers.Cell. 2018 Apr 5;173(2):355-370.e14.
6. 分析細胞來源用於腫瘤分類:
Cell-of-Origin Patterns Dominate the Molecular Classification of 10,000 Tumors from 33 Types of Cancer.Cell. 2018 Apr 5;173(2):291-304.e6.
又好比 4 月 3 日 Cell Reports 的五連發:
1. 從DNA損傷修復角度分析基因組和分子圖譜:
Genomic and Molecular Landscape of DNA Damage Repair Deficiency across The Cancer Genome Atlas.Cell Rep. 2018 Apr 3;23(1):239-254.e6.
2. 分析腎癌總體分子特性:
The Cancer Genome Atlas Comprehensive Molecular Characterization of Renal Cell Carcinoma.Cell Rep. 2018 Apr 3;23(1):313-326.e5.
3. 分析鱗癌的基因組、通路和免疫特性:
Genomic, Pathway Network, and Immunologic Features Distinguishing Squamous Carcinomas.Cell Rep. 2018 Apr 3;23(1):194-212.e6.
4. 從泛素化通路角度分析:
Integrated Genomic Analysis of the Ubiquitin Pathway across Cancer Types.Cell Rep. 2018 Apr 3;23(1):213-226.e3.
5. 從lncRNA角度分析,並經過實驗驗證:
Pan-Cancer Analysis of lncRNA Regulation Supports Their Targeting of Cancer Genes in Each Tumor Context.Cell Rep. 2018 Apr 3;23(1):297-312.e12.
這是怎麼肥事?
其實,這個是 CELL Press 的 「The Pan-Cancer Atlas」 的主題系列:
整體上包括了 Cell-of-Origin,Oncogenic Processes、Signaling Pathway 和 Resources 四部分,前三部分收錄了 Flagship Paper(旗艦文章)和 Companion Papers。