機器學習-Deconvolution在生物信息學中的應用(對血液以及淋巴細胞進行亞羣的預測和分類)

生物醫學中常見的問題: python

how we know the tissue specific cell type?機器學習

how we know the exactly cell type from a bunch of bulk data?性能

basic analysis flow:學習

the basic principle:測試

 

the specific steps:spa

 

some key words:3d

NGS Next-generation sequencingblog

二代測序
NMF Non-negative matrix factorizationip

非負矩陣因子分解ci

NNML Non-negative maximum likelihood 

非負矩陣因子類似性

RMSE Root-mean-square error

標準誤

ES Enrichment score

富集分數
GSEA Gene set enrichment analysis

基因集的富集分析

ssGSEA Single-sample gene set enrichment analysis 

單樣本的基因集的富集分析

SVR Support vector regression

支持向量迴歸

LDA Latent Dirichlet allocation

中文叫作文檔主題生成模型,主要在機器學習中用來生成和分析大規模文檔集(document collection)或語料庫(corpus)中潛藏的主題信息。

 

 

 一篇review中所涉及的在生物信息領域分類或者預測細胞亞型的軟件和代碼,分析方法;

 

The Prediction of MCP counter method: 

咱們能夠看出顏色爲多的就是預測準確的比例,大部分的celltype都有比較完整色域,可推測比較準確的預測性能;

可是還需更多的測試,由於不少軟件都是由於細胞類型或者是marker基因matrix過少而顯得比較有侷限性

總結:掌握好deconvolution的機器學習底層方法和原理,及其在不一樣狀況下的使用策略。

只有好好的理解了才能更好的用這些tools來分析本身的數據,同時找準一個媒介來實現它(no matter R or python) 

相關文章
相關標籤/搜索