生物醫學中常見的問題: python
how we know the tissue specific cell type?機器學習
how we know the exactly cell type from a bunch of bulk data?性能
basic analysis flow:學習
the basic principle:測試
the specific steps:spa
some key words:3d
NGS Next-generation sequencingblog
二代測序
NMF Non-negative matrix factorizationip
非負矩陣因子分解ci
NNML Non-negative maximum likelihood
非負矩陣因子類似性
RMSE Root-mean-square error
標準誤
ES Enrichment score
富集分數
GSEA Gene set enrichment analysis
基因集的富集分析
ssGSEA Single-sample gene set enrichment analysis
單樣本的基因集的富集分析
SVR Support vector regression
支持向量迴歸
LDA Latent Dirichlet allocation
中文叫作文檔主題生成模型,主要在機器學習中用來生成和分析大規模文檔集(document collection)或語料庫(corpus)中潛藏的主題信息。
一篇review中所涉及的在生物信息領域分類或者預測細胞亞型的軟件和代碼,分析方法;
The Prediction of MCP counter method:
咱們能夠看出顏色爲多的就是預測準確的比例,大部分的celltype都有比較完整色域,可推測比較準確的預測性能;
可是還需更多的測試,由於不少軟件都是由於細胞類型或者是marker基因matrix過少而顯得比較有侷限性。
總結:掌握好deconvolution的機器學習底層方法和原理,及其在不一樣狀況下的使用策略。
只有好好的理解了才能更好的用這些tools來分析本身的數據,同時找準一個媒介來實現它(no matter R or python)