一個專門講聚類的網頁課程 - Alexander Strehl 2002-05-03html
值得借鑑的一個工具:SC3: consensus clustering of single-cell RNA-seq data node
1. 如何在一個模型裏整合多種距離度量;算法
2. 方法的數學化;工具
可行性分析htm
假設接口
連續性 - 與clustering的假設正好相反事件
分支事件get
特徵的選擇;距離的度量;數學
限定KNN的必要性;引用
MST構建;
主支的構建和簡化;省略中間點;最短路徑;
迭代處理全部分支;統計
投射全部細胞;使用longest branch
root the tree;
相對主線的深度的拓展
簡化的ggtree;nodes center
下游分析
分支的顯著性排列,節點數、深度;
branching driving factor
聚類比較
pseudotime比較
技術細節:
特徵選擇
drop out處理
outlier處理
拓展:
大規模測序應用,減小算法複雜度;
留好各類接口,便於個性化分析;
方便使用,提升引用率;
敏感性和特異性的平衡;