LightGBM 挖掘 SNP 的注意事項

1. 決策樹難以挖掘到有意義的稀有突變 每次節點所選擇的特徵是對整體影響最大的特徵,而越靠近樹根時,集合內樣本數量越大,越混亂,越難分離出異常值,進而也就越難選擇對錶型有顯著影響的稀有突變。 而當節點越靠近葉片時,集合內樣本數量越少,在羣體中 MAF 越高的 SNP 越有可能在子集中有兩種基因型,從而對子集有區分能力。對於在羣體中 MAF 低的 SNP 在樣本數量越少的子集中越可能只有一種基因型,
相關文章
相關標籤/搜索