海量數據的特徵工程中,sso
若是數據特徵維度達到幾千乃至上萬方法
常規的lasso很容易失效統計
這裏介紹幾種泛義lasso,是在實際數據處理中經常使用的數據
迭代與分塊思路/分組的使用(有興趣的同窗可自行實踐一下)數據處理
1. 迭代lasso
2. 分組/聚類lasso
3. 分組與降維結合lasso
另外在<<高維數據統計方法、理論與應用>> 一書中介紹了不少lasso方法,其中有廣義group lasso的方法也很值得借鑑