準備系統性地整理一下數據挖掘&機器學習常見方法,溫故而知新,less is more。算法
先列一下初步目錄:(每一個冒號後面是主要的focus)網絡
1 關聯規則挖掘:Apriori 算法& FP-treeless
2 貝葉斯方法:樸素貝葉斯&貝葉斯網絡機器學習
3 組合提高:Boosting&Adaboost,隨機森林學習
4 決策樹系列:ID3,C4.5 &MART(又叫GBDT(Gradient Boosting Decision Tree) )ci
5 主題模型:LDA&PLSA數據挖掘
6 聚類算法,包括混合高斯模型io
7 迴歸分析,包括logistic,regularlization神經網絡
8 EM方法
9 SVM
10 異常檢測
11 KNN&推薦系統
12 隨機模擬及抽樣:MCMC
13 Deep learning 一些專題,包括特徵提取,降維及神經網絡
14 時間序列
15 海量數據處理方法
16 待補充
進度安排:
一週一至二篇,加油!