Google機器學習課程筆記(2)

training and test sets   降低過擬合的發生:分成三個子集   驗證集評估訓練集的效果,通過後再使用測試集評估檢查   特徵工程:原始數據---》特徵矢量   縮放特徵值(轉換爲標準範圍(0,1),(-1,1)) 處理極端離羣值: 取對數 最大值限制(僞影)   分箱:分成多個不同的布爾值特徵   特徵組合: 組合獨熱矢量 線性學習器可以很好地擴展到大量數據。對大規模數據集使
相關文章
相關標籤/搜索