在Kaggle手寫數字數據集上使用Spark MLlib的RandomForest進行手寫數字識別

昨天我使用Spark MLlib的樸素貝葉斯進行手寫數字識別,準確率在0.83左右,今天使用了RandomForest來訓練模型,並進行了參數調優。web 首先來講說RandomForest 訓練分類器時使用到的一些參數:dom numTrees:隨機森林中樹的數目。增大這個數值能夠減少預測的方差,提升預測試驗的準確性,訓練時間會線性地隨之增加。 maxDepth:隨機森林中每棵樹的深度。增長這個
相關文章
相關標籤/搜索