在Kaggle手寫數字數據集上使用Spark MLlib的RandomForest進行手寫數字識別

時間 2019-12-05

標籤 kaggle 手寫數字數據集上使用 spark mllib randomforest 進行識別欄目 Spark 简体版

原文原文鏈接

昨天我使用Spark MLlib的樸素貝葉斯進行手寫數字識別，準確率在0.83左右，今天使用了RandomForest來訓練模型，並進行了參數調優。web 首先來講說RandomForest 訓練分類器時使用到的一些參數：dom numTrees：隨機森林中樹的數目。增大這個數值能夠減少預測的方差，提升預測試驗的準確性，訓練時間會線性地隨之增加。 maxDepth：隨機森林中每棵樹的深度。增長這個

>>阅读原文<<