機器學習實戰之科比數據集分析(隨機森林尋最優值參數)

文章目錄 整體思路分爲三部 1.查看數據,對數據進行清洗,規約 1.1 查看數據 1.2 數據清洗,規約 1.3 刪除不相關的特徵 1.4 數據one-hot處理* 2.創建模型,挑選出最優參數 2.1 準備數據集,訓練集,測試集 2.2 創建隨機森林模型 2.3 經過樹的大小和K折驗證獲得log_loss最小的值和最優樹的數量 2.4 經過樹的深度和K折驗證獲得log_loss最小的值和最大深度
相關文章
相關標籤/搜索