pyspark入門---機器學習實戰預測嬰兒出生率(一)使用MLlib庫

機器學習實戰預測嬰兒出生率 1.加載數據 2.數據的探索:特徵相關性 3.統計校驗 4.建立最後的待訓練數據集 5.劃分訓練集和測試集 6.開始建模 7.Logistic 迴歸模型 8.選取出最具表明性的分類特徵 9.隨機森林模型 機器學習是經過 算法對訓練數據構建出 模型並對模型進行 評估,評估的性能若是達到要求就拿這個模型來測試其餘的數據,若是達不到要求就要 調整算法來從新創建模型,再次進行評
相關文章
相關標籤/搜索