Machine Learning With Spark學習筆記（在10萬電影數據上訓練、使用推薦模型）

時間 2019-12-13

標籤 machine learning spark 學習筆記數據訓練使用推薦模型欄目 Spark 简体版

原文原文鏈接

咱們如今開始訓練模型，還輸入參數以下： rank：ALS中因子的個數，一般來講越大越好，可是對內存佔用率有直接影響，一般rank在10到200之間。 iterations：迭代次數，每次迭代都會減小ALS的重構偏差。在幾回迭代以後，ALS模型都會收斂獲得一個不錯的結果，因此大多狀況下不須要太多的迭代（一般是10次）。 lambda：模型的正則化參數，控制着避免過分擬合，值越大，越正則化。pytho

>>阅读原文<<