Machine Learning With Spark學習筆記(在10萬電影數據上訓練、使用推薦模型)

咱們如今開始訓練模型,還輸入參數以下: rank:ALS中因子的個數,一般來講越大越好,可是對內存佔用率有直接影響,一般rank在10到200之間。 iterations:迭代次數,每次迭代都會減小ALS的重構偏差。在幾回迭代以後,ALS模型都會收斂獲得一個不錯的結果,因此大多狀況下不須要太多的迭代(一般是10次)。 lambda:模型的正則化參數,控制着避免過分擬合,值越大,越正則化。pytho
相關文章
相關標籤/搜索