機器學習、數據挖掘-推薦系統問題總結

參考各種資料總結一下,準備面試。更新中~ 1、過擬合與欠擬合 過擬合:在訓練數據集上表現較好,在測試集上表現較差。 可能的原因: 參數太多,模型複雜度高。 樣本噪聲數據較大,模型學到了噪聲數據的特徵。 對於決策樹模型,對於決策樹的生長沒有進行合理的限制和修剪。 對於神經網絡,迭代次數太多(overtraining),擬合數據中的噪聲和無代表性的特徵。 解決方法: 降低模型複雜度,使用簡單的模型 增
相關文章
相關標籤/搜索